10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源
共 6738字,需浏览 14分钟
·
2024-08-16 12:42
新智元报道
新智元报道
【新智元导读】发布40天后,最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta,而是一个专注于开放模型的神秘初创Nous Research。
自从开始人工智能之旅以来,我就想实现一个开源前沿模型。
今天,凭借 Hermes 3 405B,我们实现了这一目标。这是一款具有前沿水平的模型型号,真正适合用户,而非某个公司或更高的权威。
凭借在数据合成和后训练研究方面的辛勤工作,我们才能用将近1年的时间构建一个几乎完全来自合成的数据集,并用于训练Hermes 3。未来我们还将有更多发布。
论文地址:https://nousresearch.com/wp-content/uploads/2024/08/Hermes-3-Technical-Report.pdf
模型概述
出色的对话表现
经我细数,「草莓」词中有三重字母「r」栖息在此
绝佳智能体
别问「我是谁」,模型立即失忆
训练配方
数据集混合
监督微调
DPO
评估
Nous Research
我们挑战封闭技术将永远占据创新顶峰的假设,相反,我们提供强大的开源代码。
评论
