一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo
来源:机器之心开源大模型领域,又迎来一位强有力的竞争者。近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。项目地址:https://github.com/deepseek-ai/
人工智能与算法学习
0
万字长文总结大模型微调技能图谱
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能,并
人工智能与算法学习
0
全面解析LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention、增量学习等大模型算法
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据处理、开源模型的理解等,几乎每天都有新的发展。作为算...
人工智能与算法学习
0
LeCun怒斥Sora是世界模型,自回归LLM太简化了
来源:机器之心 LeCun 对「世界模型」给出了最新定义。 最近几天,Sora 成为了全世界关注的焦点。与之相关的一切,都被放大到极致。 Sora 如此出圈,不仅在于它能输出高质量的视频,更在于 OpenAI 将其定义为一个「...
人工智能与算法学习
0
谷歌正式推出开源大语言模型 Gemma,声称超越 Meta Llama-2 竞品,...
作者:张俊林@知乎 关于Google开源Gemma的一些零散的看法: -Google Gemma代表谷歌被迫再次切入开源领域,谷歌重返开源赛场,这是个大好事,但很明显是被迫的。去年Google貌似已经下定决心要闭源了,这可能源于低估...
人工智能与算法学习
0
阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
克雷西 发自 凹非寺来源 | 量子位 QbitAI 会操纵手机的智能体,又迎来了全新升级! 新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。 比如根据指示,它可以自行搜索篮球比赛的结果,然后根据...
人工智能与算法学习
0
CVPR 2024审稿结果出炉!总数近2万篇,网友吐槽审稿人又是本科生
来源:新智元 【导读】一年一度的CVPR 2024审稿结果公布了!收到审稿结果的小伙伴们,已经开始下一步rebuttal了,截止日期到1月30日。 CVPR 2024审稿结果出来了。 收到review的小伙伴们,可以正式开启rebuttal,提交...
人工智能与算法学习
0