最新大模型论文合集!
清华团队推出 MiniCPM:利用可扩展的训练策略挖掘小模型潜力;苹果MM1大模型:30B参数,多模态,在预训练指标上达到SOTA;亚马逊提出大规模视频语言对齐方法VidLA;英伟达参与,高效视频扩散模型CMD发布;谷歌、Stability AI新研究:由文本引导生成纹理3D服装;港大、阿里新研究:
机器学习实验室
10
动手做一个最小Agent——TinyAgent!
作者:宋志学 转自:Datawhale前 言大家好,我是不要葱姜蒜。在ChatGPT横空出世,夺走Bert的桂冠之后,大模型愈发地火热,国内各种模型层出不穷,史称“百模大战”。大模型的能力是毋庸置疑的,但大模型在一些实时的问题上,或是某些专有领域的问题上,可能会显得有些力不从心。因此,我们需要一些工
机器学习实验室
1028
炸裂!最新CVPR2024、ACL2024、AAAI2024、ICML2023论文+Code大合集!
花了3个月的时间整理了包括CVPR 2023/2024、ECCV 2023、ICML 2023、ICLR 2024/2023、NeurIPS 2023、ACL 2024、EMNLP 2023、AAAI 2024/2023、WWW 2023/2024等顶会在内的超过20000篇人工智能优质论文,今天一
机器学习实验室
10
扩散模型:DDPM的两种数学推导
在上一篇文章最后结尾时,笔者提到扩散模型(Diffusion Models)实际上就是一种在限定条件下的马尔可夫层次变分自编码器(Markovian Hierarchical Variational Autoencoder, MHVAE),是融入了马尔可夫过程的VAE模型。其本质上和VAE的流程有相
机器学习实验室
10
从零开始编写LoRA代码,这里有一份教程
Lora 转自:机器之心 作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。 LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW...
机器学习实验室
0
Datawhale蝴蝶书重磅出版!
文末赠书 喜欢AI,对ChatGPT超级好奇,但被市面上爆增的大模型书籍和教学视频弄得眼花缭乱?没事!Datawhale团队最新推出的“蝴蝶书”——《ChatGPT原理与应用开发》来啦! 这本书源自Datawhale开源项目HuggingLLM,GitH...
机器学习实验室
0
像监管核武器一样监管AI,OpenAI高层集体撰文探讨「超级智能」监管!
OpenAI 转自:机器之心 AI 领域也需要一个类似「国际原子能机构」的组织? 前段时间,一向衣着休闲的 OpenAI 首席执行官 Sam Altman 以西装革履的形式出现在了公众面前,出席一个主题为「AI 监管:人工智能规则(Ove...
机器学习实验室
0
ChatGLM-6B 本地部署指南!
Datawhale干货 作者:宋志学,Datawhale成员 注意事项-写在最前 显卡需要至少6GB的显存 使用GPU部署模型需要自行安装torch和与自己显卡匹配的CUDA、cudnn 下载ChatGLM-6B 在GitHub上下载chatglm-6b的源码,地址如...
机器学习实验室
0
70多种插件加持,联网版ChatGPT评测来了!
ChatGPT Plugin 转自:机器之心 说不上无所不能,但也可以说是上天入地。 自 ChatGPT 推出以来,大语言模型充斥着新闻版面。很多公司都在试图追赶 OpenAI,但作为先行者,ChatGPT 显得一骑绝尘。 上周六,OpenAI C...
机器学习实验室
0
70页「自监督学习」大全来了!
自监督学习 转自:机器之心 「如果你想研究自监督学习,那最好看看这本书。」 「关于自监督学习,你想知道但又不敢问的一切都在这里了。」图灵奖得主、Meta 人工智能首席科学家 Yann LeCun 刚刚发了这样一则推文。...
机器学习实验室
0
书单 | 深扒ChatGPT核心技术,在AI浪潮中狂飙!
有位朋友说,程序员的工作就是消灭自己的职业。 这么说或许是有些危险耸听了,不过随着近期ChatGPT的爆火,可以预见未来的程序员可能的确需要有更强的研究开发能力才能有更强的竞争力! 面对ChatGPT带来的冲击,了解...
机器学习实验室
0
知识图谱到底有多强?
知识图谱是由Google在2012年提出来的一个新的概念,它是指以结构化的形式描述客观世界中概念、实体及其关系。 从一开始的Google搜索,到现在的聊天机器人、大数据风控、智能医疗、推荐系统,无一不跟知识图谱相关。...
机器学习实验室
0
发一篇深度学习论文,到底有多难?
学术论文到底怎么写才能发表?此篇内容手把手教大家如何快速写好科研论文并顺利发表。 内容针对的是论文的写作要求,需要毕业论文的朋友也可以参考写作方法, 内容包括了:从如何调研确定topic,如何多快好省做实验...
机器学习实验室
0
单卡RTX 2080Ti 搞定大模型训练!
大模型训练 转自:机器之心 任何 transformer 变体、任何数据集都通用。 在一块消费级 GPU 上只用一天时间训练,可以得到什么样的 BERT 模型? 最近一段时间,语言模型再次带火了 AI 领域。预训练语言模型的无监督...
机器学习实验室
0