贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
极市平台
共 4921字,需浏览 10分钟
· 2024-04-15
极市导读
贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
Demo地址: http://103.170.5.190:7860/
图片理解天花板
推理再生成,更精准了
超会玩梗
技术细节
如上演示中,Mini-Gemini是怎样做到这种惊艳的效果呢?
而其中的核心在于三点:
(1)用于高清图像的双编码器机制;
(2)更高质量的数据;
媲美Gemini Pro和GPT-4V
人人在线可玩
公众号后台回复“数据集”获取100+深度学习各方向资源整理
极市干货
点击阅读原文进入CV社区
收获更多技术干货
评论
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
来源:新智元【导读】贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。刷爆多模态任务榜单,超强视觉语言模型Mini-Gemini来了!效果堪称是开源社区版的GPT-4+DALL-E
AI算法与图像处理
10