视觉prompt工程!无需微调、无需任何模型修改,让一个通用模型可以执行多种指定任务
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 如何在没有特定任务微调或任何模型修改的情况下将预训练好的视觉模型适应新的下游任务? >>加入极市CV技术交流群,走在计算机视觉的最前沿本文目录1 通过图像修复任务完成视觉提示 (来自 UCB)1
极市平台
4009
3D高斯场景补全新玩法!InFusion:扩散模型助力,效率提高20倍!
↑ 点击蓝字 关注极市平台编辑丨极市平台极市导读 本文提出的方法InFusion,为3D高斯场景提供了高质量且高效的补全能力。此外,作者证明了结合扩散先验能够显著增强深度图像修复模型。这个改进的深度补全模型对于各种3D应用,特别是在新视角合成领域有着很大的应用前景。 &
极市平台
1170
专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法
↑ 点击蓝字 关注极市平台作者丨新智元来源丨新智元编辑丨极市平台极市导读 针对大模型偶发脑回路故障难题,最新研究GlitchHunter收集了大量故障词元,并针对不同情况进行分类,极大改善了大模型的输出质量。 >>加入极市CV技术交流群,走在计算机视觉的最前
极市平台
579
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
↑ 点击蓝字 关注极市平台作者丨新智元来源丨新智元极市导读 蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待已久的Llama 3,用了24000块GPU训练,一亮相便登上开源大模型铁王座。8B和70B取得同规模参数下开源领域的SOTA,推理编码大幅提升,代码和权重全开源!而且,40
极市平台
297
YOLO+CenterNet=小目标检测性能起飞!YOLC:简单高效的Anchor Free 目标检测框架
↑ 点击蓝字 关注极市平台作者丨集智书童来源丨集智书童编辑丨极市平台极市导读 作者提出了一种新颖且高效的 Anchor-Free 目标检测框架YOLC,在两个航拍图像数据集上取得了最先进的表现。与许多现有方法相比,它简单优雅,仅包含一个网络,参数更少,效率更高。>>加
极市平台
4965
CVPR 2024|OmniParser:统一图文解析模型:文字检测识别、视觉信息抽取和表格识别
↑ 点击蓝字 关注极市平台作者丨万建强来源丨CSIG文档图像分析与识别专委会编辑丨极市平台极市导读 本文提出了一种面向文字图像的统一解析框架,将OCR多个核心任务进行了形式上的统一,同时展现出对于其他OCR任务如层次化文字检测的泛化能力,对于开发OCR领域的统一大模型又近了一步。
极市平台
1404
2024 QS排名发布!计算机MIT霸榜,清华11,北大15
↑ 点击蓝字 关注极市平台作者丨新智元来源丨新智元极市导读 2024 QS世界大学学科排名出炉了!在计算机科学专业排名中,MIT、卡内基梅隆大学、斯坦福大学占领了世界前三席,中国大陆有8所高校进入百强,清华大学排名最高,并列第11。 >>加入极市CV技术交流
极市平台
735
Ai4Industury!工源三仟相关研究成果被计算机视觉国际顶会CVPR 2024录用
↑ 点击蓝字 关注极市平台作者丨工源三仟来源丨工源三仟编辑丨极市平台极市导读 随着动力电池技术的发展,新能源汽车越来越受到人们的关注。动力电池是纯电动汽车驱动能量的唯一来源,其质量安全直接影响着纯电汽车的动力性能、续航能力和安全性。 >>加入极市CV技术交流
极市平台
596
GPT的风也吹到了CV,详解自回归视觉模型的先驱! ImageGPT:使用图像序列训练图像 GPT模型
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 在 CIFAR-10 上,iGPT 使用 linear probing 实现了 96.3% 的精度,优于有监督的 Wide ResNet,并通过完全微调实现了 99.0% 的精度,匹配顶级监督预训练模型。>&g
极市平台
5803
极市打榜|【手持式浓度探测仪识别、防护手套识别、专用防护面罩识别、扩散式气体检测仪三脚架识别、过堤涵洞排气管喷水识别】数据集上线
↑ 点击蓝字 关注极市平台极市打榜极市打榜是极市平台于2021年推出的算法项目合作模式,至今已上线300+产业端落地算法项目,已对接智慧城市、智慧工地、明厨亮灶等多个行业真实需求,算法方向涵盖目标检测、行为识别、图像分割、视频理解、目标跟踪、OCR等。开发者报名极市打榜,可用平台上已标注真
极市平台
503
革命新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2
↑ 点击蓝字 关注极市平台作者丨新智元来源丨新智元极市导读 Transformer王座即将被取而代之!Meta、USC、CMU和UCSD联合提出了革命性新架构Megalodon,能够处理无限上下文,在2万亿token训练任务中,性能超越Llama2-7B实现了非凡的效率。&nbs
极市平台
577
顶刊TPAMI 2024!北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法
↑ 点击蓝字 关注极市平台作者丨机器之心来源丨机器之心编辑丨极市平台极市导读 文章提出了一个利用一阶优化算法设计具有万有逼近性质保障的神经网络架构的统一框架,拓展了基于优化设计网络架构范式的方法。该方法可以与现有大部分聚焦网络模块的架构设计方法相结合,可以在几乎不增加计算量的情况
极市平台
1807
极市直播预告|CVPR2024 Highlight:无参数无训练的网络也能进行3D表征学习吗?
↑ 点击蓝字 关注极市平台|极市线上分享第129期 |一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了128 期极市线上直播分享。往期分享请前往bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位小伙伴自
极市平台
0
Any2Point:首个多模态3D统一大范式,只需1%的参数量即可超越现有SOTA!
↑ 点击蓝字 关注极市平台编辑丨极市平台极市导读 首次提出了3D-多模态大一统范式,将任意模态的预训练大模型,无缝适用到3D领域,并且取得了SOTA的结果! >>加入极市CV技术交流群,走在计算机视觉的最前沿论文标题: Any2Point: Empoweri
极市平台
813
CVPR’24|中大哈佛等提出creative Leap-of-thought探究大模型幽默创新力
↑ 点击蓝字 关注极市平台编辑丨极市平台极市导读 多模态大模型具备创造的潜力吗?能力如何?本文从大模型创造力测评与增强等方面进行了探索,从幽默创新响应的角度,揭示了大模型在创新任务上的潜力和不足。目前该成果被计算机视觉顶级会议CVPR 2024录用。 >>加
极市平台
566
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍
↑ 点击蓝字 关注极市平台作者丨机器之心来源丨机器之心极市导读 今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。 >>加入极市CV技术交流群,走在计算机视觉的最前沿如何复盘大模型技术爆发的这
极市平台
372
图解大模型计算加速系列:vLLM源码解析2,调度器策略(Scheduler)
↑ 点击蓝字 关注极市平台作者丨猛猿来源丨大猿搬砖简记编辑丨极市平台极市导读 在本文中,作者从vLLM批处理的入口函数开始,介绍了其推理内核LLMEngine的两个重要函数add_request()和step()。当LLMEngine开始执行1次调度时(step),调度器策略(S
极市平台
301
杭州/深圳/北京/海外远程|行动湃科技招募AI算法工程师&产品合伙人
↑ 点击蓝字 关注极市平台公众号后台回复“数据集”获取100+深度学习各方向资源整理极市干货技术专栏:多模态大模型超详细解读专栏|搞懂Tranformer系列|ICCV2023论文解读|极市直播极视角动态:欢迎高校师生申报极视角2023年教育部产学合作协同育人项目|新视野+智慧脑,「无人机
极市平台
455
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
↑ 点击蓝字 关注极市平台作者丨新智元来源丨新智元极市导读 贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。 >>加入极市CV
极市平台
393
精度最高降幅60%!SOTA只是假象?CVPR2024 Highlight为你揭示CLIP和LLaVA-Next等模型“骗局”
↑ 点击蓝字 关注极市平台作者丨派派星来源丨CVHub编辑丨极市平台极市导读 这篇论文提出了利用diffusion model作为data source来测评模型鲁棒性。提出的ImageNet-D数据集有效地降低state-of-art模型的测试准确率,降低幅度最高达60%,其中
极市平台
6248
CVPR 2024 | 全新指代分割数据集!国科大提出UniRES:统一的对象级和部分级定位新方法
↑ 点击蓝字 关注极市平台作者丨小源来源丨CVer编辑丨极市平台极市导读 在本文中,作者进一步迈向更精细的部分级RES任务。作者提出了一个新的多粒度指代表达分割(MRES)任务,通过手动注释构建了一个名为RefCOCOm的评估基准。作者利用自动模型辅助数据引擎,构建了最大的视觉定
极市平台
1378
一文带你了解LLAMA(羊驼)系列
↑ 点击蓝字 关注极市平台作者丨曼城周杰伦来源丨深蓝AI编辑丨极市平台极市导读 本文会重点介绍LLAMA系列的改进点,希望大家通过这一篇文章,能快速地了解LLAMA系列的改进工作。 >>加入极市CV技术交流群,走在计算机视觉的最前沿前言:自从OpenAI推出
极市平台
1147
世界首个AI程序员Devin视频竟造假?博主逐帧解析,Devin代码任务完成很糟糕
↑ 点击蓝字 关注极市平台来源丨新智元极市导读 全球首个AI程序员Devin被爆视频造假?YouTube博主近日揭露了背后明星初创公司Cognition的谎言,通过逐帧分析发现,Devin并不能独立完成Upwork工作。>>加入极市CV技术交流群,走在计算机视觉的最前
极市平台
208
大模型微调项目 / 数据集调研汇总
↑ 点击蓝字 关注极市平台作者丨周星星@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/624079704编辑丨极市平台极市导读 总结了一些热门的大模微调项目的亮点以及数据集。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
极市平台
573
Score-based SDE 生成模型从入门到出师系列(一):用随机微分方程建模图像生成任务并统一分数和扩散模型
↑ 点击蓝字 关注极市平台作者丨CW不要無聊的風格编辑丨极市平台极市导读 超详细解读如何使用随机微分方程(SDE)框架来统一分数模型和扩散模型(DDPM)进行生成建模。 >>加入极市CV技术交流群,走在计算机视觉的最前沿一上来先吹水久违的这篇文章终于来了!本
极市平台
1744
SCNet:利用全1X1卷积实现轻量图像超分辨率
↑ 点击 蓝字 关注极市平台 作者丨CSJJJ@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/687798736 编辑丨极市平台 极市导读 1×1卷积可以用来干什么?本文设计了一种完全基于1×1卷积的极简深度神经网络,实现...
极市平台
0
DECO: 卷积结构的反击,纯卷积Query-Based检测器超越DETR
↑ 点击 蓝字 关注极市平台 作者 丨派派星 来源丨CVHub 编辑丨极市平台 极市导读 本文旨在研究是否能够构建一种基于查询的端到端目标检测框架,而不采用复杂的Transformer架构。提出了一种名为Detection ConvNet(D...
极市平台
0