Block-wise LoRA | 直接对Stable Diffusion中UNet的细粒度特征微调
点击下方卡片,关注「AI视界引擎」公众号文本到图像个性化与风格化的目标是指引预训练的扩散模型分析用户引入的新概念,并将它们融入到期望的风格中。近来,参数高效微调(PEFT)方法被广泛采用以应对这一任务,并极...
AI人工智能初学者
0
D-YOLO解决落地困难 | 关注特征融合模块+无雾特征子网络,让YOLO家族无惧雨雾和风雪
点击下方卡片,关注「集智书童」公众号点击加入?「集智书童」交流群不利天气条件,包括霾、雪和雨,导致图像质量下降,这通常会导致基于深度学习的检测网络性能下降。大多数现有方法尝试在执行目标检测之前对雾蒙蒙...
AI人工智能初学者
0
南大提出VM-UNet v2 | 在VM-UNet基础上细节&上下文信息都不放过,更小更快性能更强
点击下方卡片,关注「AI视界引擎」公众号在医学图像分割领域,基于CNN和Transformer的模型已经得到了深入研究。然而,CNN在建模长距离依赖方面存在局限性,这使得充分利用图像内的语义信息变得具有挑战性。另一方面...
AI人工智能初学者
0
200+自动驾驶最新论文代码,超全分类汇总
2024年开始,将是高阶自动驾驶关键节点。大模型、端到端、OCC这些技术正逐步走向量产。今天就为大家盘点200+篇自动驾驶论文与代码,来自ICCV、NeurIPS等顶会,涉及大模型自动驾驶、端到端、BEV感知、检测、OCC等10余...
AI人工智能初学者
0
商汤&悉尼大学提出LocalMamba | 局部扫描机制让Mamba保留全局视角同时捕获局部信息
点击下方卡片,关注「AI视界引擎」公众号近期在状态空间模型方面,尤其是Mamba的研究,已经在诸如语言理解等任务中对长序列建模方面取得了显著进展。然而,在视觉任务中的应用并没有明显超越传统的卷积神经网络(CNN...
AI人工智能初学者
0
YOLOX-ViT来啦|怎么才有效?YOLOX与Transformer用知识蒸馏交出完美答卷
点击下方卡片,关注「集智书童」公众号点击加入?「集智书童」交流群在本文中,作者提出了YOLOX-ViT这一新型目标检测模型,并研究了在不牺牲性能的情况下,知识蒸馏对模型尺寸减小的有效性。聚焦于水下机器人领域,作...
AI人工智能初学者
0
突破速度极限|Group-Mix SAM参数减少37%,FLOPs减少42%,笔记本也可以白嫖SAM啦
点击下方卡片,关注「AI视界引擎」公众号自从大约一年前出现Segment Anything Model(SAM)以来,它引起了学术界极大的兴趣,并从各种角度引发了大量的研究和工作发表。然而,由于SAM的大型图像编码器体积庞大,达到...
AI人工智能初学者
0
大模型 | Stable LM 2 1.6B 技术报告个人摘要
Stability.AI 二月底发的技术报告,干货蛮多的,随便记录一些我关注的信息。技术报告地址:https://arxiv.org/pdf/2402.17834.pdfPretraining 模型:1.6B数据量:2T全部来自于商业可用的开源数据集,以确保可复现性...
AI人工智能初学者
0
南开提出轻量级LSKNet网络 | 突破遥感图像分类挑战再创佳绩!
点击下方卡片,关注「AI视界引擎」公众号遥感图像因其固有的复杂性对下游任务提出了独特的挑战。虽然已有大量研究致力于遥感图像的分类、目标检测和语义分割,但其中大多数研究忽视了遥感场景中嵌入的宝贵先验知识。...
AI人工智能初学者
0
全新SOTA骨干网络HIRI-ViT | 大力出奇迹,高分辨率+双路径设计,让Backbone卖力生产精度
点击下方卡片,关注「集智书童」公众号点击加入?「集智书童」交流群视觉Transformer(ViT)与卷积神经网络(CNN)的混合深度模型已经成为视觉任务中的一类强大的基础架构。扩大这类混合基础架构的输入分辨率自然会增...
AI人工智能初学者
0
HCF-Net | 并行化注意力设计&维度感知选择实现自适应通道选择融合
点击下方卡片,关注「AI视界引擎」公众号红外小目标检测是计算机视觉中的一项重要任务,涉及在红外图像中对微小目标的识别和定位,这些目标通常只包含几个像素。然而,由于目标的大小微小以及红外图像中通常具有复杂...
AI人工智能初学者
0