Ai4Industury!工源三仟相关研究成果被计算机视觉国际顶会CVPR 2024录用

极市平台

共 3570字,需浏览 8分钟

 · 2024-04-18

↑ 点击蓝字 关注极市平台
者丨工源三仟
来源丨工源三仟
编辑丨极市平台

极市导读

 

随着动力电池技术的发展,新能源汽车越来越受到人们的关注。动力电池是纯电动汽车驱动能量的唯一来源,其质量安全直接影响着纯电汽车的动力性能、续航能力和安全性。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

工源三仟AI Lab联合大连理工大学IIAU-Lab将这一实际产业问题,从幕后推向学术前台,提出了业内首个动力电池检测(PBD)benchmark,携手推进Ai4Industury的发展。

论文地址:https://arxiv.org/pdf/2312.02528v2.pdf

项目主页:https://xiaoqi-zhao-dlut.github.io/xray_pbd_cvpr2024/Github

仓库:https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD

01 研究价值(应用)

图中展示了新能源汽车动力电池组装工艺。动力电池经历了从电芯单元到搭载整车系统的全过程。为保证动力电池的安全,需要对每个电芯进行动力电池检测(PBD),完成其功能性评估。

02 任务定义

动力电池检测(PBD)旨在根据极片数量和悬垂量来判断电芯的OK/NG。因此,目标计数和定位是PBD的必要处理,它可以为所有阳极和阴极端点提供准确的坐标信息。

03 研究价值、挑战(学术)

  1. 开放的视觉建模问题。与character stroke extraction、insubstantial object detection、open vocabulary objects detection and segmentation等新兴任务一样,如何将实际问题建模为视觉领域的学术问题,从而给出基于AI的解决方案,是对于 PBD 任务来说最为重要的。

  2. 极小目标定位问题。通常一幅X-ray/CT的锂电池图像具有1024 x 1024以上的分辨率,甚至超过4K级别的多电池组图。极片端点的定位需要网络模型从百万pixel中找寻实例级的1 pixel感兴趣目标(1/X,000,000+)。

  3. 弱小特征感知问题。由于机器设备固有的噪声干扰、X-ray无法与彩色RGB一样具有语义线索、极片外观多样性等复杂因素的叠加,进一步加剧了单像素点的极片感知难度。

04 数据集介绍

X-ray PBD 数据集的统计。(a) 干扰和拍摄的分类。(b) 悬垂分布。(c) 数量分布。(d) 属性的数据分布。(e) 属性之间的多重依赖性。

本文所提出的X-ray PBD数据集是从同一产品型号的DR设备捕获的5个制造商的数千个动力电池单元中收集的,涵盖近景、中景和远景。根据外观和干扰类型分为2类,8个属性。本文首先将最初收集的4000多张X射线电池图像交给六位专业电池厂技术人员进行质量筛选。通过仔细观察,重复、空白和严重缺陷(即无效)图像被消除,获得了约 2,000 张电池图像。然后,六名技术人员使用标注软件分别对 2000 张图像进行注释。注释信息包括所有阳极板和阴极板的终点坐标以及板的数量。为了避免人为判断错误,六名技术人员共同评估所有六组标记数据,并选择标记信息一致的示例。最终,获得了1500张高质量的动力电池图像。

属性样本实例。存在来源于图像质量、外部设备、极片外观的多种干扰。

05 解决方案(MDCNet)

  1. 分割问题建模。将点定位问题转化为Segmentation 问题。

  2. 多维协同思想。通过点、线、数量三个维度上的线索,基于multi-task l协同互补学习,增强point的预测效果。

  3. 提示滤波器。基于prompt learning的思想,依靠无干扰的纯净极片作为提示信息,生成动态滤波器以过滤背景干扰信息。

  4. 自适应监督真值生成策略。依靠极片之间的间距,自适应的生成大小合适的point mask供MDCNet网络训练。

业内首个综合性评估指标

在新能源产业界往往只关注于粗糙的漏检率和误报率。从学术严谨性,本文提出了从数量、阴阳极、overhang的位置误差(MAE)和准确性(Acc)的8个综合性互补指标。积极地行业内推行!

与其他潜在的解决方案比较

从定性和定量评估,本文提出的解决方案都遥遥领先!

06 未来工作&即将发布

  1. How to better model PBD is still an open problem. (在difficult/tough场景仍有提升空间)

  2. Semi/self-supervised and few-shot learning techniques.

  3. Extend the PBD dataset to a 3D form with the help of CT device, which can provide richer internal slices information.

Ai4Industury-Image Blind Enhancement.
Ai4Industury-CT Reconstruction.
Ai4Industury-Multimodal Unified Model.
Ai4Industury-GPT.

总结

2024 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2024)将于2024年6月17日至21日在美国西雅图举行。CVPR是计算机视觉领域的顶级国际会议,CCF A类会议。本文研究成果在近几年中已成功应用并交付于众多的新能源锂电池头部产商,本次被CVPR录用,标志着工源三仟在动力电池检测技术方面的行业绝对领先地位!

公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列ICCV2023论文解读极市直播
极视角动态欢迎高校师生申报极视角2023年教育部产学合作协同育人项目新视野+智慧脑,「无人机+AI」成为道路智能巡检好帮手!
技术综述:四万字详解Neural ODE:用神经网络去刻画非离散的状态变化transformer的细节到底是怎么样的?Transformer 连环18问!

点击阅读原文进入CV社区

收获更多技术干货


浏览 123
10点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
10点赞
评论
收藏
分享

手机扫一扫分享

举报