互联网资讯 · 2024年7月4日 0

CVPR 2024:中科视语领跑工业大模型,工业混合专家模型再夺桂冠

近日,在全球权威的CVPR 2024视觉异常检测和创新性检测挑战赛中,中科视语AI团队提交的“少量样本异常检测使用专家混合模型”以0.818的出色成绩,从全球17个国家和地区,百余支顶尖AI团队中脱颖而出,摘下桂冠。这再次展现了中科视语在工业大模型领域的雄厚实力。

随着大模型技术的发展,技术先进性和性能卓越性的要求更加苛刻,中科视语持续坚定、专注投入大模型研发,深入磨炼“内功”,建立技术壁垒,夯实技术优势,正是凭借中科视语深厚的技术积淀和长期积累的市场经验,视语坤川工业大模型核心技术连续多次取得国际领先的成果。本次获奖,是继登顶2019 VideoNet视频内容识别挑战赛、2022道路损坏检测世界竞赛桂冠后的又一里程碑,这标志着中科视语在少样本逻辑/结构异常检测技术上取得了新的突破。也正是凭借持续的技术革新,中科视语在工业大模型领域积累了显著的竞争优势。

2024计算机视觉领域的顶级学术会议CVPR,是由IEEE计算机协会和计算机视觉基金会(computer Vision foundation,CVF)共同主办,是一年一度的全球计算机视觉领域与模式识别领域最顶尖的学术会议。其与ECCV(EuRopean ConfeRence on computer Vision)、ICCV(IEEE/CVF InteRnational ConfeRence on computer Vision)一起并称为计算机视觉领域的三大最高级别的顶级会议。

从飞机火车到螺丝螺母,工业产品在我们的生活中无处不在。为了保证这些产品能够正常发挥其功能,避免安全事故,在生产过程中进行异常检测是极为必要的。近年来,随着计算机视觉技术的飞速发展,基于深度学习的工业异常检测方法层出不穷,成为学术和工业界的研究热点。因此,CVPR会议连续两年举办VAND挑战赛,鼓励研究者进一步探索工业异常检测的有效方法。

本次VAND比赛分为两个赛道:

1.Adapt & Detect: RobUSt AnoMaly Detection in Real-WoRld applications

2. VLM AnoMaly Challenge: Few-Shot learning foR Logical and StRUCtuRal Detection

研究团队参加的是第二个赛道,重点研究基于多模态模型的少样本逻辑和结构异常检测方法。比赛使用的数据集将常见的异常分为结构异常和逻辑异常两类。结构异常指的是诸如破损、划痕这种在正常样本上不会出现的异常情况;逻辑异常则指正常物品的错误组合。例如,每个塑料袋中应该包含一长一短两个螺丝钉、两个螺母、两个垫片。然而,在逻辑异常样本中,可能包含三个螺母,这类异常难以通过简单比对来判断,需要使用新的异常检测方式。

此外,赛道二在少样本设置下进行异常检测,即要求模型在训练期间从未见过来自测试数据集中的任何正常样本,只在推理期间提供少量正常样本以供参考,这要求方法具有较高的迁移能力。

为了高效检测出不同类别的异常,研究团队提出了混合专家模型AnoMalyMoE,充分发挥不同类型的异常检测方法的优势,使用 4 个不同的异常检测专家模型:图文异常检测专家模型,全局异常检测专家模型,子部分异常检测专家模型,图像块异常检测专家模型,并结合这四个专家模型的打分结果以得到最后的异常分数。