论文题目:Supervised Anomaly Detection for Complex Industrial Images
作者:Aimira Baitieva, David Hurych等
作者机构:valeo, valeo.ai
论文链接:https://arxiv.org/pdf/2405.04953
代码链接:https://github.com/abc-125/segad
2. 摘要
在工业生产线中自动化视觉检测对于提高各行业产品质量至关重要。异常检测(AD)方法是实现这一目的的强大工具。然而,现有的公开数据集主要由没有异常的图像组成,限制了AD方法在生产环境中的实际应用。为了解决这一挑战,我们提出了(1)瓦莱奥异常数据集(VAD),这是一个包含5000张图像的新颖真实世界工业数据集,其中包括2000个具有挑战性的真实缺陷实例,涵盖了20多个子类。鉴于传统AD方法在处理这个数据集时存在困难,我们引入了(2)基于分割的异常检测器(SegAD)。首先,SegAD利用异常图和分割图来计算局部统计量。接下来,SegAD将这些统计量和一个可选的监督分类器分数作为Boosted Random Forest(BRF)分类器的输入特征,得出最终的异常分数。我们的SegAD在VAD(+2.1% AUROC)和VisA数据集(+0.4% AUROC)上均取得了最先进的性能。代码和模型均已公开。
输入图像处理:SegAD接收图像作为输入,假设图像为W×H像素大小,具有3个颜色通道。异常检测器:使用一种或多种异常检测器来生成像素级别的异常图。这些异常检测器可以是任何能够生成异常分数的模型,例如PatchCore、FastFlow、RD4AD或EfficientAD。图像分割:定义一组互斥的图像段,每个图像段sl是一个W×H的二维矩阵,表示图像中的一个区域。异常检测器生成的异常图根据这些图像段进行分割,以便提取每个段内的异常信息。统计信息提取:对每个异常图的每个图像段计算一些统计信息,例如99.5%分位数、偏度、峰度和平均值。这些统计信息用于描述图像段中异常的程度和类型。特征向量生成:将每个图像的统计信息组合成一个特征向量f。这个特征向量的长度为K * L * 4 + 1,其中K是异常检测器的数量,L是图像段的数量。BRF分类器:使用Boosted Random Forest (BRF)分类器来对特征向量进行训练和推理,从而生成最终的异常检测结果。BRF分类器能够利用异常图的统计信息和可选的监督分类器分数来提高异常检测的准确性。