CanTechLab

Can

异常检测

Long-Tailed Anomaly Detection with Learnable Class Names

异常检测(AD)在工业制造等领域非常重要,旨在识别有缺陷的图像及其缺陷位置。传统方法在多个图像类别上扩展性较差,并且需要手动定义类别名称,难以应对长尾数据分布。长尾数据分布是实际工业应用中常见的现象,其中部分类别数据样本显著少于其他类别。

Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly Detectors

异常事件通常是上下文依赖的,并且不经常发生,这使得收集足够代表性的异常事件样本以训练深度学习模型变得困难。 现有的异常点检测方法将异常检测作为离群值检测任务,在推理过程中对正常事件和异常事件分别应用一个经过正常事件训练的正态性模型,将偏离学习模型的事件标记为异常。 自动编码器(AE)模型对非分布数据的样本重建能力较差。由于训练只在正常的样本上进行,因此当出现异常时,预计AE会表现出很高的重建误差。 现有的SOTA方法依赖于昂贵的目标检测方法来提高精度,将处理带宽限制为每个GPU一个视频流,约为20-30 FPS,然而以对象为中心的视频异常探测器的处理成本太高。

EasyNet: An Easy Network for 3D Industrial Anomaly Detection

三维异常检测是工业制造领域(IM)一项重要的计算机视觉任务,现有的方法的问题主要体现在: 严重依赖于大型预训练模型(pretrained model),难以在生产线上部署。 由于内存库(memory bank)的过度使用而大大增加了存储开销。 由于性能问题而无法实现实时的推理。 在工业质量检测中产品的深度信息对于异常检测至关重要,但现有的异常检测方法多数基于2D图像的处理,对于一些工业产品来说,仅使用2D图像来进行异常区分是很困难的。

MSFlow: Multiscale Flow-Based Framework for Unsupervised Anomaly Detection

由于获取不到足够的异常样本用于模型训练,无监督异常检测(UAD)逐渐成为主流的异常检测方法,但这种方法中异常样本和注释的缺失会降低UAD的检测性能。 统计模型(规范化流)适合于以无监督的方式进行异常检测(AD)和定位,统计模型通过将异常数据的分布与正常数据的分布进行对比以进行概率计算,由此可以有效地区分不可预测的异常。

FastFlow: Unsupervised Anomaly Detection and Localization via 2D Normalizing Flows

在数据中异常概率密度低,正态和异常数据通常呈现严重的长尾分布,甚至在某些情况下没有异常样本。现实状况使得在实践中很难收集和标注大量的异常数据用于监督学习。无监督异常检测和定位能够用于在无法收集和标记足够的异常数据的情况进行。

Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models

视频异常检测(Video Anomaly Detection, VAD)在安全监控和自动驾驶等应用中至关重要。然而,现有的VAD方法在检测到异常时很少提供背后的原理,这限制了它们在现实世界部署中获得公众信任的能力。因此需要开发出能够提供推理过程的VAD方法。大语言模型(LLMs)在各种推理任务中表现出色。然而LLMs对异常的理解与特定场景所需的异常定义之间存在不匹配,这使得LLMs在直接执行VAD任务时效果不足。

Isolation Forest(iForest)——孤立森林算法介绍

异常检测的应用场景对算法的检测性能和执行速度要求很高。 传统的检测算法需要构建实例模型以判断是否是异常,这使得模型存在过度关注正常示例导致实际识别效果欠佳和高计算复杂度限制数据运算维度的问题。 实际数据可能存在分布不均或噪声的情况,但好在异常通常是few and different的,是少和不同的,这使得我们能够容易地划分异常。