Can
Can
科技创新赋能高质量发展
首页
分类
标签
相册
链接
关于
首页
分类
标签
相册
链接
关于
最新文章
Long-Tailed Anomaly Detection with Learnable Class Names
异常检测(AD)在工业制造等领域非常重要,旨在识别有缺陷的图像及其缺陷位置。传统方法在多个图像类别上扩展性较差,并且需要手动定义类别名称,难以应对长尾数据分布。长尾数据分布是实际工业应用中常见的现象,其中部分类别数据样本显著少于其他类别。
异常检测
人工智能
论文分享
CVPR
AE
8
0
0
2024-11-30
Shell
第7关 编译依赖静态库的目标 # target you can change what you want TARGETSTATIC := lib/libstatic.a TARGETSHAREHAL := lib/libsharedhal.so TARGETEXECUTE := main # co
135
0
0
2024-11-29
Conda虚拟环境迁移步骤
目前实验室有两台8*3090的服务器,有时候需要某个conda虚拟环境在3090-1 和3090-2 之间进行迁移。我最近在使用OpenMMlab的MMAction框架,这个框架在23年就停止维护了,包之间的依赖关系和API废弃迁移问题比较难解决,配个环境就和手搓原子弹一样麻烦。我花了不少时间在3090-2上配好了环境,打算直接复制迁移到3090-1上,因为重新再配一遍真的很麻烦,还不一定能配成功。
运维
18
0
0
2024-11-20
Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly Detectors
异常事件通常是上下文依赖的,并且不经常发生,这使得收集足够代表性的异常事件样本以训练深度学习模型变得困难。 现有的异常点检测方法将异常检测作为离群值检测任务,在推理过程中对正常事件和异常事件分别应用一个经过正常事件训练的正态性模型,将偏离学习模型的事件标记为异常。 自动编码器(AE)模型对非分布数据的样本重建能力较差。由于训练只在正常的样本上进行,因此当出现异常时,预计AE会表现出很高的重建误差。 现有的SOTA方法依赖于昂贵的目标检测方法来提高精度,将处理带宽限制为每个GPU一个视频流,约为20-30 FPS,然而以对象为中心的视频异常探测器的处理成本太高。
异常检测
论文分享
人工智能
CVPR
AE
13
0
0
2024-11-20
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding
现有的基于LLM的多模态模型只能在有限的帧中理解短视频,这些模型大多直接将每帧沿时间轴连接的查询嵌入馈送到llm中,llm固有的上下文长度限制和GPU内存消耗限制了可以处理的视频帧的数量,这使得这些模型无法对长视频(>=30 sec)进行理解。 提出Memory-Augmented Large Multimodal Model (MA-LMM)
人工智能
论文分享
CVPR
LLM
9
0
0
2024-11-13
经典的CV/NLP网络
人工智能
7
0
0
2024-11-13
EasyNet: An Easy Network for 3D Industrial Anomaly Detection
三维异常检测是工业制造领域(IM)一项重要的计算机视觉任务,现有的方法的问题主要体现在: 严重依赖于大型预训练模型(pretrained model),难以在生产线上部署。 由于内存库(memory bank)的过度使用而大大增加了存储开销。 由于性能问题而无法实现实时的推理。 在工业质量检测中产品的深度信息对于异常检测至关重要,但现有的异常检测方法多数基于2D图像的处理,对于一些工业产品来说,仅使用2D图像来进行异常区分是很困难的。
人工智能
异常检测
论文分享
ACM MM
26
0
0
2024-10-28
Multimodal Knowledge Transfer of Foundation Models for Open-World Video Recognition
现有的视频识别模型使用的是在理想条件下收集的经典视频数据集,但在实际场景下存在复杂的相机拍摄环境,目标分辨率低,光照条件差,视频场景不寻常的多种问题,现有的大多数视频识别模型由于缺乏外部领域知识而不能很好地泛化,应用效果差。 基础模型包含了多样化的语义知识,可以适应低概率泛化,但是利用这些模型的知识进行开放世界视频识别的方法还有待研究。
论文分享
人工智能
arXiv
11
0
0
2024-10-28
上一页
下一页