CanTechLab

Can

ACM MM

Robust Contrastive Cross-modal Hashing with Noisy Labels

跨模态哈希(Cross-modal Hashing)是一种用来检索和存储不同模态数据(如图像和文本)的方法,主要优点包括: 存储成本低:二值哈希编码较连续特征更紧凑。 检索效率高:哈希距离计算效率远高于传统方法。 然而,现有的跨模态哈希方法面临以下主要问题: 标签噪声普遍存在:在实际数据中,标注可能因复杂性、人工错误或标签模糊而产生噪声。 依赖高质量标注:大多数方法隐含假设数据标签是准确的,而现实中,生成高质量标注代价高昂且资源有限。 标签噪声的存在会导致模型倾向于过拟合噪声数据,使得检索性能显著下降。

EasyNet: An Easy Network for 3D Industrial Anomaly Detection

三维异常检测是工业制造领域(IM)一项重要的计算机视觉任务,现有的方法的问题主要体现在: 严重依赖于大型预训练模型(pretrained model),难以在生产线上部署。 由于内存库(memory bank)的过度使用而大大增加了存储开销。 由于性能问题而无法实现实时的推理。 在工业质量检测中产品的深度信息对于异常检测至关重要,但现有的异常检测方法多数基于2D图像的处理,对于一些工业产品来说,仅使用2D图像来进行异常区分是很困难的。