Robust Contrastive Cross-modal Hashing with Noisy Labels
跨模态哈希(Cross-modal Hashing)是一种用来检索和存储不同模态数据(如图像和文本)的方法,主要优点包括:
存储成本低:二值哈希编码较连续特征更紧凑。
检索效率高:哈希距离计算效率远高于传统方法。
然而,现有的跨模态哈希方法面临以下主要问题:
标签噪声普遍存在:在实际数据中,标注可能因复杂性、人工错误或标签模糊而产生噪声。
依赖高质量标注:大多数方法隐含假设数据标签是准确的,而现实中,生成高质量标注代价高昂且资源有限。
标签噪声的存在会导致模型倾向于过拟合噪声数据,使得检索性能显著下降。