A Comprehensive Survey on Cross-modal Retrieval

Kaiye Wangy, Qiyue Yiny, Wei Wang, Shu Wu, Liang Wang∗, Senior Member, IEEE

1. 研究现状：

目前跨模态检索主要分为两种方法：(1)real-valued表示学习；(2)binary表示学习。Real-valued表示学习方法目的是学习不同模态数据的实值的相同的表示，大量的binary表示学习是将不同的数据模态映射到一个公共的Hamming空间。第二种方法相似性搜索速度是很快的，但编码是二进制编码，会导致信息的丢失，检索精度一般会略有下降。根据学习常用表示时所使用的信息，将跨模态检索方法进一步划分为四类:(1)无监督方法，(2)基于成对的方法,(3)基于秩的方法,(4)有监督的方法。一般来说，一种方法利用的信息越多，它获得的性能就越好。

（跨模态检索综述）A Comprehensive Survey on Cross-modal Retrieval

2. 研究挑战：

如何度量不同模式数据之间的内容相似性，即异质性差距。因此，与传统的检索方法相比，跨模态检索需要跨模态关系建模，用户可以通过提交已有的内容来检索自己想要的内容。目前，主要的研究工作是设计有效的方法，使跨模态检索更加准确和可扩展性。

3. 本文贡献：

这篇文章目的是

（跨模态检索综述）A Comprehensive Survey on Cross-modal Retrieval

A Comprehensive Survey on Cross-modal Retrieval

1. 研究现状：

2. 研究挑战：

3. 本文贡献：

相关推荐