基于内容的视觉信息检索--引言
为什么需要基于内容的信息检索
1、视频信息几十万倍与人口的速度增加
2、视觉信息是多媒体信息的主要部分--静止图像、视频、动画、图形等
3、信息量增长过快超过了人的接受能力
4、信息检索用户快速搜索并提取相关信息(information retrieval)
对于一幅不同的图像,不同的人所提取的信息是不同的,具有很强的主观性。
5、网络上图像、视频服务带来的新的问题
促使视觉信息从文字、数字标签检索向其视觉内容本身检索转化
什么是基于内容的视觉信息检索
1、将不同的信息表达为码流的形式(bit stream)
2、对信息的存储及传输带来了极大的方便
3、信息的传输是应用的开始,并不是一切应用的最终目的
4、必须把码流转换成一种人的感觉可以理解的形式,才可以获取和利用它所携带的信息
5、转换:对信息抽象化和结构化的过程
6、从低层到高层进行处理、分析和理解的过程
利用颜色信息进行国旗的检索---将200个国家的国旗放在一起,从中找到一个国家的国旗(颜色特征)
基于草图的服装检索,用户利用现有图像为示例查询,自绘、构造图像做为示例查询(形状特征、后续会有纹理特征)
7、基于聚类的视频镜头关键帧检索(视频分割、关键帧检测、特征提取、聚类、组合、组织、索引、浏览)
基于图像归档和检索流程图
所需的基础知识及相关知识
1、图像处理、分析、理解技术
2、数据结构、数据库模型及管理、组织技术
3、人工智能、知识获取、应用等
4、视觉感知、心理认知
5、多媒体、网络技术等
第一代视觉信息检索
在概念层利用关键字进行的,比如某人、某年、某作品的检索需要提供相关文字,然后搜索引擎会对数据库进行搜索,然后给出结果,当然数据库中的信息需要人提前进行注解。类似我们网络搜索相关内容,不然百度搜索等。
第二代视觉信息检索系统
利用感知层对图像信息进行检索,比如范例查询,范例很多可以是草图、内容描述等。
CBIR:基于内容的图像检索(content-based image retrieval)
CBVR:content-based video retrieval 基于内容的视频检索
CBVIR:基于内容的视觉信息检索