基于内容的视觉信息检索--引言

为什么需要基于内容的信息检索

1、视频信息几十万倍与人口的速度增加

2、视觉信息是多媒体信息的主要部分--静止图像、视频、动画、图形等

3、信息量增长过快超过了人的接受能力

4、信息检索用户快速搜索并提取相关信息(information retrieval)

对于一幅不同的图像,不同的人所提取的信息是不同的,具有很强的主观性。

5、网络上图像、视频服务带来的新的问题

促使视觉信息从文字、数字标签检索向其视觉内容本身检索转化

什么是基于内容的视觉信息检索

1、将不同的信息表达为码流的形式(bit stream)

2、对信息的存储及传输带来了极大的方便

3、信息的传输是应用的开始,并不是一切应用的最终目的

4、必须把码流转换成一种人的感觉可以理解的形式,才可以获取和利用它所携带的信息

5、转换:对信息抽象化和结构化的过程

6、从低层到高层进行处理、分析和理解的过程

利用颜色信息进行国旗的检索---将200个国家的国旗放在一起,从中找到一个国家的国旗(颜色特征)

基于草图的服装检索,用户利用现有图像为示例查询,自绘、构造图像做为示例查询(形状特征、后续会有纹理特征)

7、基于聚类的视频镜头关键帧检索(视频分割、关键帧检测、特征提取、聚类、组合、组织、索引、浏览)

基于图像归档和检索流程图

基于内容的视觉信息检索--引言

所需的基础知识及相关知识

1、图像处理、分析、理解技术

2、数据结构、数据库模型及管理、组织技术

3、人工智能、知识获取、应用等

4、视觉感知、心理认知

5、多媒体、网络技术等

第一代视觉信息检索

在概念层利用关键字进行的,比如某人、某年、某作品的检索需要提供相关文字,然后搜索引擎会对数据库进行搜索,然后给出结果,当然数据库中的信息需要人提前进行注解。类似我们网络搜索相关内容,不然百度搜索等。

第二代视觉信息检索系统

利用感知层对图像信息进行检索,比如范例查询,范例很多可以是草图、内容描述等。

CBIR:基于内容的图像检索(content-based image retrieval)

CBVR:content-based video retrieval 基于内容的视频检索

CBVIR:基于内容的视觉信息检索