本体(Ontology)在问答系统(QA)中的应用

相似度计算

把本体作为工具,根据本体计算词语的语义相似度,进而得到句子的相似度。通过本体计算词语的相似度又主要分为两大类:
(1)常用词语用通用领域本体(如《知网》、wordnet等)计算词语的语义相似度;
(2)专业领域词语,用领域本体计算词语的语义相似度;
该种方法搭建问答系统的流程如下:
本体(Ontology)在问答系统(QA)中的应用
(1)利用分词工具自定义词典,分词以及词性标注;
(2)删除停用词,停用词对于句子的理解无意义,对问题的检索起不到作用;
(3)专业词汇采用基于领域本体的概念相似度方法计算词语语义相似度,其他词汇采用基于《知网》本体计算词语语义相似度;
(4)在词语语义相似度的基础上计算句子的相似度;
(5)根据用户所提问句与FAQ库中问题的句子相似度,定义一个相似度阈值,从FAQ库中抽取相似度阈值最高的问题的答案作为用户提问的问题答案;

利用本体的关系进行关键词扩展

根据本体中的关系(上下位关系、同义关系、相关关系)对用户问句识别出的关键词进行扩展,增大问题的检索范围,从而提高问答系统的查全率。
比如,在传统的基于模式匹配的FAQ问答系统中,将领域本体作为附加知识库,对用户问句经过分词处理之后,提取关键词,一面在FAQ中匹配答案,一面基于领域本体扩展关键词给出相关内容的推荐。
本体(Ontology)在问答系统(QA)中的应用

本体作为知识库

本体为问答系统提供了结构化、关联化的高质量数据,可以作为问答系统的知识来源。将用户输入的自然语言问句经过处理后,映射到本体的结构化查询上,从而给出更准确的信息,实现问什么答什么的智能问答。
本体(Ontology)在问答系统(QA)中的应用
比如,用户输入问句“How many people are there in kunming”,经过问句处理之后转化为结构化查询语句,在本体库中映射到“population”人口属性上,进而得到答案。