知识图谱---初识本体

一、什么是本体

l本体论(Ontology)和本体(ontology)在英文中的表示并不完全一样,它们一个用大写的“O”开头,另一个用小写的“o”开头。本体论这个术语诞生于17世纪,派生于希腊语的onto和logia,是一个哲学的分支。从哲学上来说,本体论是研究客观事物存在的本质,所以本体论在哲学上的真正内涵是对世界上任何领域内的真实存在所做出的客观描述。对本体论的理解,人们不存在什么疑问。但是对本体的理解,哲学界和计算机科学界存在着不同的观点。

本体定义了组成「主题领域」的词汇表的「基本术语」及其「关系」,以及结合这些术语和关系来定义词汇表外延的「规则」

二、本体概念

第一,领域(domain of discourse),一个本体描述的是一个特定的领域。比如我们确定这次要描述的领域是「大学」。

第二,术语(term),指给定领域中的重要概念。例如,确定要描述「大学」了,对于一个大学来说什么概念是重要的呢?我们可以列举出「教工」、「学生」、「课程」等等概念。

第三,基本术语之间的关系,包括类的层次结构(可类比「taxonomy」理解)。列举出了「教工」「学生」等这些重要的概念,那么这些概念之间是什么关系呢?并列?上下位类?

第四,词汇表外延的规则(可类比数据库中的「约束」概念理解),包括(1)属性(2)值约束(3)不相交描述(4)对象间逻辑关系的规定例如

三、本体相关基础

知识图谱---初识本体

(1)类(Classes)或概念(Concepts)

类,是对象的集合;概念是广义的概念,除了可以是一般意义上的概念以外,也可以是任务、功能、行为、策略、推理过程等,其定义一般包括概念的名称,以及对该概念的自然语言描述。本体中的这些概念通常构成一个继承的分类层次。

(2)关系(Relations)

关系是领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:

R:C1×C2×…×Cn。

概念间的关系多种多样,但是那些具有普遍性的关系更值得关注,例如表达概念之间部分与整体的Part-of和表达概念之间继承关系的Kind-of。

关系的种类分为四种

知识图谱---初识本体

(3)函数(Functions)

函数是一种特殊的关系,关系的前n-1个元素可以惟一确定第n个元素。一般地,函数采用F:C1×C2×…×Cn-1→Cn的形式表示,如MotherOf就是一个函数,MotherOf(x,y)表示y是x的母亲,即x确定y。

(4)公理(Axioms)

公理是一些永真式的描述。更具体地说,公理是领域中在任何条件下都成立的断言,如概念乙属于概念甲的范围。

(5)实例(Instances)

实例代表属于某概念/类的基本元素,即某概念/类所指的具体实体。

从语义上分析,实例表示的就是对象,而概念表示的则是对象的集合,关系对应于对象元组的集合。

概念的定义一般采用框架(Frame)结构,包括概念的名称、与其他概念之间的关系的集合以及用自然语言对该概念的描述。

在实际建模过程中,不一定要严格地按照上述5类基本建模元语来创建Ontology,概念之间的关系不限于上面列出的4种基本关系,可以根据领域的具体情况定义相应的关系,以满足应用的需要。

四、领域本体构建方法

https://blog.****.net/u013263092/article/details/46327689

一些本体的例子:linkedopenvocabulary(lov):http://lov.okfn.org/dataset/lov/vocabs

 

 

参考

本体概述:https://blog.****.net/sfbegingmail/article/details/6093010
--------------------- 
原文:https://blog.****.net/github_37002236/article/details/81907721