王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

第一部分 DeepDive 知识抽取实战

注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。

1.1 工程组成

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

1.2 先验数据导入

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

1.3 待抽取文章导入

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

1.4 流程

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

1.5 文章数据预处理

对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。
在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

1.6 候选实体抽取

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

候选实体对生成

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

关系特征抽取

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

数据标注

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

因子图构建

王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

总结

这个项目仅仅听老师讲,很难懂这个过程。还需要自己亲自实践,才能真正理解。
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)