您的位置: 首页 > 文章 > 王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下) 王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下) 分类: 文章 • 2024-04-14 23:06:17 第一部分 DeepDive 知识抽取实战 注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。 1.1 工程组成 1.2 先验数据导入 1.3 待抽取文章导入 1.4 流程 1.5 文章数据预处理 对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。 在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。 1.6 候选实体抽取 候选实体对生成 关系特征抽取 数据标注 因子图构建 总结 这个项目仅仅听老师讲,很难懂这个过程。还需要自己亲自实践,才能真正理解。