基于医疗知识图谱的问答系统的运行步骤
下载的是中科院刘焕勇的源码https://github.com/liuhuanyong/QASystemOnMedicalKG,下载下来后不知道怎么运行,摸索成功后记录一下:
(1)首先要安装neo4j图数据库,连接服务器,具体怎么连接在我的前一篇博文有提到;
(2)python 安装py2neo和pyahocorasick包,安装pyahocorasick的时候报错,提示安装Visual Studio Build Tools:
先安装 Microsoft Visual C++ :在 https://visualstudio.microsoft.com/downloads/ 下载Build Tools, 安装后,在模块选择里勾选Visual Studio Build Tools里面的C++ Build Tools。
有的人说直接用anaconda安装pyahocorasick不需要安装VC,具体我没试过。
(3)接着运行程序:
1)先修改build_medicalgraph和answer_search的user和password,改成你的neo4j的账号名和密码
2)然后在build_medicalgraph的最后两行添加:
handler.create_graphnodes()
handler.create_graphrels()
3)运行build_medicalgraph,有的可能会报错:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaf in position 81: illegal multibyte sequence.
把有open的地方加上encoding=‘utf-8’
4)数据很多,会运行几个小时,运行完之后打开neo4j explore,就有节点和图
5)再运行chatbot_graph.py,输入你想问的问题,就会出来答案: