Elasticsearch索引是非常缓慢的
问题描述:
我有一个Titan数据库与Cassandra存储后端,我试图创建基于两个属性键的混合索引。Elasticsearch索引是非常缓慢的
我可以使用下面的命令来注册指数:
graph=TitanFactory.open(config);
graph.tx().rollback()
m = graph.openManagement();
m.buildIndex("titleBodyMixed", Vertex.class).addKey(m.getPropertyKey("title")).addKey(m.getPropertyKey("body")).buildMixedIndex("search");
m.commit();
m.awaitGraphIndexStatus(graph, 'titleBodyMixed').status(SchemaStatus.REGISTERED).timeout(3, java.time.temporal.ChronoUnit.MINUTES).call();
,当我检查时,指数成功几秒钟后注册。在下一步骤中,我尝试使用下面的命令来重新索引数据库:
m = graph.openManagement();
m.updateIndex(m.getGraphIndex('titleBodyMixed'), SchemaAction.REINDEX).get();
然而,UpdateIndex中命令不被精加工,(12小时后)。
我在数据库中有大约300k的数据输入,每个数据输入都有一个Title和一个Body来索引。
我的问题是,我该如何加快索引?
当我使用top命令我看到我的CPU不被索引进程饱和:
我泰坦配置文件是波纹管:
config =new BaseConfiguration();
config.setProperty("storage.backend","cassandra");
config.setProperty("storage.hostname", "127.0.0.1");
config.setProperty("storage.cassandra.keyspace", "smartgraph");
config.setProperty("index.search.elasticsearch.interface", "NODE");
config.setProperty("index.search.backend", "elasticsearch");
以下是显示elasticsearch服务属性:
curl -X GET 'http://localhost:9200'
{
"status" : 200,
"name" : "Ms. Marvel",
"cluster_name" : "elasticsearch",
"version" : {
"number" : "1.7.2",
"build_hash" : "e43676b1385b8125d647f593f7202acbd816e8ec",
"build_timestamp" : "2015-09-14T09:49:53Z",
"build_snapshot" : false,
"lucene_version" : "4.10.4"
},
"tagline" : "You Know, for Search"
}
答
这个想法是,除非所有会话都关闭,否则索引重新索引过程不会启动。您最有可能会与数据库打开会话。因此,reindex作业永远不会被触发。
随着this Gremlin script,您可以关闭所有会话。你应该看到索引会在后面发生。
请问有帮助吗?