使用轻量级事务时发生零星Cassandra写错误

问题描述:

我有一项服务连接到我们的Cassandra群集,每天使用Lightweight (ACID) Transactions执行数以万计的查询来实现被请求的共享系统here。大多数情况下,它工作正常,但零星地写道将失败,并显示“操作超时 - 只收到1个响应”(或者不太常见,只有0个响应)。我们正在使用Datastax Python驱动程序。当错误发生时,完整的错误线(在堆栈跟踪的结尾)写道:使用轻量级事务时发生零星Cassandra写错误

WriteTimeout: Error from server: code=1100 [Coordinator node timed out waiting for replica nodes' responses] message="Operation timed out - received only 1 responses." info={'received_responses': 1, 'required_responses': 2, 'consistency': 'LOCAL_SERIAL'} 

这东西,似乎有望从时间发生时间在生产卡桑德拉设置?还是看起来像我们的Cassandra集群或网络有配置问题?

有关我们Cassandra群集的一些信息:它是跨2个Amazon EC2区域(每个区域4个节点)分布的8节点设置。所有节点都运行Datastax Cassandra发行版的3.3.0版本。

+0

同样的问题在这里,我想补充:都这么回答与这个问题有关的是关于增加超时的问题。在我的情况下,WriteTimeout在请求开始后的10-100ms秒内收到,我的所有超时在cassandra yaml config中大于10s。 我想这也可能是Datastax Python的卡桑德拉客户问题.. –

+0

仅供参考,这些都不是有帮助的: [回答1](http://*.com/questions/30575125/coordinator-node-timed-out-等待复制节点在cassandra-datastax-while), [answer 2](http://*.com/questions/33194860/cassandra-coordinator-node-timed-out-waiting-for-replica -nodes-应答?noredirect = 1&LQ = 1) –

https://issues.apache.org/jira/browse/CASSANDRA-9328

有一种情况下争协调失去的 跟踪案件提交给Paxos的值是否可能适用与否(见 CASSANDRA-6013)。在这一点上,我们不能做任何其他的事情, 回答“抱歉,我不知道”。而且,由于一个WriteTimeoutException 已经表示“我不知道”,我们把它扔在那种情况下,即使 虽然它不是一个适当的超时每本身