使用轻量级事务时发生零星Cassandra写错误

问题描述：

我有一项服务连接到我们的Cassandra群集，每天使用Lightweight (ACID) Transactions执行数以万计的查询来实现被请求的共享系统here。大多数情况下，它工作正常，但零星地写道将失败，并显示“操作超时 - 只收到1个响应”（或者不太常见，只有0个响应）。我们正在使用Datastax Python驱动程序。当错误发生时，完整的错误线（在堆栈跟踪的结尾）写道：使用轻量级事务时发生零星Cassandra写错误

WriteTimeout: Error from server: code=1100 [Coordinator node timed out waiting for replica nodes' responses] message="Operation timed out - received only 1 responses." info={'received_responses': 1, 'required_responses': 2, 'consistency': 'LOCAL_SERIAL'}

这东西，似乎有望从时间发生时间在生产卡桑德拉设置？还是看起来像我们的Cassandra集群或网络有配置问题？

有关我们Cassandra群集的一些信息：它是跨2个Amazon EC2区域（每个区域4个节点）分布的8节点设置。所有节点都运行Datastax Cassandra发行版的3.3.0版本。

同样的问题在这里，我想补充：都这么回答与这个问题有关的是关于增加超时的问题。在我的情况下，WriteTimeout在请求开始后的10-100ms秒内收到，我的所有超时在cassandra yaml config中大于10s。我想这也可能是Datastax Python的卡桑德拉客户问题.. –

仅供参考，这些都不是有帮助的： [回答1]（http://*.com/questions/30575125/coordinator-node-timed-out-等待复制节点在cassandra-datastax-while）， [answer 2]（http://*.com/questions/33194860/cassandra-coordinator-node-timed-out-waiting-for-replica -nodes-应答？noredirect = 1＆LQ = 1） –

答

从https://issues.apache.org/jira/browse/CASSANDRA-9328

有一种情况下争协调失去的跟踪案件提交给Paxos的值是否可能适用与否（见 CASSANDRA-6013）。在这一点上，我们不能做任何其他的事情，回答“抱歉，我不知道”。而且，由于一个WriteTimeoutException 已经表示“我不知道”，我们把它扔在那种情况下，即使虽然它不是一个适当的超时每本身

使用轻量级事务时发生零星Cassandra写错误

相关推荐