Cassandra能够检测到不经常使用的损坏数据吗?

问题描述:

有没有像HDFS的Cassandra的DataBlockScanner,即。一种自动机制,用于检查通常不会被读取的损坏数据?Cassandra能够检测到不经常使用的损坏数据吗?

卡桑德拉没有做到这一点自动 - 它可以保证一致性上 读或通过ConsistencyLevel每个查询写的,它可以运行活跃 (反熵)修理。但主动修复必须安排(由人或 cron或由第三方脚本如http://cassandra-reaper.io/),并且 是迂腐,修复只修复一致性问题,有一些工作要 完成正确地址/支持修复损坏的副本(for例如, 修复可以从一个节点发送一个位翻转到所有其他的)

http://mail-archives.apache.org/mod_mbox/cassandra-user/201709.mbox/%[email protected].com%3E

大数据作为一个垃圾桶。凉。

最好的办法是使用nodetool verify来比较sstable和内容的哈希值。特别是与nodetool verify -e行走单个单元格。

https://docs.datastax.com/en/cassandra/3.0/cassandra/tools/toolsVerify.html