请求期间出现意外异常
我正在使用apache cassandra 2.2.4
。我有一个在DC1中具有复制因子3并且在DC2中具有复制因子1的4(四)节点群集,其中DC1包含3(三)个节点并且DC2包含1(一个)节点。在这个集群中有更多的节点,但由于某种原因,我删除了它们,并没有改变复制场景。 [请考虑下面的IP的不是原创]请求期间出现意外异常
Datacenter: DC1
===============
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN 21.12.19.91 4.08 GB 256 ? a45bb676-1ddd-4b22-933b-58653cea680f RAC1
UN 21.12.19.92 3.92 GB 256 ? a7735fca-8671-4a20-a759-4a2681aed37e RAC1
UN 21.12.19.93 4.47 GB 256 ? d98f3cad-881a-41c8-89c7-170c63c3d236 RAC1
Datacenter: DC2
===============
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UN 21.12.19.99 3.84 GB 256 ? ccd9ca97-f97a-4473-9a65-49b12a1b60ba RAC1
集群工作正常,但现在给天我有一个问题,INFO
。我试图分析这个问题,但还没有做到。有没有人熟悉以下情景?
INFO [SharedPool-Worker-2] 2017-02-26 06:56:48,520 Message.java:605 - Unexpected exception during request; channel = [id: 0x637a702c, /18.12.10.17:60926 :> /21.12.19.91:9042]
java.io.IOException: Error while read(...): Connection reset by peer
at io.netty.channel.epoll.Native.readAddress(Native Method) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.doReadBytes(EpollSocketChannel.java:675) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.epollInReady(EpollSocketChannel.java:714) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.channel.epoll.EpollEventLoop.processReady(EpollEventLoop.java:326) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.channel.epoll.EpollEventLoop.run(EpollEventLoop.java:264) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:116) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:137) ~[netty-all-4.0.23.Final.jar:4.0.23.Final]
at java.lang.Thread.run(Thread.java:745) [na:1.8.0_66]
请确保您的防火墙没有丢弃正在使用的TCP连接。所有节点上的Tcp保持活动状态必须小于防火墙设置。有关TCP设置的详细信息,请参阅https://docs.datastax.com/en/cassandra/2.0/cassandra/troubleshooting/trblshootIdleFirewall.html。这帮助我解决了这个问题。
我从这个问题的开始就经历了这一点。我有足够的** keepalive_time **,** keepalive_probes **和** keepalive_intvl **延迟配置。所以,不可能下降。 –
在这种情况下,也可能是因为您的应用程序或其他节点已经缓存了以前存在且现在已经停用的Cassandra节点的IP。从_INFO_ logs ** 18.12.10.17:60926 **看来,似乎已被删除,但仍尝试连接到它。请滚动重新启动所有节点,并且应该可以解决问题。 –
** 18.12.10.17:60926 **是客户端/开发者端IP。我们不为一个群集使用不同的块IP。而且我们也做了滚动重启。但无法找出问题出在哪里。 –
什么是IP 18.12.10.17(例外)? – Ralkie
其开发者结束了IP。 –