DataNode CLOSE_WAIT

DataNode CLOSE_WAIT
最近发一下一个问题就是用netstat -anpt直径去查看服务器,出现大量的CLOSE_WAIT。
刚开始挺懵逼的,一桶乱排查,最终还是没有定位到问题,后来冷静下来最终把问题解决,现在我来说一下我的思路

tcp的原理不说了,现在出现这种状况其实就是客户端没有关闭连接,造成大量的CLOSE_WAIT
因为我的程序是hdfs共享到ftp,首先想到的是ftp的连接没有正常释放,可仔细看完代码,发现ftp不可能会有那么多的连接,并且使用完之后都已经正常的归还了。再看ftp服务器的端口也不是1004,因此排除ftp的问题。

其次查找1004端口发现,1004端口是DataNode的对外服务端口,DataNode又是存放数据文件的主机,hdfs文件读取的原理
DataNode CLOSE_WAIT
因此读取hdfs文件的时候,客户端是要和DataNode进行交互的。
好了,到现在问题已经很明朗了,去看程序代码,发现获取hdfs文件的输入流在使用完之后没有被关闭。
问题迎刃而解。