阿里spark环境读取arango连接失败问题

大家好,我是爱学习的张三,前段时间遇见一个spark连接arango(自己搭建的数据库服务器)超时的问题,先说说问题的场景吧,我们项目需要读取arango数据的部分表数据,写了一个spark算法,读取odps数据然后根据key查询arango表,使用local模式在调度机器提交spark程序的时候,程序是没问题的(因为调度机和arango服务器网络是通的),然使用yarn-client模式提交代码的时候,出现了一个很神奇的问题,就是有时候能读取,有时候不能读取,然后抽取日志发现如下

阿里spark环境读取arango连接失败问题

 

如上图所示,有四台机器连接异常,然后编写java连接arango的demo在四台服务器上尝试,均失败,最后是由于网络问题导致的失败,调整网络即可,希望对大家有帮助