presto集群内存报警

下午的时候线上机器忽然内存告警,登录机器看了下显示presto进程占用内存特别高

presto集群内存报警

按照以往的经验,一般是系统出现某个查询所需内存特别大导致机器报警。

然而,登上presto webui界面查询,并无大数据量的查询,也无长时间的超时,甚至那会都没几个用户用presto查询数据。

presto集群内存报警

ps了下进程获取到presto日志路径,查看后发现节点已经挂了,但是进程还在。

presto集群内存报警

造成该现象的原因还没找到,但最后解决办法是把该节点重启了下,机器内存使用率恢复正常。

 

此外,在presto/etc/config.properties加了个参数:query.max-run-time=60s  ,查询超过60秒就不再查询了