nohup后台运行perf top脚本持续监控CPU

背景和问题

某个线上进程偶尔突发短暂的CPU 100%导致一些问题,这个问题是间歇性的,为了捕捉CPU 100%时的现场,想写个脚本通过perf top持续监控。脚本很简单,主要一行:
sudo perf top >> perf.data
前台执行这个脚本正常。线上机器,必须要后台运行,但是使用nohup + &,脚本执行异常:perf top每秒钟N次刷新,捕捉到的都是无用的信息,十几秒钟的日志量是G级别。

原因

perf top是交互式的,执行perf top后,perf会等待从标准输入读取字符。nohup启动的时候做了stdin < /dev/null,这个时候perf相当于从/dev/null读取字符,读到的是EOF,执行异常。
nohup后台运行perf top脚本持续监控CPU

解决方法

后台运行脚本,除了nohup,还尝试了crontab和daemon,执行perf top都是一样的问题。目前没有找到其他更简单的处理方法,只能去改perf的代码,简单粗暴的将perf top中从stdin读取字符部分的代码去掉,如下图:
nohup后台运行perf top脚本持续监控CPU
改了perf的代码后,perf top执行时不再从stdin读取字符,nohup运行正常。
所有交互式的命令或者等待从stdin读取字符的程序,如果要通过nohup后台运行,都可能存在perf top类似的问题。比如top也是交互式的,如果要用nohup运行top也会有类似的问题,但是通过top -b可以切换到非交互式。