服务器维护常用命令(杨杰)

一、常用命令

pstree查看进程树。可以很清楚的看到进程之间的关系;

Top:查看各进程的占用资源的情况;

du-h--max-depth=1显示当前目录中所有子目录的大小;

w查看服务器的load情况

bigip在预发布机器上使用命令bigipsh${ip/机器名}{username}可以检查机器是在F5上状态是disable还是enable.

gm.sh"curlhttp://localhost/monitor/ok.html"在预发布机器上检查各个服务器的健康检查页面。

gm.sh"psamx|grephttpd|wc-l"在预发布机器上检查各个服务器的http链接数

二、proc下的伪文件。如:meminfo检查内存信息,cpuinfo内核信息。

cat/proc/cpuinfo检查cpu的信息。我们的一些程序根据cpu内核的数量做过优化(如:memcached假的多核可能会引起一些bug。)

服务器维护常用命令(杨杰)

如上图baike-web14核的,baike-web2是双核超线程的。

拥有相同physicalid的所有逻辑处理器共享同一个物理插座。每个physicalid代表一个唯一的物理封装。Siblings表示位于这一物理封装上的逻辑处理器的数量,如果不存在表示1。每个coreid均代表一个唯一的处理器内核。所有带有相coreid的逻辑处理器均位于同一个处理器内核上。如果有一个以上逻辑处理器拥有相同的coreidphysicalid,则说明系统支持超线程(HT)技术。如果有两个或两个以上的逻辑处理器拥有相同的physicalid,但是coreid不同,则说明这是一个多内核处理器。

网络连接

netstat-t:显示TCP链接信息;-u:显示UDP链接信息;-n直接显示ip,不做名称转换;-p:显示相应的进程PID以及名称(要root权限)

如果要查看关于sockets更详细占用信息等,可以使用lsof.

a)netstat-anp|grepjava|grep3306|wc–l检查Java进程中数据库的链接数量

b)netstat-na|grepESTABLISHED|awk'{print$4}'|grep":80$"|wc–l检查已经建立的80端口的连接数

c)netstat-na|grep“:2088”检查搜索引擎的连接数

dumpjava进程堆栈

a)kill-3${java进程Id},可以在java进程的日志中看到输出(jboss记录在jboss_stdout.log)

b)jstack$pid.直接dump当前进程的的堆栈信息。

对于threaddump信息,主要关注的是线程的状态和其执行堆栈,特别是load很高的时候,通过threaddump可以看到线程到底在干嘛,从中找出问题。线程的状态一般为三类:runable:当前可以运行的线程,Waitingonmonitor:线程主动wait,Waitingformonitorentry:线程等锁.Cpu很忙则关注runnable的线程,Cpu闲则关注waitingformonitorentry的线程。

java内存溢出

1可以先用jstat-gcutil${pid}{interval}看看java内存回收的动态信息。interval–表示间隔打印的时间,单位为毫秒

服务器维护常用命令(杨杰)

图中参数含义如下:

S0—Heap上的Survivorspace0区已使用空间的百分比

S1—Heap上的Survivorspace1区已使用空间的百分比

E—Heap上的Edenspace区已使用空间的百分比

O—Heap上的Oldspace区已使用空间的百分比

P—Permspace区已使用空间的百分比

YGC—从应用程序启动到采样时发生YoungGC的次数

YGCT–从应用程序启动到采样时YoungGC所用的时间(单位秒)

FGC—从应用程序启动到采样时发生FullGC的次数

FGCT–从应用程序启动到采样时FullGC所用的时间(单位秒)

2.使jmapdumpjava内存中全部对象,分析死锁的位置。

jmap-histo$pid快速查看当前内存中各个Java对象的大小和数量

jmap-dump:live,format=b,file=heap.dmp$pid可以将jvm堆栈中的信息全部复制到文件head.dmp中,注意这个heap.dmp文件会比较大,线上jboss分配的内存一般为2g,当内存溢出时dump出来的head.dmp文件也是2g,所以dump的时间也比较长,一般会有半个小时.

日志文件生成后运行命令“jhat-J-mx768m-port7001heap.dmp”分析堆栈日志(注意不要在线上服务器上分析)。访问http://localhost:7001可以查看分析报告。

或者可以使用eclipsemat插件分析,它可以以图形形式分析出内存中的java对象的分布:(插件地址http://download.eclipse.org/mat/1.0/update-site/).导入后可以生成一个图形报表

服务器维护常用命令(杨杰)

7001端口报警。

一般情况是jboss挂掉了。因为java进程已经退出。1首先需要查看:jboss_stdout.log,它会告诉你jbosscrash的一些信息,它还会告诉你在jbosscrash有一个详细的出错报告,位置在/web-deploy/bin/hs_err_pid.log

cookie日志分析

catcookie_log|awk'{print$1}'|grep-v"172.16"|grep-v"127.0.0.1"|sort|uniq-c|sort-n|tail-n10提取访问量前10位的ip.

catcookie_log|grep'09/Dec/2010:18:01'|wc–l检查18:01这一分钟的访问总量。

catcookie_log|grep'HTTP/...\"[4|5]'|more查看响应出错的请求。

catcookie_log|grep-E'Googlebot|Baiduspider'|wc–l统计googlebaike爬虫的访问量。

<!--EndFragment-->