- 积分
- 121
- 威望
-
- 金钱
-
- 注册时间
- 2010-7-2
- 在线时间
- 小时
- 最后登录
- 1970-1-1
|
1 CPU负载 # cat /proc/loadavg
检查前三个输出值是否超过了系统逻辑CPU的4倍。
2 CPU负载 #mpstat 1 1
检查%idle是否过低(比如小于5%)
3 内存空间 # free
检查free值是否过低 也可以用 # cat /proc/meminfo
4 swap空间 # free
检查swap used值是否过高 如果swap used值过高,进一步检查swap动作是否频繁:
# vmstat 1 5
观察si和so值是否较大
5 磁盘空间 # df -h
检查是否有分区使用率(Use%)过高(比如超过90%) 如发现某个分区空间接近用尽,可以进入该分区的挂载点,用以下命令找出占用空间最多的文件或目录:
# du -cks * | sort -rn | head -n 10
6 磁盘I/O负载 # iostat -x 1 2
检查I/O使用率(%util)是否超过100%
7 网络负载 # sar -n DEV
检查网络流量(rxbyt/s, txbyt/s)是否过高
8 网络错误 # netstat -i
检查是否有网络错误(drop fifo colls carrier) 也可以用命令:# cat /proc/net/dev
9 网络连接数目 # netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n
10 进程总数 # ps aux | wc -l
检查进程个数是否正常 (比如超过250)
11 可运行进程数目 # vmwtat 1 5
列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍
12 进程 # top -id 1
观察是否有异常进程出现
13 网络状态 检查DNS, 网关等是否可以正常连通
14 用户 # who | wc -l
检查登录用户是否过多 (比如超过50个) 也可以用命令:# uptime
15 系统日志 # cat /var/log/rflogview/*errors
检查是否有异常错误记录 也可以搜寻一些异常关键字,例如:
# grep -i error /var/log/messages
# grep -i fail /var/log/messages
# egrep -i 'error|warn' /var/log/messages 查看系统异常
16 核心日志 # dmesg
检查是否有异常错误记录
17 系统时间 # date
检查系统时间是否正确
18 打开文件数目 # lsof | wc -l
检查打开文件总数是否过多
19 日志 # logwatch –print 配置/etc/log.d/logwatch.conf,将 Mailto 设置为自己的email 地址,启动mail服务 (sendmail或者postfix),这样就可以每天收到日志报告了。
缺省logwatch只报告昨天的日志,可以用# logwatch –print –range all 获得所有的日志分析结果。
可以用# logwatch –print –detail high 获得更具体的日志分析结果(而不仅仅是出错日志)。 |
|