【人在运维囧途_07】GNU/Linux系统资源监控神器--collectl【重点推荐】

【人在运维囧途_06】借助sniffer诊断Linux网络故障
/os/201304/200754.html

 对系统资源的监控、是运维人员的一个必备的技能
 从 OS 角度讲、包括 CPU/IO/Network/FS 等
 从 DB 角度讲,包括 Active Sessions/ON CPU/Disks/Top Segments/Top SQL 等等
 而 DB 对资源的利用也反映在 OS 一级上,对 OS 计算资源的充分均衡利用是我们的目标
 
 众多监控工具中、collectl支持的性能数据种类应该是最全的一个
 包括 IO/CPU/Network/NFS/Infiniband/Lustre/Process/Slabs等等
 
 ㈠ 安装:
 # perl -MCPAN -e shell
 cpan> install Time::HiRes
 cpan> install Compress::Zlib 
 cpan> quit

 
 # tar -zxv -f collectl-3.1.3.src.tar.gz
 # cd collectl-3.1.3
 # ./INSTALL

 ㈡ 使用:
 
 # collectl -s+m


 更多的使用:

 ㈢ 应用:
 
  collectl 不局限于 OS、可以用它 monitor DB、如 Oracle MAA 环境
  在机房里的所有机器上安装collectl,然后把性能信息实时发送到一个监控机器,实现grid control
  以下是 Oracle Exadata 上的一次监控