标签归档:监控

Ganglia监控系统了解

简介:

至于什么是Ganglia,作何之用,不想多记录,想了解可以自己Google下,因为这里只是简单记录安装操作备忘作为自己后续查询备用而已。

安装配置:

1、系统更新:

yum -y install apr-devel apr-util check-devel cairo-devel pango-devel libxml2-devel glib2-devel dbus-devel freetype-devel fontconfig-devel gcc-c++ expat-devel python-devel libXrender-devel zlib libpng freetype libjpeg fontconfig gd libxml2 pcre pcre-devel

2、安装libconfuse依赖

下载地址:(源地址可能变更,按实时情况自行搜索地址安装)
32位:

wget http://download.fedora.redhat.com/pub/epel/5/i386/libconfuse-2.5-4.el5.i386.rpm
wget http://download.fedora.redhat.com/pub/epel/5/i386/libconfuse-devel-2.5-4.el5.i386.rpm

64位:

wget http://download.fedora.redhat.com/pub/epel/5/x86_64/libconfuse-2.5-4.el5.x86_64.rpm
wget http://download.fedora.redhat.com/pub/epel/5/x86_64/libconfuse-devel-2.5-4.el5.x86_64.rpm

安装:

rpm -ivh libconfuse-2.5-4.el5.x86_64.rpm
rpm -ivh libconfuse-devel-2.5-4.el5.x86_64.rpm

3、图形化监控界面支持

相应背景,相信基本都清楚很多监控系统特别在需要结合web图形直观浏览基本离不开基于RRDTool工具,如cacti也亦此。

wget http://oss.oetiker.ch/rrdtool/pub/rrdtool.tar.gz
tar zxvf rrdtool.tar.gz
cd rrdtool-1.4.4
./configure --prefix=/usr
make -j8
make install
which rrdtool
ldconfig

4、主角Ganglia3.1.7上场

更多信息可以先了解下其官方网站:http://ganglia.info/

wget http://cdnetworks-kr-1.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.1.7/ganglia-3.1.7.tar.gz
tar zxvf ganglia-3.1.7.tar.gz
./configure --with-gmetad --sysconfdir=/etc/ganglia
make -j8
make install

5、监控服务器端简单设置

监控点服务器端主要是由客户端Ganglia Monitoring Daemon (gmond) 和服务器端Ganglia Meta Daemon (gmetad),还有Ganglia PHP Web Frontend (基于Web网页动态访问方式)构成,故需要gmond、gmetad及Web server (Apache/Nginx等)支持。

其中gmond主要用于收集并发送受监控节点服务器的相关信息数据(因此受监控节点服务器只需配置gmond服务即可 下面也会提到);而gmetad服务程序只是在集群节点管理器是必须的,它主要功能是轮询gmond程序,统计gmond检测到的集群节点信息;Web动态方式主要是将结合RRDTool函数库将收集到的数据图形化更直观展示浏览查看。

cd /home/src/ganglia-3.1.7 # you should already be in this directory
cp -a web/* /data/web/www/ganglia/ # make sure you have apache/nginx installed,this is the web interface
cp gmetad/gmetad.init /etc/init.d/gmetad # startup script
cp gmond/gmond.init /etc/init.d/gmond
gmond -t | tee /etc/ganglia/gmond.conf # generate initial gmond config
mkdir -p /var/lib/ganglia/rrds # place where RRDTool graphs will be stored
chown nobody:nobody /var/lib/ganglia/rrds # make sure RRDTool can write here.
/etc/init.d/gmetad start # start service
/etc/init.d/gmond start

6、被监控客户端服务器节点设置

节点只需安装gmond(客户端):不再需要RRDTool、gmetad的支持

编译安装方法类似服务器端,只是无需使用–with-gmetad参数;或也可以直接由监控服务器节点复制部分相应文件到其他节点客户端并启用gmond服务即可

服务配置:

(主要是:节点添加、配置文件修改、监控内容服务增加)

时间关系,详细待明日更新……或可直接看参考资料。

可能遇到的一些问题:

1、Ganglia网页浏览很多图表不能正常显示的问题.
确认下站点程序目录位置是否有误:

vim /data/web/www/ganglia/conf.php:
# Where gmetad stores the rrd archives.
$gmetad_root = "/var/lib/ganglia";
$rrds = "$gmetad_root/rrds";
 # Leave this alone if rrdtool is installed in $gmetad_root,
# otherwise, change it if it is installed elsewhere (like /usr/bin)
define("RRDTOOL", "/usr/local/rrdtool/bin/rrdtool");

注意最后一行,你如果使用rpm安装的,很可能是/usr/bin/rrdtool,如果使用源码编译安装时需俺个人环境而异
并修改/var/lib/ganglia/rrds目录用户读写权限无误,删除/var/lib/ganglia/rrds/*下的数据,然后restart gmond和gmetad.

2、

参考资料:

1、Ganglia 和 Nagios,第 1 部分: 用 Ganglia 监视企业集群
2、Ganglia3.1.x Installation and Configuration

Nagios插件安装

      刚刚在Nagios基本平台搭建一文中也提到,对于Nagios的监测主机与服务功能其实是有其附带的插件来实现的,而Nagios系统本身只是一个空壳而已.因此,在安装了nagios平台之后的第一件事情就是将插件安装上去。这里使用的是插件源码包是从Nagios主页上下载了最新的官方插件,用的版本是nagios-plugins-1.4.13.tar.gz

1、解压

tar zxvf nagios-plugins-1.4.13.tar.gz
cd nagios-plugins-1.4.13
       

2、编译安装:

./configure --prefix=/usr/local/nagios
                –with-cgiurl=/usr/local/nagios/cgi-bin
                –enable-ssl
                –enable-command-args
    make
    make install

3、相关配置文件:
        ## 根据具体使用情况,将配置文件的结构做以下规划,为了方便将来的维护和管理:

        ## 配置文件结构如下:
        etc/        |– cgi.cfg
                        |– commands.cfg
                        |– nagios.cfg
                        |– resource.cfg
        (以上为nagios系统主配置文件)

        etc/servers        |– contacts.cfg                管理人员和管理人员组的的默认初始化设定文件
                                |– hostgroups.cfg                服务器组的默认初始化设定文件
                                |– hosts.cfg                        服务器的默认初始化设定文件
                                |– services.cfg                监控服务的默认初始化设定文件
                                |– servicegroups.cfg        监控服务组的默认初始化设定文件
                                |– timeperiod.cfg                时间周期默认初始化设定文件
        (以上为监控服务相关的配置文件,都是由原localhost.cfg文件中拆分出来的,这样方面理解和管理)

        etc/servers/test.com                |– 172.17.0.220.cfg
                                                        |– 172.17.0.255.cfg
        (在etc/servers/下建立监控的域名目录,区分各个被监控的域名,每台监控的主机一个单独的配置文件,包含hosts和services的内容)

        下班啦。。今日分享到此,待续ing。。。。。