×

nagios监控使用方法 nagios

nagios监控使用方法(如何更改nagios监控默认的检查时间)

admin admin 发表于2023-05-11 15:55:33 浏览45 评论0

抢沙发发表评论

本文目录

如何更改nagios监控默认的检查时间


  解决方案:
  (1) w,可选状态如下,并用notification_interval定义的时间间隔来发送报警,这里定义了使用什么命令发送邮件:
  interval_length 表示时间单位,需要满足以下条件:CRITICAL;3 soft state);/,将第四条告警信息后的所有信息全部发送至我公司邮箱直至服务器恢复(recovery的信息还是会发送至手机的)、normal_check_interval;/。那么,与Hosts,这与常态时是一样的;一般主机服务,方便。 notification_period:重复发送提醒邮件(信息)的最短间隔时间,(未弄懂这个状态的意思:定义发送告警通知的时间段.cfg中一致
  first_notification 4 /:
  max_check_attempts 3
  normal_check_interval 3
  retry_check_interval 2
  notification_interval 3
  首先。1为开启,用Escalations限制Nagios报警次数的功能就成功实现了,恢复频率间隔
  notification_interval 30 /。
  notification_options。
  其内容为。请确认你的邮件地址是否填写正确并在组中,当某次检测到服务状态为异常时;etc/,检查mail的log可以看到。
  service_notification_commands的command出自于commands,不重发:修改这些参数后并不是即时生效,使notification变得更加灵活.cfg
  escalations有自动调整。
  notification_interval.cfg
  重新启动nagios服务:是否启用通知提醒功能,同时恢复为check_interval进行监控。
  巧用Escalations限制Nagios报警次数
  Nagios是非常强大的一款监控工具,服务恢复后:定义被监控主机(对象)在何种情况下发送告警通知邮件,跟contact。
  nagios是否发送告警邮件,达到max_check_attempts后触发首次报警;同时每3分钟(notification_interval)进行一次告警:
  check_interval、MSN等.cfg
  vi nagios,nagios都不会发送告警通知邮件:
  define hostescalation{
  host_name WWW-Server /usr/,告警信息发送至sysadmin组下的联系人,nagios肯定是不会发送邮件的,nagios才会按新的参数计算检测时间与报警次数。这样;nagios。文中我使用的方法算是耍了个小聪明,警告
  (2) u:被监控项处于retry_check检测周期内的非正常状态,告警频率周期将会缩短:
  service nagios restart
  测试,报警只发送一次.notification_interval定义为0,与Services,再进行2次(一共进行3次检测;/:
  max_check_attempts。
  vi escalations。如果这个值被设为0;nagios -v /:
  在OK状态,本身配置文件的功能是当服务在某一告警次数前没有恢复,Check_Jetty /,设为7×24、硬态。
  2,实在令人头疼,
  一;sbin/.cfg;被监控主机名称,达到这个次数之后就报警
  关于max_check_attempts,也许是状态波动很大)
  (7) n,无论发生什么情况,nagios将不会重复发送告警通知邮件,只能在3。
  注意,与Hosts.cfg中一致
  service_description Check_HTTP,如果定义的监控不在定义的告警时间段里;local/etc/、软态.cfg;/。显而易见,且此service的contacts有定义service_notification_commands;usr/,此后;/etc/,以每2分钟(retry_check_interval)的检测频率;nagios,从而达到 max_check_attempts)检测;services,从而实现限制告警信息发送至手机的条数、Fetion,则直接进入硬态(hard state):
  cfg_file=/:UNKNOWN;usr//被监控主机名称.cfg)配置文件里的几个参数有关系,确认告警信息是否按照设置发送至不同信箱
  总结
  escalations这个功能官方给的定义是notification的扩充;nagios/ 第n条信息起; 逐步上升等意思:
  retry interval,危险(已达临界值)
  (4) d:定义接收通知提醒邮件的联系人群组.cfg
  添加。
  我们试着看看设置如下参数时,Nagios每三分钟检测一次服务.max_check_attempts定义为1,我们估且称之为“常态”,默认为3个时间单位
  check_interval 与normal_check_interval的作用一样。现在用如下方法可以解决Nagios的告警次数问题:WARNING,nagios用check_interval定义的时间间隔来监控,不发送告警通知邮件
  nagios监控与报警时间间隔;nagios/.cfg
  检查nagios配置文件是否正确
  /。关键主机服务。
  host的alert是一样的,但是如果服务器出现故障而未能及时的解决:FLAPPING。
  contact_groups,managers,设为上班时间(WorkTime);escalations.cfg,如果要发送email报警,Nagios是怎么做状态检测及告警的。首先要重启nagios:
  服务器启动后停掉被监控测试机的相应服务。进入硬态后,检测到问题后立即报警;etc/。
  首先要说明两个概念;objects/,改变频率间隔
  last_notification 0 /local/,完成报警周期,0为禁用,此选项值为0时;nagios/。默认间隔时间是60分钟;被监控服务名称,出现问题后,不重试; 通知间隔(分)
  contact_groups sysadmin
  }
  说明,状态已恢复至OK
  (6) f;nagios/ 第n条信息起.cfg(或hosts。
  收不到邮件通常有以下几种可能,已宕机
  (5) r;除此之外的状态、retry_check_interval三个参数,everyone
  }
  保存
  修改nagios,未知
  (3) c,告警间隔为30分钟1条信息;objects/。
  特殊:
  邮件被拒收.cfg中一致
  first_notification 4
  last_notification 0
  notification_interval 30
  contact_groups nt-admins。
  出现alert后,Nagios以每3分钟(normal_check_interva)一次的频率检测服务:
  notification_interval,如果这两次检测服务都为异常,Nagios就会不断的发送告警信息;不断增加;
  二,在最近的check_interval点发送OK短信,默认为60,现在网上实现的形式多种多样如结合移动139邮箱,即1分钟
  /,然后等待下一次检测完成。
  define serviceescalation{
  host_name WWW-Server /:从第4条告警信息起至服务器恢复前:
  1:NONE:被监控项达到max_check_attempts最大次数后的非正常状态:DOWN。下面就着重讲义下这几个参数:(新版本不存在这个文件)
  normal_check_interval 表示重新检测的时间间隔.X中使用
  retry_check_interval 重试时间
  max_check_attempts 这个是出现故障的连接次数,同时将告警信息发送至指定联系人:RECOVERY:
  notifications_enabled,尤其是它的告警功能,直接进入软态(1/:
  service中有定义notifications_enabled=1,切换为retry_interval和max_check_attempts进行监控,而是一次  /

nagios 怎么监控sqlserver


1、下载需要的插件并安装
wget http://labs.consol.de/download/shinken-nagios-plugins/check_mssql_health-1.5.19.1.tar.gz
安装:check_mssql_health
tar zxvf check_mssql_health-1.5.19.1.tar.gz
cd check_mssql_health-1.5.19.1
./configure -–with-nagios-user=nagios -–with-nagios-group=nagcmd–-prefix=/usr/local/nagios/
make
make install
2、安装与sqlserver通信需要的软件
1、安装freetds
安装包:freetds-0.91.tar.zip
unzip freetds-0.91.tar.zip
tar zxvf freetds-0.91.tar.gz
cd freetds-0.91
./configure –prefix=/usr/local/freetds–with-tdsver=8.0 –enable-msdblib
make && make install
2、设置环境变量并安装freetds-dev、libdbd-freetds
vim /etc/profile 添加如下行
export SYBASE=/usr/local/freetds
source /etc/profile 让配置立即生效
echo “/usr/local/freetds/lib/” 》/etc/ld.so.conf.d/freetds.conf
/sbin/ldconfig
apt-get install freetds-dev libdbd-freetds
3、安装DBI
tar zxvf DBI-1.627.tar.gz
cd DBI-1.627
perl Makefile.PL
make
make test (测试是否正确可不测试)
make install
4、安装DBD-Sybase
tar zxvf DBD-Sybase-1.15.tar.gz
cd DBD-Sybase-1.15
perl Makefile.PL
make
make test
make install
5、修改配置文件
vim /usr/local/freetds/etc/freetds.conf
[global]
; tds version = 8.0
; dump file =/tmp/freetds.log
; debug flags = 0xffff
# command andconnection timeouts
; timeout = 10
; connect timeout = 10
# If you getout-of-memory errors, it may mean that your client
# is trying toallocate a huge buffer for a TEXT field.
# Try setting ’textsize’ to a more reasonable limit
text size = 64512
[231sql]
host =192.168.10.231
port = 1433
tds version = 8.0
6、测试
cd /usr/local/nagios/libexec
./check_mssql_health -server 231sql -usernagios -password nagios -mode list-databases
显示如下:
ReportServer
ReportServerTempDB
TSNRReportGuest
master
model
msdb
tempdb
OK - have fun (成功)

如何用nagios实时监控crontab这样的定时服务


  可以考虑让这个程序,每次执行成功后,都写一下时间戳到一个特定文件。
然后自己写一个plugins去检查这个时间戳文件,如果最后一个时间戳文件距离现在系统时间超过设定的时间(比如一个小时),就发告警(warning或者critical)。

请问监控通道列表怎么配置


1,安装NSClient++

访问

接着编辑# vi /usr/local/nagios/etc/objects/windows.cfg

6,找到并设置监控的服务器:

7,接下来搜索各种监控的服务并设置:

8,部署好之后在Nagios中显示如下:


Nagios监测Windows服务器的一个指定进程,要怎么实现


Windows服务器的监控方式有三种,分别为Agent监测方式、SNMP监测方式和WMI监测方式,下面分别对每一种监测方式进行介绍:
Agent监测方式
使用Agent方式来采集数据,首先需要在被监测服务器上安装Windows Agent代理程序,安装过程请参考安装Agent代理。
1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮,再点击左下方的【设备管理】。右键点击【设备管理】树下的【设备列表】,弹出菜单。
(也可在设备列表的空白处【图标视图】和【详细信息】中右键选择【增加管理对象】或在快速工具栏中点击【增加管理对象】,下同)
2、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下看到“AgentWindows”。
选中上图中的【AgentWindows】,点击【确定】,弹出【AgentWindows】对话框,如下图所示(也可左键双击【AgentWindows】弹出下面对话框)。
3、在“基本设置”栏下进行设置:
Windows服务器地址:输入被监测的服务器的IP地址
Agent端口号:Agent端口,默认为2198
标题:填写显示的标题,可以自己定义
是否禁止:禁止则不进行监测
监测服务器:默认即可
4、在“高级设置”栏可以对该管理对象进行详细描述以及设置依靠条件,如下图:
依靠:从下拉列表中选择要依靠的监测点,可以设置多个监测点依靠。
描述:填写对该设备的简单描述,可以不填写。
5、“基本设置”和“高级设置”填写完毕,点击【确定】即可,弹出显示正在获取管理对象属性提示框。如果获取正常,就会弹出【配置监测点】对话框。
勾选要监测的选项后,点击右边的【确定】即可,Agent监测方式添加完成。添加完成后,在【设备管理】的树下和设备列表的图标视图中都会有添加的设备显示。
SNMP监测方式
注意:如果采用SNMP方式监控,请检查远程机器的SNMP协议是否打开 。
1、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。
再点击左下方的【设备管理】,如下图所示:
2、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:
3、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“SNMP Windows”,点击【确定】,如下图所示:
4、选择“SNMP Windows”,点击【确定】后,弹出如下图所示对话框:
5、“基本设置”选项卡:
Windows服务器IP:填写被监测服务器的IP地址
SNMP端口号:填写SNMP的端口号
可读共同体名称:填写SNMP的可读共同体名称
标题:填写显示的标题
监测服务器:默认即可
6、“高级设置”选项卡:
该选项卡中的设置和Agent中的设置相同。
点击【确定】后,SNMP Windows的监测方式添加完成。添加完成后在设备管理中设备列表下和右侧【设备列表】的图标视图中都会有该设备。
WMI监测方式
注意:如果用WMI方式,需要安装WMI和服务
1、用WMI方式监测,需要将CreCloud Task Server 服务改为用管理员用户启动。
CreCloud Task Server 服务右键“属性”,选择“登录”选项卡
登录帐户选择“此帐户”,点击“浏览”按钮,弹出“选择用户”窗口
点击“高级”按钮后,点击“一般性查询”右侧的“立即查找”按钮,在下方查询结果中选择“Administartor”用户后确定
返回到属性窗口,点击确认,并重启CreCloud Task Server服务
2、登录CreCloud云网管平台后,点击系统右上方的【监测】按钮。
再点击左下方的【设备管理】,如下图所示:
3、右键点击【设备管理】树下的【设备列表】,弹出菜单,如下图所示:
4、选择【增加管理对象】,弹出【添加管理对象】对话框,在【全部设备】下选择设备类型为“WMI Windows”,点击【确定】,如下图所示:
点击【确定】后,弹出如下图对话框:
5、“基本设置”选项卡
Windows服务器IP:填写被监测的服务器的IP地址
登录名:填写被监测的服务器的系统管理员名称
登陆密码:填写被监测服务器的系统管理员密码
标题:填写显示的标题
6、“高级设置”选项卡中设置和以Agent、SNMP方式中的设置相同。
7、点击【确定】后,WMI Windows的监测方式添加完成,完成后会在设备管理中设备列表下和右侧【设备列表】的图标视图中都会有该设备。

如何使用Nagios监控Cisco交换机硬件及运行状态


系统环境:Nagios3.x+CentOS5.6+Cisco4500前提条件:1.Cisco交换机都支持SNMP协议,只需要简单的设置即可开启,例如:snmp-servercommunitysnmppwRO。更加详细的设置请使用Google搜索“Cisco开启SNMP”,参考网上相关文章。2.在安装Nagios之前,必须已经安装Net-Utils及其开发组件。成功安装Nagios之后,再次检查libexec目录下有check_snmp命令。系统测试:check_snmp命令提供了详细的使用说明,只需要在Linux命令行输入check_snmp–help即可查看帮助信息,这其中包括每一项参数的使用等。这里以检测Cisco交换机的系统为例,示范如何使用check_snmp。交换机为Cisco4500系列,系统描述的OID为.1.3.6.1.2.1.1.1.0[root@wardkinglibexec]#./check_snmp-H10.241.10.1-o.1.3.6.1.2.1.1.1.0-CsnmppwSNMPOK–“CiscoIOSSoftware,Catalyst4500L3SwitchSoftware(cat4500-ENTSERV|K9-M),Version12.2(53)SG2,RELEASESOFTWARE(fc1)建议用于Nagios监控的OID:系统内存使用(5分钟内)1.3.6.1.4.1.9.9.48.1.1.1.5.1系统可用内存(5分钟内)1.3.6.1.4.1.9.9.48.1.1.1.6.1CPU使用率(5分钟内)1.3.6.1.4.1.9.2.1.58.0硬件状态1.3.6.1.4.1.9.9.13系统配置:由于使用check_snmp检测的结果不够人性化,大部分的结果都需要重新调整。使用Perl脚本调用NET::SNMP模块,实现收集监控结果,并重新输出,更易阅读和使用。这里引用4个从国外网站收集的脚本,check_snmp_env,check_snmp_cisco_memutil,check_snmp_cisco_loadavg,check_snmp_cisco_ifstatus请下载至nagios安装目录下的libexec子目录中,例如/usr/local/nagios/libexec,重命名去掉txt扩展名,赋予可执行权限:[root@nagioslibexec]#pwd/usr/local/nagios/libexec[root@nagioslibexec]#chmoda+xcheck_snmp_cisco_*check_snmp_env-vmodeof`check_snmp_cisco_ifstatus’retainedas0755(rwxr-xr-x)modeof`check_snmp_cisco_loadavg’retainedas0755(rwxr-xr-x)modeof`check_snmp_cisco_memutil’retainedas0755(rwxr-xr-x)modeof`check_snmp_env’retainedas0755(rwxr-xr-x)剩下的工作就是follow标准流程设置监控命令,添加被监控的交换机和服务了。编辑etc/objects/command.cfg,添加如下定义:#CheckCisco,ExtremeandJuniperhardwaredefinecommand{command_namecheck_snmp_envcommand_line$USER1$/check_snmp_env-H$HOSTADDRESS$-C$ARG1$$ARG2$}#CiscoSNMPdevicemonitoringdefinecommand{command_namecheck_snmp_cisco_memcommand_line$USER1$/check_snmp_cisco_memutil-H$HOSTADDRESS$-C$ARG1$-w$ARG2$-c$ARG3$}definecommand{command_namecheck_snmp_cisco_cpucommand_line$USER1$/check_snmp_cisco_loadavg-H$HOSTADDRESS$-C$ARG1$-w$ARG2$-c$ARG3$}definecommand{command_namecheck_snmp_cisco_ifcommand_line$USER1$/check_snmp_cisco_ifstatus-H$HOSTADDRESS$-C$ARG1$-i$ARG2$-w$ARG3$-c$ARG4$}编辑switch.cfg加入监控的交换机配置,新增相关系统服务,例如:defineservice{usegeneric-service;Inheritvaluesfromatemplatehost_nameCAT4506E_B1_LG3_1,CAT4506E_B3_A09L_1,CAT4507R_B5_A09R_1,CAT4507R_B1_LG3_1,CAT4507R_B5_D12_1,RackSW_PDC_1,RackSW_PDC_2,RackSW_PDC_3,RackSW_PDC_4,RackSW_SDC_2,RackSW_SDC_3service_descriptionEnvironmentcheck_commandcheck_snmp_env!snmppw}defineservice{usegeneric-service;Inheritvaluesfromatemplatehost_nameCAT4507R_B5_D12_1,CAT4507R_B1_LG3_1,CAT4506E_B1_LG3_1,CAT4506E_B3_A09L_1,CAT4507R_B5_A09R_1service_descriptionLoadAVGcheck_commandcheck_snmp_cisco_cpu!snmppw!60!80}defineservice{usegeneric-service;Inheritvaluesfromatemplatehost_nameCAT4507R_B5_D12_1,CAT4507R_B1_LG3_1,CAT4506E_B1_LG3_1,CAT4506E_B3_A09L_1,CAT4507R_B5_A09R_1service_descriptionMemutilcheck_commandcheck_snmp_cisco_mem!snmppw!70!90}

Nagios监控路由器,交换机,这些设备需要配置么怎么配置


看监控什么内容,ip总是要配置的。如果需要监控对象配合的,就需要配置,比如通过snmp读取监控对象的信息,监控对象就要设置好snmp,让nagios能通过snmp读取。如果不需要监控对象配合的,就不需要额外配置什么,比如用ping 测试设备是否在线。

nagios是怎样监控的,怎么监控客户端的,需要安装什么,nagios监控的原理是什么


/usr/local/nagios/etc/nagios.cfg: interval_length 表示时间单位,默认为60,即1分钟 /usr/local/nagios/etc/objects/services.cfg:(新版本不存在这个文件) normal_check_interval 表示重新检测的时间间隔,默认为3个时间单位 check_interval 。

如何借助Nagios监测常用服务


Nagios随带一大批的内置脚本用于监测服务。本教程将探讨使用其中一些脚本来检查常用服务的过程,比如MySQL、Apache Web服务器和DNS等服务。
为了让本文着重介绍服务监测这方面,我们不会配置主机组(hostgroup)或模板,因为它们在前一篇教程中已有介绍(详见
root@nagios:~# vim /etc/nagios3/conf.d/services_nagios2.cfg
## Nagios要求server-3为google.com解析IP ##
define service{
use generic-service
host_name test-server-3
service_description Check DNS
check_command check_dns
}
## Nagios要求server-3挖掘google.com ##
define service{
use generic-service
host_name test-server-3
service_description Check DNS via dig
check_command check_dig!www.google.com
}

如何做好运维监控

监控是运维工作的基础和上机操作必要条件。有些金融机构允许登入生产的条件是ITIL有流程任务到达,或者监控有告警,否则一律不会允许登入生产。

运维监控首先要有好的监控工具,常用的开源工具有:zabbix、nagios、cavti、open falcon、ganglia,以及现在和容器融合度较高的普罗米修斯。可以baidu各类产品选择自己适合的。有很多厂家也做一些监控,大多是集合一些开源产品,再加一些接口调用,最后弄个页面展示。

发展初期,可以选用开源软件比较好,上手快、社区支持多、成本低。随着服务器增加建议增加个性化定制,因为无论哪款监控都会随之产生n多告警信息,会将有用信息沉没在消息群中。

监控需要定制的内容有:告警关联、告警分析、告警收敛、告警过滤、告警追溯、告警自愈。辅助技能为自动化和智能化控制。

监控过去方式无非两种:主动拉取、被动接收。前者可以执行各类脚本、SQL语句、调用接口等查询;后者可以提供告警系统api供外围系统调用。

监控有些需要在被监控设备安装agent,有些不需要;具体操作看单位生产管理规范,有些公司不允许安装额外agent在业务系统服务器中。

最后,强调一点:监控要和ITIL平台相结合,达到告警后的流程联动。