运维监控平台介绍
1.zabbix
运维平台
官方网址:
https://www.zabbix.com/
平台介绍:
目前最新版本为6.2, Zabbix6.2
专注于通过一系列主要的 UI/UX
改进、新项和配置选项,以及针对中型和大型部署的性能改进,为新用户和有经验的用户改善用户体验。
它是一个基于 WEB
界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
zabbix
能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的通知机制以让系统管理员快速定位和解决存在的各种问题。
zabbix
主要由 2部分
构成, zabbix server
与可选组件 zabbix agent
。 zabbix server
可以通过 SNMP
, zabbix agent
, ping
,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能。
2.nagios
运维平台
官方网址:
https://www.nagios.org/
平台介绍:
目前最新版本为 XI
, NagiosXI
提供对所有关键任务基础设施组件的监控,包括应用程序、服务、操作系统、网络协议、系统指标和网络基础设施。数百个第三方插件提供了对几乎所有内部和外部应用程序、服务和系统的监控。
它是一款开源的免费网络监视工具,能有效监控 Windows
、 Linux
和 Unix
的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
3.cacti网络流量监测工具
官方网址:
https://www.cacti.net/
平台介绍:
目前, cacti
最新版为 Release1.2.22
。它是一套基于 PHP
、 MySQL
、 SNMP
及 RRDTool
开发的网络流量监测图形分析工具。
Cacti
为世界各地的用户提供了一个健壮且可扩展的操作监控和故障管理框架。也是一个完整的网络绘图解决方案,旨在利用 RRDTool
的数据存储和绘图功能。
Cacti
包括一个完全分布式和容错的数据收集框架、设备、图形和树的高级基于模板的自动化功能、多种数据采集方法、通过插件扩展的能力、基于角色的用户、组和域管理功能以及主题引擎和多语言支持。
所有这些都封装在一个直观、易于使用的界面中,对于局域网大小的安装,甚至有成千上万台设备的复杂网络都有意义。
4.Grafana
运维平台
官方网址:
https://grafana.com/
平台介绍:
目前, Grafana
最新版本为 9.0
。
Grafana
允许您查询、可视化、警报和了解您的指标,无论它们存储在哪里。创建、探索并与团队共享漂亮的仪表盘,并培养数据驱动的文化。
最简单的入门方法是使用 GrafanaCloud
,这是我们完全可组合的可观测性堆栈。
5.Centreon
运维平台
官方网址:
https://www.centreon.com/en/
平台介绍:
目前, Centreon
最新版为 22.10
。
Centreon
是一款开源且功能强大的分布式IT监控系统,它通过第三方组件可以实现对网络、操作系统和应用程序的监控。
我们可以通过 Centreon
管理和配置 nagios
,通过 Centreon
提供的 Web
配置界面,可以轻松完成 nagios
的各种封复杂配置。
6.Ganglia运维平台
官方网址:
http://ganglia.info/
平台介绍:
目前, Ganglia
最新版本为 GangliaWeb3.7.2
。
Ganglia
是一个可扩展的分布式监控系统,用于集群和网格等高性能计算系统。它基于针对集群联合的分层设计。它利用了广泛使用的技术,如用于数据表示的 XML
、用于紧凑、可移植数据传输的 XDR
以及用于数据存储和可视化的 RRDtool
。它使用精心设计的数据结构和算法来实现极低的每节点开销和高并发性。该实现是健壮的,已移植到一组广泛的操作系统和处理器架构,目前在全球数千个集群上使用。它已被用于连接大学校园和世界各地的集群,并可扩展到处理具有2000个节点的集群。
Ganglia
是一个 BSD
许可的开源项目,由加州大学伯克利分校千年项目发展而来。
它可以监视和显示集群中的节点的各种状态信息,它由运行在各个节点上的 gmond
守护进程来采集 CPU
、内存、硬盘利用率、 I/O
负载、网络流量情况等方面的数据,然后汇总到 gmetad
守护进程下,使用 rrdtool
存储数据,最后将历史数据以曲线方式通过 PHP
页面呈现。
7.Prometheus
官方网址:
https://prometheus.io/
平台介绍:
目前, Prometheus
最新版为 2.39.1
。
Prometheus
是一个开源系统监控和警报工具包,最初在 SoundCloud
构建。自 2012
年成立以来,许多公司和组织都采用了普罗米修斯,该项目拥有非常活跃的开发者和用户社区。它现在是一个独立的开源项目,独立于任何公司进行维护。为了强调这一点,并澄清项目的治理结构,普罗米修斯于 2016年
加入云原生计算基金会,成为继 Kubernetes
之后的第二个托管项目。
Prometheus
收集并将其度量作为时间序列数据存储,即度量信息与记录时间戳一起存储,并与称为标签的可选键值对一起存储。
8.Zenoss
运维平台
官方网址:
https://www.zenoss.com/
平台介绍:
ZenossCore
是开源企业级IT管理软件-是智能监控软件,它允许 IT管理员
依靠单一的 WEB
控制台来监控网络架构的状态和健康度。
ZenossCore
同时也是开源的网络与系统管理软件。
Zenoss
提供功能丰富的产品,以监测整个 IT
基础设施:
- 网络 – 路由器,交换机,防火墙,接入点
- 服务器 – 微软的
Windows
、Linux
、Unix
、惠普
、NetApp
、戴尔
- 虚拟化 – 完整虚拟机虚拟化基础架构管理,
XenSource
监测 - 应用领域 – Process(程序),Port,网络应用服务, Web服务,数据库,中间件。
2
IT运维监控平台选型
1.中小企业监控平台首选 Zabbix
对于服务器在500台以下的企业来说, zabbix
是最佳的选择。
Zabbix
是一款综合了数据收集、数据展示、数据提取、监控报警配置、用户展示等方面的一款综合运维监控平台。
Zabbix
功能很强大,是一个可以迅速用起来的监控软件,能够满足中小企业的监控报警需求,因此是中小型企业运维监控的首选平台。
2.互联网海量服务器监控平台推荐 Ganglia+Centreon
对于互联网大企业监控平台推荐 Ganglia+Centreon
。
推荐 ganglia
是因为ganglia客户端软件对服务资源占用非常低,并且扩展插件非常多,监控扩展也非常容易,同时结合专业的 web
监控平台 centreon
,可以实现在数据收集、数据展示、数据提取、监控报警配置、用户展示等方面的完美配合。
3.云环境监控平台组合 prometheus+grafana
在云环境下,采用 prometheus+grafana
组合实现数据采集和展示,同时grafana完美的呈现效果,是实现大屏最好的解决方案。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/302681.html