随笔记录
-
Prometheus 监控实战(三):Prometheus 架构
很久以前,加利福尼亚州山景城有一家名为 Google 的公司。该公司推出了大量产品,其中最著名的是广告系统和搜索引擎平台。为了运行这些不同的产品,该公司建立了一个名为 Borg 的…
-
Prometheus 监控实战(二):监控方法论与报警通知
任何服务都离不开监控系统,对于管理维护服务的组织来说,监控是必备技能之一。近几年来,容器化、微服务、云原生等方式成为流行的现代架构思想,这给监控系统带来了不小的挑战。具体来说,监控…
-
Prometheus 监控实战(一):监控机制
任何服务都离不开监控系统,对于管理维护服务的组织来说,监控是必备技能之一。近几年来,容器化、微服务、云原生等方式成为流行的现代架构思想,这给监控系统带来了不小的挑战。具体来说,监控…
-
字节跳动大规模K8s集群管理实践
5月31日,CSDN云原生系列在线峰会第6期“K8s大规模应用和深度实践峰会”正式举办,火山引擎资深云原生架构师李玉光在活动中为广大观众解析了《字节跳动大规模K8s集群管理实践》。…
-
AIOps智能监控在阿里巴巴故障管理工作中的成功实践
如何孵化具有AIOps能力的产品? 1.搭建AIOps需要哪些部分? 阿里巴巴负责智能运维化产品开发的GOC团队认为AIOps系统的架构应为场景,算法,数据三位一体的架构。上图罗列…
-
智能运维 VS 传统运维|AIOps服务管理解决方案全面梳理
云智慧 AIOps 社区是由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播 AIOps 技术,旨在与各行业…
-
监控自动化-自动添加业务机器
现在有这样一个需求,公司采购了100台主机,并且需要监控这100台主机,这个工作量有点大。如果真是一台一台的去弄的话,最近这一两天就什么都别做了,而且效率还低。我们可以把这100台…
-
智能监控运维管理平台(智能监控平台系统)
本篇文章给大家谈谈智能监控运维管理平台,以及智能监控平台系统对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享智能监控运维管理平台的知识,其中也会对智能监控平台…
-
运维监控体系总结
运维监控体系总结 总结归纳运维工作中的监控内容。 监控目标 明白监控的重要性以及使用监控要实现的业务目标 通常包括以下三点: 对目标系统进行实时监控 监控可以实时反馈目标系统的当前…
-
17个精心准备的开源运维监控系统
监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。监控系统作为一个成熟的运维产品,业界有很多开源的实现可供选择。…