随笔记录

  • 微服务的全链路监控 

    微服务的全链路监控  1.什么是全链路监控? 在分布式微服务架构中,系统为了接收并处理一个前端用户请求,需要让多个微服务应用协同工作,其中的每一个微服务应用都可以用不同的编程语言构建,由不同的团队开发,并…

    2022年11月27日
  • 大规模微服务单元化与高可用设计,都是7*24小时不间断运行?

    说到大规模微服务系统,往往是一些7*24时不间断运行的在线系统,这样的系统往往有以下的要求: 第一,高可用。这类的系统往往需要保持一定的SLA的,7*24时不间断运行不代表完全不挂,而是有一定的百分比的。例如我…

    随笔记录 2022年11月27日
  • 智能时代下的运维

    智能运维系列(一)| AIOps 的崛起与实践 运维发展和各种技术更新是密不可分的,也是各种技术重要的实验田。 作者 : 王雅琪 策划: 陈思 2020-06-24  13648 智能运维系列(二)| 智能化监控领域探索 本文将介绍微众…

    2022年11月27日
  • Prometheus 监控实战(三):Prometheus 架构

    很久以前,加利福尼亚州山景城有一家名为 Google 的公司。该公司推出了大量产品,其中最著名的是广告系统和搜索引擎平台。为了运行这些不同的产品,该公司建立了一个名为 Borg 的平台。Borg 系统是:“一个集群管理…

    2022年11月27日
  • Prometheus 监控实战(二):监控方法论与报警通知

    任何服务都离不开监控系统,对于管理维护服务的组织来说,监控是必备技能之一。近几年来,容器化、微服务、云原生等方式成为流行的现代架构思想,这给监控系统带来了不小的挑战。具体来说,监控系统需要在动态的云…

    2022年11月26日
  • Prometheus 监控实战(一):监控机制

    任何服务都离不开监控系统,对于管理维护服务的组织来说,监控是必备技能之一。近几年来,容器化、微服务、云原生等方式成为流行的现代架构思想,这给监控系统带来了不小的挑战。具体来说,监控系统需要在动态的云…

    随笔记录 2022年11月26日
  • 字节跳动大规模K8s集群管理实践

    5月31日,CSDN云原生系列在线峰会第6期“K8s大规模应用和深度实践峰会”正式举办,火山引擎资深云原生架构师李玉光在活动中为广大观众解析了《字节跳动大规模K8s集群管理实践》。本文基于演讲内容整理。 字节跳动云原…

    2022年11月26日
  • AIOps智能监控在阿里巴巴故障管理工作中的成功实践

    如何孵化具有AIOps能力的产品? 1.搭建AIOps需要哪些部分? 阿里巴巴负责智能运维化产品开发的GOC团队认为AIOps系统的架构应为场景,算法,数据三位一体的架构。上图罗列出了一些GOC团队构建AIOps系统所用的技术。…

    2022年11月26日
  • 智能运维 VS 传统运维|AIOps服务管理解决方案全面梳理

    云智慧 AIOps 社区是由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们共同…

    2022年11月26日
  • 监控自动化-自动添加业务机器

    现在有这样一个需求,公司采购了100台主机,并且需要监控这100台主机,这个工作量有点大。如果真是一台一台的去弄的话,最近这一两天就什么都别做了,而且效率还低。我们可以把这100台连好网络,在部署系统的过程中…

    2022年11月26日