智能运维
-
自动化运维体系如何入手
1 需求 运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手? 其实前期…
-
《SRE实战手册》学习笔记
SRE背景 背景:互联网行业不断发展; 目的:提升用户价值交付效率; 措施:积极采用微服务、容器化及其他分布式技术产品,并且积极引入DevOps之类的先进理念; 优势:交付效率提升巨大; 挑战:复杂系统架构的稳定…
-
云原生背景下的运维价值思考与实践
前言 随着公司自研上云战略如火如荼地进行,IEG-增值服务部作为较早一批响应的团队,截止目前自研上云已完成1/3的流量切换,日PV超百亿。切云的服务大量采用了云原生的应用与技术架构,作为公司第一批面临云原生环…
-
从0构建 SRE 运维体系
前言:该文章为 19 年 Ernese Norelus 发表在 medium 上的 Building SRE from Scratch,现在看来也依然不会觉得过时,一起再来回顾一下。 首先从一张构建 SRE 体系图开始,从为什么构建 SRE、SRE 目标以及如何实现 …
-
《Google SRE 工作手册》阅读笔记
SRE 与 DevOps 的关系 站点可靠性工程师(SRE)是 Google 工程副总裁 Ben Treynor Sloss 创造的术语。DevOps 是一种理念和工作方法,SRE 是 DevOps 的实现,比 DevOps 更具体、更清晰。 DevOps 核心思想 运维和开发…
-
运维管理与运维自动化
1 运维工作有哪些? 1.基础设施,包括网络、服务器、操作系统等工作; 2.环境管理,包括开发环境、测试环境、生产环境等; 3.部署,将应用或系统部署至不同环境; 4.监控,对基础设施、应用或系统进行监控; 5.告警响…
-
2023年DevOps工程师和SRE RoadMap
在2023年成为DevOps工程师和SRE(系统可靠性工程师)的图文并茂的指南,并链接到相关课程 DevOps和SRE目前非常热门,我认识的大多数朋友、同事和高级开发人员都在努力成为一名DevOps工程师,并在他们的组织中把自己…
-
去工具化/脚本化理解,自动化运维落地最佳实践之业务/架构/模型/方法
1. 关键术语 1.1 CMDB,配置管理 CMDB(Configuration Management Database)即面向应用的配置管理数据库,通过识别、控制、维护,检查企业的IT资源,从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它IT服…
-
SRE Google运维解密
读《SRE Google运维解密》是我首次比较系统地了解和学习Google内部SRE运作的指导思想、实践以及相关问题,最近又花了一些时间,仔细阅读了关于SRE的第二本书籍《SRE生存指南》。 《SRE Google运维解密》与《SRE生存…
-
自动化运维体系建设 19 个具体难点问题解析
一、企业自动化运维体系建设的目标和方向 Q1、自动化运维体系建设的目标和意义是什么?@wh85: 一般一个信息系统项目的发起或产生有两种方式:自上而下由管理层发起,自下而上由员工发起。而许多企业自动化运维平台…