智能运维
-
云端的SRE发展与实践
本文根据作者在美团点评第21期技术沙龙的分享记录整理而成。 SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运…
-
运维规范如何生成?
1 运维框架 https://cloud.tencent.com/developer/article/2303903 运维管理与运维自动化一文中我们从运维工作中提取了运维框架(红色…
-
从零开始构建 SRE 介绍站点可靠性工程 (SRE) 以及如何在系统扩展时监控和保持系统快速可靠。
作者:Ernese Norelus 和 Erhan Saygi 从头开始构建 SRE。站点可靠性简介… |作者:厄内斯·诺雷勒斯 |中等 (medium.com) 图 …
-
自动化运维体系如何入手
1 需求 运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应…
-
《SRE实战手册》学习笔记
SRE背景 背景:互联网行业不断发展; 目的:提升用户价值交付效率; 措施:积极采用微服务、容器化及其他分布式技术产品,并且积极引入DevOps之类的先进理念; 优势:交付效率提升…
-
云原生背景下的运维价值思考与实践
前言 随着公司自研上云战略如火如荼地进行,IEG-增值服务部作为较早一批响应的团队,截止目前自研上云已完成1/3的流量切换,日PV超百亿。切云的服务大量采用了云原生的应用与技术架构…
-
从0构建 SRE 运维体系
前言:该文章为 19 年 Ernese Norelus 发表在 medium 上的 Building SRE from Scratch,现在看来也依然不会觉得过时,一起再来回顾一下…
-
《Google SRE 工作手册》阅读笔记
SRE 与 DevOps 的关系 站点可靠性工程师(SRE)是 Google 工程副总裁 Ben Treynor Sloss 创造的术语。DevOps 是一种理念和工作方法,SRE…
-
运维管理与运维自动化
1 运维工作有哪些? 1.基础设施,包括网络、服务器、操作系统等工作; 2.环境管理,包括开发环境、测试环境、生产环境等; 3.部署,将应用或系统部署至不同环境; 4.监控,对基础…
-
2023年DevOps工程师和SRE RoadMap
在2023年成为DevOps工程师和SRE(系统可靠性工程师)的图文并茂的指南,并链接到相关课程 DevOps和SRE目前非常热门,我认识的大多数朋友、同事和高级开发人员都在努力成…