随笔记录
-
规模化敏捷SAFe大图更新至5.1
数字世界正在以日新月异的速度变化,规模化敏捷框架SAFe持续发展,以帮助组织实现业务敏捷性。SAFe的特点正是其与新的和不断发展的业务和技术趋势保持同步。增量模型和连续交付模型使企…
-
SAFe 5.0介绍(一)- SAFe全景图
不论是SA的CSM课程还是PMI的ACP课程,更多讲的都是one team的敏捷,或者说是one team的Scrum,如果你学过这些课程的话,你肯定也知道,one team的人数…
-
智能运维系列(十四)| 人与技术相结合的异常管理实践
一个异常事件的生命周期包含发现阶段、处理及恢复阶段和总结回顾阶段,每个阶段都有对应的管理要求: 发现阶段需要快速识别异常事件并通报给关联人员;处理及恢复阶段需要实时监控异常影响并进…
-
智能运维系列(十三)| 面向智能化运维的 CMDB 系统构建
构建 CMBD 系统的三个阶段 1.CMDB1.0 所面临的痛点 在 2015 年微众银行成立之初,微众银行构建了 CMDB1.0。CMDB1.0 吸取了开源项目 oneCmdb …
-
智能运维系列(十二)| 智能运维的四大挑战和应对之道
微众银行的 RCA 项目组成立了一年多,一直围绕着异常识别及根因定位开展工作,并以异常识别准确率和根因定位准确率作为最重要的衡量指标。经过这一年多的努力,异常识别准确率从最初每个月…
-
智能运维系列(十一)| 日志文本异常聚类及相似度检测
互联网公司在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将各系统的运行日志记录在文件中,从而方便排查和定位问题,是目前普遍采用的做法。 但是,在实际应用过程中,日…
-
智能运维系列(十)| 浅析根因告警的系统分析法
原始证据收集 收集原始证据是根因告警分析的第一步。异常事件发生时,系统立即启动证据收集任务,从告警列表中搜集异常开始前一段时间内(当前为 5 分钟)的记录,以保证告警与异常有充分的…
-
智能运维系列(九)| 基于交易树的根因告警定位方法
“告警定位”简简单单四个字,想要做好却不是一件容易的事情。每一条告警,都会包含相应的告警级别(根据程度分为 critical, major, minor, warning),告警类…
-
Python爬虫项目整理
WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。 DouBanS…
-
智能运维系列(八)| 事件指纹库:构建异常案例的“博物馆”
历史事件对比流程 当前智能运维中的根因定位大多从某一个具体和方面入手去推断异常,如日志的根因定位,未能做到宏观的比较。然而,现实中的异常需要分析的维度非常广,包括且不限于告警、接口…