A. 智能运维纲要
概述
优势
大量的数据
具体的业务场景
条件
行业领域知识
算法知识:三个层面
独立模块
需要依赖于其他算法的
系统性问题
运维场景领域知识
工程挑战
没有高质量的标签数据
历史
手工运维
自动化运维
开发运维
智能运维
能力等级
尝试应用
单点应用
串联应用
能力完备
终极AIOps
AIOps构建思路
原子场景
相似场景或者相同场景平台化
不同类似场景的串联
更高级场景的串联,真正的AIOps
AIOps建模服务能力
数据输入
用户数据
样本库
数据准备
SQL/表达式
代码编辑
分组
关联
分支路由
算法库
特征工程
机器学习
深度学习
时间序列
文本处理
模型构建工具
效果评估
统计分析
数据探索
参数调优
模型选择
计算任务调度管理工具
实时任务
离线任务
API调用任务
交互式任务/交互式引擎
AI模型应用
离线应用
实时应用
API调用应用
常见应用场景
效率提升方向
智能变更
智能问答
智能决策
容量预测
质量保障方向
异常检测
故障诊断
故障预测
故障自愈
报警过滤
成本管理方向
成本优化
资源优化
弹性伸缩
容量规划
性能优化
常见解决方案
数据采集
硬件资源采集
业务数据采集
日志
服务状态
性能跟踪
数据存储
时序数据:时序数据库,例如 OpenTSDB
日志:分布式搜索引擎,例如 ElasticSearch
数据分析
异常检测
日志分析
日志标准化
日志事件提取
指标异常检测
根因分析
模糊逻辑推理
故障预测
模糊逻辑推理
预测算法
关联业务
报表系统
自动化测试平台
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/293523.html