随笔记录
-
智能运维新突破:国内首现改良算法在根因分析中的应用
随着人工智能、大数据等前沿技术的发展,传统运维业务也面临着变革,如何利用这些技术切实提升运维效率成为亟需考虑的问题。 本文基于目前运维领域普遍存在的业务痛点,研究智能运维在证券行业…
-
智能运维系列(十)| 浅析根因告警的系统分析法
原始证据收集 收集原始证据是根因告警分析的第一步。异常事件发生时,系统立即启动证据收集任务,从告警列表中搜集异常开始前一段时间内(当前为 5 分钟)的记录,以保证告警与异常有充分的…
-
微众银行大数据平台建设方案
15 人赞同了该文章 微众银行在建立之初,就已经明确了整套分布式自主可控架构方案的核心,即在核心交易系统上,从“两地三中心”的主备架构,发展到现在的“三地八中心、多中心多活”的架构…
-
微众银行智能运维系列| 面向智能化运维的CMDB系统构建(十三)
智能运维系列专题简介:智能运维(AIOps),根据Gartner的最新阐释,意指整合大数据和机器学习能力,通过松耦合、可扩展方式去提取和分析数据量(volume)、种类(varie…
-
微众银行AIOps智能运维系列| 浅析根因告警的系统分析法(十)
智能运维系列专题简介:智能运维(AIOps),根据Gartner的最新阐释,意指整合大数据和机器学习能力,通过松耦合、可扩展方式去提取和分析数据量(volume)、种类(varie…
-
Prometheus 监控体系
1 概述 1.1 主要功能 多维 数据模型(时序由 metric 名字和 k/v 的 labels 构成)。 灵活的查询语句(PromQL)。 无依赖存储,支持 local 和 r…
-
大规模 Spring Cloud 微服务无损上下线探索与实践
“从一次常见的发布说起,在云上某个系统应用发布时,重启阶段会导致较大数量的 OpenAPI、上游业务的请求响应时间明显增加甚至超时失败。随着业务的发展,用户数和调用数越来越多,该系…
-
大规模微服务单元化与高可用设计,都是7*24小时不间断运行?
说到大规模微服务系统,往往是一些7*24时不间断运行的在线系统,这样的系统往往有以下的要求: 第一,高可用。这类的系统往往需要保持一定的SLA的,7*24时不间断运行不代表完全不挂…
-
微服务的全链路监控
微服务的全链路监控 1.什么是全链路监控? 在分布式微服务架构中,系统为了接收并处理一个前端用户请求,需要让多个微服务应用协同工作,其中的每一个微服务应用都可以用不同的编程语言构建…
-
监控体系建设(完整)
近年来,随着计算机技术的飞速发展,以及行业信息的共享,传统企业的运维己不再是固步自封,日新月异的计算技术的发展推动企业云平台的建设,云平台的计算能力为大数据分析提供了基础、云平台与…