智能化运维是什么?

Gartner定义的AIOps平台拥有11项能力,这些能力算是对智能化运维的概念描述:

包括历史数据管理(Historical data management)

流数据管理(Streaming data management)

日志数据提取(Log data ingestion)

网络数据提取(Wire data ingestion)

算法数据提取(Metric data ingestion)、文本和NLP文档提取(Document text ingestion)

自动化模型的发现和预测(Automated pattern discovery and prediction)

异常检测(Anomaly detection)

根因分析(Root cause determination)

按需交付(On-premises delivery)和软件服务交付(Software as a service)等。

智能化运维(Alops)概念:

Gartner在2016年时便提出了AIOps的概念,AIOps即人工智能与运维的结合,并预测到2020年,AIOps 的采用率将会达到 50%。

简单来说,AIOps 就是基于已有的运维数据(日志、监控信息、应用信息等)并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。

软件的一些“算法逻辑”不代表真正的AIOps,判断是否是真正AIOps的关键点在于:是否能自动从数据学习中总结规律,并利用规律对当前的环境给予决策建议。

智能化运维是什么?
Gartner定义AIOps概念图

总结一下就是:

1. 智能运维是以大数据平台和机器学习(算法平台)为核心。

2. 智能运维需要与监控、服务台、自动化系统联动,智能运维需要从各个监控系统中抽取数据、面向用户提供服务、并有执行智能运维产生决策模型的自动化系统。

AIOps的应用:

通过对运维数据的计算和分析支持智能监控、智能的故障分析和处理,智能IT知识图谱等。

AIOps的价值:

传统运维面对海量的运维数据,要快速止损和进行决策,人工专家的分析判断往往需要花费数小时或更大。

而AIOps在于通过机器学习来进行运维数据的挖掘,能帮助人甚至代替人进行更有效和快速的决策。

智能运维在企业的落地,能够提升业务系统的SLA,提升用户的体验,减小故障处理的时间等,带来业务的价值;并最终实现真正意义上的无人值守运维

AIOps应用领域:

目前各大传统客户围绕AIOps的探讨和建设主要是如下内容:

发现问题:基于机器学习的异常检测;

例如,目前监控数据的异常阈值往往是静态的,无法有效规避变更时间、特殊节假日、业务正常的高低峰等,简单阈值、同环比算法的覆盖面有限,很容易漏警和误警。

基于历史数据或进行样本标记的KPI异常检测,能第一时间发现问题,检测模型能覆盖大多数曲线类型,能较好适应业务生命周期中的变化。

根因分析:基于机器学习的故障树挖掘,定位故障发生的根源以及其原因;例如,首先实现故障精准定位,在多指标情况下的业务异常(多指标检测的异常),出现异常的原因具体是哪个指标导致的;然后根据故障树挖掘和知识图谱,实现故障的精准根因分析与定位。

预测未来:基于机器学习模型的指标预测;例如,基于多种回归和统计方法,实现对不同级别粒度的业务数据的预测,包括业务指标预测、容量预测等,如双11业务对组件容量和资源容量的容量预测等。

IT辅助决策支持:深入运营场景,实现业务运营的IT辅助决策应用;如营收预测、舆情分析与预测等场景。

算法层面则可以跟学术界进行合作或在社区中获取,在早期训练数据集和反馈数据量比较少的情况下,采用无监督学习,具体实现是用模式识别(pattern recognition)的技术来判断指标是否关联。关联性是通过时间序列曲线相似度(similarity distance)来衡量的。

机器学习算法库提供计算时间序列曲线相似度的各种算法,比如:欧几里德距离(Euclidean Distance)、曼哈顿距离(Manhattan Distance)、明科斯基距离(Minkowski Distance)等。

在有足够数据集以后,算法演化成有:监督学习、随机森林(Random Forrest)、GBDT(Gradient Boosted Decision Tree) 、神经网络(Neutal Network)等。

AIOps对基础设施的要求:

AIOps从技术层面来讲,需要数据、算法模型两个最为核心的要素,数据的支撑需要一套整体的运维大数据体系,而算法模型的支撑则需要一套整体的挖掘框架体系,以及执行决策的自动化系统。

运维大数据:

需要有集成多类数据源、一站式低门槛的数据开发、统一的多样化数据存储和查询等功能。

数据挖掘:

全流程、可视化数据建模,支持多种机器学习框架、交互式建模IDE、可视化样本标记等功能。

自动化系统:

需要集成企业CMDB、作业执行、编排引擎、自定义场景等功能。更为核心的是这些功能模块之间应该有效交互,不能仅仅是独立的各个模块,需要有一套平台架构来去支撑各个个性化的场景,尤其是打破数据烟囱、功能烟囱,这样才能实现有效的智能运维生命周期落地:

数据采集→数据建模→机器学习挖掘→自动化执行→反馈

AIOps落地前提条件探索:

从整体上来讲,AIOps的引入和使用需要具备一定的条件,但并不需要企业把所有东西准备好才能动工。

例如很多企业觉得应该准备好数据完整性和人才才能开始应用AIOps,但是,数据的完整性取决于探索之后才知道怎样的数据才是完整的;AIOps人才更为关键的在于了解智能运维场景;算法也只有根据实际情况不断调优才能有更好的应用效果。

只要有痛点,和通过智能运维带来价值,AIOps就可以先引入,并逐步带动企业智能化运维的发展。

总结来讲,AIOps落地的前提条件应该分为三个方面:

智能化运维是什么?

但是三个条件都不是指必须完全准备好才能开始实践:

基础设施平台:

可以从自动化能力,以及数据一体化能力进行起步建设,而不是一开始就建设一套于运维人员简单易用的模型设计框架;

算法:

目前已经有很多运维领域通用的算法,可以采用跟学术界、社区以及腾讯这些有实际落地经验的算法提供方进行合作,算法引入后需要不断调试优化才能有一个更为准确的百分比;企业也可以自建算法人才,但是算法本身属于科学领域,于企业而言,可以从性价比上综合来考虑;

人员组织:

人员组织的准备,更为关注的应该是跨技术领域的综合性运维人才,他们更懂运维场景,以及智能运维能实际解决哪些问题点,不能为了智能而智能。

智能化运维就是AIops,它依仗的是智能算法,是基于大数据之上的,和大家常说的自动化运维其实可以说是两个概念!

从发展路线来说应该是:人工运维–自动化运维–智能化运维!

自动化运维,说简单点就是把那些传统上需要人来手工进行的操作自动化,主要是通过脚本实现。但其实还是人为判断故障原因,手动执行故障恢复脚本,或特定场景化的一系列自动化动作。这种自动化运维依赖人的策略和经验,人占主导地位,而系统只是代替人去具体执行。

而智能化运维则是人工智能占主导地位,AI托管了运维的全流程。运维的流程可以分成两部分,发现问题和处理问题。

监控工具触发的告警或事件信息发送至智能运维平台来处理,智能运维平台利用压缩策略、AI算法、知识图谱等手段对告警及事件进行处理,最终确定引发故障的根因告警问题。

人工智能将此问题再推至自动化恢复工具,触发特定场景下编排的脚本,自动将故障进行恢复,反馈恢复结果,通知运维人员,最终在事后可对故障进行复盘及知识入库,达成自动化运维的完成闭环。好的智能运维能真正的实现“咖啡运维”:喝着咖啡做运维,翘着二郎腿就把运维工作做好。

这种aiops运维平台,是目前的一个趋势,但它依仗的智能算法,是基于大数据之上的,结合自己的运维的框架、策略,才能有一个好的效果。

智能运维提升了IT 系统的运维管理效率,降低运维管理难度,最大的问题是需要像人脑一样分析复杂的业务,然后判断故障原因,过去的技术无法替代人力,而且现在AI技术已经非常成熟了,AIOps 成了解决这些问题的最佳方案。

我们公司在运维行业10年多,积累了大量的经验,也推出了睿象云智能运维平台,把ai和运维大数据结合,搭建了更加智能、全面的跨云监控和事件管理平台。以我们的智能告警系统为例,支持包括Zabbix、Nagios等100+ 种工具告警接入汇集,人工智能降噪,告警分派必达,还有告警分析,大大提高效率,解放运维人!感兴趣的话,可以点击下方链接体验~

智能告警、智能监控、智能事件等

如果呆板的解释无法生动得解释出你想要的,可以操作的demo,一定会让你理解智慧化运维的含义!

案例一:数据中心智慧运维

传统的数据中心运维工作人员每天要面临高强压得工作内容:

半夜故障工单催人醒,处理不慎易进坑。日常巡检是数据中心运维过程中最重要的一环,通过运维人员日复一日,重复上千次抄表中保持警觉性发现设备存在的隐患。纯粹依靠人力并非行业发展所需,日常运维应借助合适的辅助工具,让有限的人力摆脱机械性的工作。

可视化重塑数据中心机房:针对数据中心系统复杂、多场景和动态性的特点。以 HTML5 的 WebGL 标准实现 3D 的图形渲染技术,以及基于浏览器内核嵌入到小程序实现更方便传播。并采用Hightopo 轻量架构使其支持跨平台展示,实现多端口海量数据的分析。

智能化运维是什么?

通过可视化管理,改变数据中心的运维模式。管理者可通过线上监控系统了解设备健康状况,可远程查看机柜的检修记录、履历信息和历史故障,为评估设备安全提供了直观的数据基础。运维人员摆脱了机械性的工作,缓解运维压力。同时也对数据中心人员分配提供了人性化的方案。

为了解决数据中心能耗过大的问题,系统对数据中心整体环境的年度用电量、机柜租用率、楼宇IT用电量、柴油发电机、电气容量等进行实时监控并提供相关历史数据,方便管理者进行节能调整。还支持对资产准确定位,记录设备型号和状态,确保机柜高使用率,避免资源浪费,细化运维能节省约20%的总运营成本。

案例二:变电站运维

智能化运维是什么?

可视化操作和维护的出现可以解决以下管理问题

1.手动操作效率低下:依赖于携带巡视工作卡,效率低,容易出错。

2、控制管理技术分散:有大量的检测子系统,各系统独立分散,控制手段之间没有有效的联系。

3.决策数据分散:物联网数据和生产运营数据分离,物理环境数据和数字信息分离。

通过三维可视化,使变电站的整体结构、设备分布立体化,同时提供空中、漫游、自动巡逻等多种演示方式,满足多种展示要求,真实地展现环境形象。通过扩大变电站管理规模、管理工具多样化、信息管理和数据管理的量化展示,支持变电站多维数据的深度挖掘和智能分析。将实际生产业务无缝集成到平台上,使日常管理任务标准化、自动化和企业智能、专业管理。

将数据可视化引入工作运维维度的功能、建立完善的兼容系统、利用科技手段进行记录,不仅可以提高现场运行效率,有效减少系统的负面安全影响和经济损失,还可以为智能化做好积极准备。实现站内设备连续性数据统计,揭示数据规律的变化,深入挖掘数据,科学准确地安排运营工作。

为什么会有智能化运维?

自动化运维例如持续交付的速度、服务稳定性、运营成本等。经过这么多年的建设,已经形成了不少成熟的平台,可以在平台上进行人工触发或者程序触发的自动化操作。

而我们所支撑业务规模仍在不断增长,越来越多的运维场景和问题无法用传统方法来解决,而运维效率也难以继续支撑业务规模的快速扩张,所以我们更加关注怎么样解放运维自身的效率,以及解决传统运维方法(人工、自动化)所解决不了的问题。所以有了智能运维。

举个现实的例子

从马车到汽车是为了提升运输效率,而到汽车已经接近饱和的时候,我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,不仅可以增加运行效率,同时也可以减少交通事故率,这也是我们对智能运维的诉求。

再举个运维中的例子

一个产品线有1000个子系统,每个子系统的重要程度、是否核心都不相同。监控添加可以用自动化的方法搞定,但是如何合理的设置报警的阈值呢?

百度对智能化运维的定义

将人的知识和运维经验与大数据、机器学习技术相结合,开发成一系列的智能策略,融入到运维系统中。用这样的智能运维系统去完成运维任务。关键点:数据、策略、执行

AIOps中有三部分不可或缺,一个是运维开发框架,这个是我们后续智能运维研发的骨架,第二个是运维知识库,这是让骨架能与我们真实线上环境关联起来的关键因素,起到了血肉的作用,让骨架能动起来。而最后一个则是运维策略库,这是运维的大脑,控制着运维平台的行为。

智能运维,又称AIOps(Artficial Intelligence for Operations),是一种将大数据人工智能机器学习技术赋能传统IT运维管理的平台(技术)。2016年由Gartner正式提出,被喻为传统手工运维ITOM(IT Operations Management)和ITOA(IT Operations Analytics)之后新一代的运维模式。

随着人工智能、大数据和云计算等一系列前沿技术的发展,以及广泛应用于传统行业,数字化转型进入到高速发展通道。越来越多的企业,特别是金融业,开始借助于数字化解决方案,利用这些前沿技术对企业数字化赋能,如对业务流程、商业模式和管理运营进行彻底改革,以期带来全新的数字化价值的提升,并获得市场的主动,赢得未来的话语权。

与此同时,金融业在数字化转型中,也不断遇到新的问题和挑战,运维作为数字化转型的重要保障手段,如何更好地利用新手段提升运维效率,保障数字化运营显得尤为突出。

知名咨询公司Gartner曾在其2016年的报告中指出,AIOps(智能运维)将是下一代运维模式,并预测到2022年,50%的大型企业将结合大数据和机器学习功能,支持和部分替代监测、服务台和自动化流程和任务。 由传统的手工运维ITOM,升级为智能运维AIOps将是运维行业的大势所趋。

智能运维AIOps,即AI+ Ops(人工智能运维),主要是将人工总结运维规律的过程变为自动学习的过程,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。

具体而言,是将平时运维工作中,长时间积累形成的自动化运维和监控等能力,对其监控、规则、配置、执行等部分进行自学习的“去规则化”改造,最终达到“有AI调度中枢管理和质量、成本、效率三者兼顾的无人值守运维,力争所运营系统的综合收益最大化”终极目标。也就是说,利用大数据、机器学习和其他分析技术,通过预防预测、个性化和动态分析,直接和间接增强IT业务的相关技术能力,实现所维护产品或服务的高质量、合理成本和高效支撑。

前言:IT监控运维系统,起源于各设备厂家的网元网管等监控工具,伴随着信息化的发展而升级换代,经历了大数据、虚拟化、云计算等技术革命的考验逐渐完善成熟。IT监控运维系统从最开始的解决故障,到提供高效的运维服务,已逐渐成为IT运维部门日常运维工作中必不可少的工具。

随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为企业信息化运维工作的重点之一。同时,运维活动也缺少管控,如没有构建服务台、知识库、CMDB、事件管理等基本流程。此外,监控运维并不是简单的“监控+流程”,两者的有效结合也是一个难点。

传统运维面临的问题

错综复杂的IT元素难以有效监控

从宏观上看,IT设施种类各异,组成复杂,从最基础机房动力环境->基础网络->存储->X86(小型机平台)->系统->应用;从硬件到软件;从后台应用支撑服务到前台页面服务,这些错综复杂的IT元素很难有效整合监控。

从微观上细究,特定IT设施种类各异,品牌繁多。以存储为例,品牌涉及IBM、HP、EMC、Netapp

日立、华为、浪潮等,监控对象指标包含磁盘阵列的各个组件,指标包括风扇、电源、电池、控制器、硬盘的状态、实时性能,以及交换机的各温度、电池、主机映射关系等,获取这些指标并非易事。

传统运维工具单一,无法集中管控

企事业单位用户可以通过厂家提供的管理工具,如vmware

的VC客户端,存储的管理客户端,硬件服务器的web管理控制台,或者通过查看日志/硬件设备的指示灯等方式查看运行状态和性能指标。显然,这些零散的方式会增加运维工作量,影响故障发现的及时性,IT运维人员迫切需要一个统一集中的平台将以上监控任务有效整合。同时,由于缺少有效的流程管控机制,运维工作总是处于“救火式”状态。事前无准备,事中无跟踪,事后无法追溯,运维经验无法沉淀积累与复用。

运维过程无流程或流程不成体系

随着信息化及互联网+普及推广,企事业单位已经从大规模的信息化建设向信息化运维转变,运维团队不断扩大,信息化管理流程日益复杂,之前的纸制化审批流程效率低,难以适应新环境下的流程管理,需建立统一、规范、层次化的服务管理流程和服务管理体系。面对复杂的IT环境,缺乏规范化、自动化的运维处理流程,缺乏完善的故障处理和快速修复机制。

看OneCneter如何破局?

勤智运维磨砺多年,深刻理解IT运维“建设易,管理难”的特点和ITaaS背景下的服务转型阵痛,结合多年运维实践及对ITSS国家标准的制定与理解,推出OneCenter一体化智能运维管理平台,将“监控、管理、治理”三方面有机融合。

OneCenter一体化智能运维管理平台可以让IT监控运维智能、高效、简单、统一,帮助运维团队实时、全面掌握IT运行态势,及时响应和处理IT故障,为各企事业单位业务提供强有力的IT支撑和质量保障。

一体化IT设施监控体系

智能化运维是什么?

勤智OneCenter的ITManager监控模块,可对业务系统及支撑业务系统的所有IT资源进行7*24小时全面监控,提供性能监控与分析、资源可用性监控与分析、资源拓扑关系管理、故障监控、故障分析及定位,帮助IT运维人员提升工作效率。

开放式的一体化运维平台

平台将机房环境、IT基础资源、应用系统情况进行统一展示、告警和管理,告别不同资源的离散管理模式。

多维度可视化视角

平台通过网络拓扑、业务系统、机房环境、虚拟化结构等多维度视角进行可视化展现,使资源全方位信息一目了然。

基于业务级运维

支撑企业运营的是各个核心业务系统,所以IT组织的视角逐步从资源级运维向业务级运维转变,从业务角度出发,在可视化的业务视图上业务架构、服务和所依赖组件一目了然。

更加聚焦故障管理

平台通过极简的界面和简单的操作结合系统强大的后台算法和分析能力,提供专业简单的智能化故障处理引擎。

自学习的运维知识库

帮助运维人员建立更加快速、高效地构建丰富的知识库,利用知识库快速对运维管理中发现的故障给出解决方案,恢复系统,确保业务正常运行。

智能化运维是什么?

一体化运维平台大数据分析能力

ITBA运维大数据分析系统是大数据技术在IT运维领域的应用。该系统运维内部整合了Hadoop、Spark、Kafka、MongoDB、Solr、Flume等多种大数据架构技术,提供多种类型数据接口的采集方式,实现多平台/多业务的监控、流程等运维工具的数据整合和统一管理。同时,提供对于第三方业务平台的数据展现、数据统计、告警分析和业务分析功能,可以将多个系统在门户内进行统一登录展现;也可以与其他系统对接,从第三方系统登录至运维系统平台。一方面ITBA大数据作为统一运维监控的工具,可以采集各家数据,将非标准数据变为标准数据;另一方面可以提炼数据,进行检索,做海量日志分析。

智能化运维是什么?

丰富的监控模型库

全面灵活的监控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S

、JMX、GB/T28181、SDK、TCPDUMP等),使得系统具备全范围的监控能力。OneCenter一体化智能运维管理平台能够监控各种操作系统、服务器硬件、网络设备、各种WEB应用、数据库、中间件、存储、虚拟化、WEB站点等IT资源,还支持灵活的自定义脚本监控。

智能化运维是什么?

告警集中展现

OneCenter

一体化智能运维管理平台提供统一的告警管理,通过性能指标采集轮询、调用厂家网管告警接口、网元Trap/Syslog主动推送、第三方系统轮询获取等多样化的来源方式,获得整个网络系统中各种事件、设备故障、网络异常等告警信息。当出现故障后,OneCenter一体化智能运维管理平台能通过预置的报警方式,以邮件、短信、电话自动拨打等“告警必达”方式及时通知指定用户,并能生成告警分析统计报告,提供主动式的故障解决方案。

智能化运维是什么?
智能化运维是什么?

统一的运维管理平台,规范日常处理流程

OneCenter
一体化智能运维管理平台
基于ITIL标准形成了一套结合服务台、知识库、CMDB、事件管理、问题管理等流程的统一运维管理平台,可以和监控系统做无缝衔接,日常告警事件可直接触发工单运维,提高工作效率。OneCenter系统采用多层架构及模块化的设计,系统功能全面,模块功能独立,可根据不同需求自由组合。同时,OneCenter
一体化智能运维管理平台具备良好的扩展性,通过第三方数据接口和数据总线以及门户Portal,与第三方产品可进行无缝集成。

智能化运维是什么?

另外,OneCenter 移动终端运维管理,提供移动服务台、告警列表、工单待办列表、工单查询及处理操作、设备巡检、系统公告接收和知识查询等功能,为运维工程师提供了一种便捷的运维模式,有效提高IT部门整体运维能力。

智能化运维是什么?

IT监控运维系统已逐渐成为IT运维部门日常运维工作中必不可少的工具,并在很多已建成的运维项目中发挥着不可替代的作用。如国家核电统一运维项目,实现了统一监控、统一运维、统一展现等“七个统一”;湖北省公安厅智能IT统一管理平台项目,实现全网上千种IT资源的统一管理和IT资源故障告警自动流转进入服务流程;湘潭大学一体化运维项目,支持复杂环境的大规模监控,有效提升IT运维管理和服务能力。

AIOps 是Gartner 2016年提出的概念,即 Artificial Intelligence for IT Operations,智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。

早期的运维工作大部分是由运维人员手工完成的,这种落后的生产方式,在互联网业务快速扩张、人力成本高企的时代,难以维系。

这时,出现了自动化运维,用可被自动触发的、预定义规则的脚本,来执行常见的、重复性的运维工作,从而减少人力成本,提高运维效率。

自动化运维可以认为是一种基于行业领域知识和运维场景领域知识的专家系统。

但是,随着整个互联网业务急剧膨胀,以及服务类型的复杂多样,“基于人为指定规则”的专家系统逐渐变得力不从心。自动化运维的不足,日益凸显,这也为 AIOps 带来发展机遇。

AIOps 不依赖于人为指定规则,主张由机器学习算法自动地从海量运维数据(包括事件本身以及运维人员的人工处理日志)中不断地学习,不断地提炼并总结规则。

AIOps 在自动化运维的基础上,增加了一个基于机器学习的大脑,指挥监测系统采集大脑决策所需的数据,做出分析、决策,并指挥自动化脚本去执行大脑的决策,从而达到运维系统的整体目标。

AIOps 基于自动化运维,将 AI 和运维很好的结合起来,其需要三方面的知识:

1、行业领域知识:应用的行业,如互联网、金融、电信、物流、能源电力等,并熟悉生产实践中的难题; 2、运维场景领域知识:包括异常检测、故障预测、瓶颈分析、容量预测等; 3、机器学习:把实际问题转化为算法问题,常用算法包括如聚类、决策树、卷积神经网络等。

AIOps 是运维的发展必然,是自动化运维的下一个发展阶段。

ManageEngine是国际知名厂商,也是AIOps的领导者之一,可以下载试用相关软件,实际解决问题,就更容易理解何为AIOps

智能化运维是什么?

AIOps(智能运维)概念一出,立即获得广大企业IT运维管理人员追捧。我们先来看下著名IT咨询公司Gartner对AIOps的市场定义:

—Gartner : Market Guide for AIOps Platforms

AIOps平台将大数据分析技术与机器学习功能相结合,主要对数字化转型过程中IT系统不断产生的数据量、数据类型,进行采集和分析,助力IT运维。该平台能够同时使用多个数据源、数据采集方法、数据分析技术。

智能化运维是什么?

下面介绍下爱数的机器数据分析平台:AnyRobot。

作为AIOps产品中的一员,爱数AnyRobot积极探索实践智能运维应用,目前已为包括金融、政府、教育、医疗、能源、制造等150+行业客户提供智能运维服务。

AnyRobot通过开放创新的产品架构,将IT环境中孤立的运维数据和第三方监控数据进行统一管理,借助机器学习算法、数据分析技术和全局搜索能力,帮助企业实现IT资源趋势预测、快速故障定位和业务分析洞察等。

智能化运维是什么?

专注基础:全量数据采集,夯实AIOps底座

从AIOps市场定义中,我们不难看出:如果要确保业务的可用性、敏捷性,必须以IT环境的全量数据汇聚能力为基础,整合每个单独系统所提供的数据服务能力,降低多个系统的运维复杂程度。

—Gartner : Market Guide for AIOps Platforms

“现代IT运营旨在获得对IT实体(包括应用程序、相互依赖关系、数据调用等)的综合可见性,以洞察整个IT环境的状态。业务不断发展要求IT运维管理必须能够获取各种数据源;运维管理人员必须选择能够管理,并提供对各种历史数据和流数据类型的访问权限的AIOps平台。”

AnyRobot从海量机器数据的采集入手,对实时数据和历史数据进行综合管理分析。以通用协议和自研Agent代理采集的方式,AnyRobot实现了对混合IT环境中设备、系统服务、应用软件等多源数据的全量采集、存储,以便及时洞察IT运营状态。

通过对获取各种数据能力的持续优化,AnyRobot打造了全平台数据的采集能力,数据采集过程安全可控。平台自身制定了丰富的数据采集策略,减少数据采集过程中对业务运营的资源占用;设置多用户的数据管理权限,确保数据信息安全。

智能化运维是什么?

AnyRobot Family 3 核心用户价值

智能化运维是什么?

https://www.zhihu.com/question/41765799

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/215842.html

(0)
上一篇 2021年12月21日
下一篇 2021年12月21日

相关推荐

发表回复

登录后才能评论