运维的挑战和困难
数字化经济时代,新的行业变革、升级,各行各业全数字互联、改造,形成了新的数字生态。承载着数字信息的ICT生产环境之复杂度远非常人所能想象,当前规模下的复杂程度已不是单个工程师、单领域的技术能够搞定的。光一个业务应用的运维,可能涉及到的技术领域就有应用开发、数据库、中间件、云计算、存储、网络、数据中心等等。而每一个行业领域又可细分为N个子领域,比如:云计算是近些年的企业IT的一个演进的趋势,但云计算打开来看,又有公有云、私有云、混合云,云服务又包括:云服务器、云硬盘、云网络……等等。
企业的信息化、数字化浪潮势不可挡,企业在做好自身主营业务的前提下,如何用ICT运维来支撑好企业的生产运营与创新、如何保证ICT系统正常稳定的运行、如何将ICT故障对业务的影响降至最低,成为每个企业不得不面对的严峻挑战。为解决这一难题,各行各业都在建设现代化的运维服务方案。
然而,大多数企业的运维部门都是“三无”部门:没有完善的运维组织,没有运维流程、没有统一工具平台。运维人员整天疲于奔命四处救火,运维问题的解决效率却很低,导致业务质量不断下降,运维成本年年增加。
华为将三十年的运维经验能力复制全球,发布行业运维服务解决方案
华为公司依托在行业运维领域卓越的技术、产品、服务及生态系统的能力及优势,提供五大关键运维服务+运维平台,全方位、全覆盖客户特殊业务场景,简化运维管理,承接运维责任,为客户信息化工作保驾护航,达成预期的收益和目标。
华为为什么能做到运维业务全球化呢?这离不开多年实践经验中的沉淀。
伴随华为自身的全球业务发展历程,从人拉肩扛的救火式运维,到分散式运维,到自动化、平台化运维,再到服务化、数字化运维,华为积累了丰富的运维转型经验。当前,华为运维支撑了全球200多个数据中心、5万多个机柜、30万台服务器、1000+PB的数据、百万级VM和多个异构云环境,800多项业务的正常运转,使得人机维护比达到1:8000,用“喝着咖啡搞运维”来形容一点都不为过。
华为行业运维服务解决方案是融合了华为多年行业客户服务经验,围绕“场景、标准、生态、平台”提供“运维咨询、运维体系设计、运维实施、优化提升”四维一体的服务解决方案。该方案可快速帮助客户搭建“场景化运维特征库、专属运维组织、高效运维流程、统一运维平台以及标准化运维技术手段”等。目前,华为行业运维服务解决方案已在全球多家行业客户成功应用,以平安城市为例,我们协助客户缩短约35%的业务受损时间,提升近40%运维效率,释放60%的运维人力,为客户带来了高效智能的运维体验。
面向多样化场景提供最佳运维解决方案服务
目前,华为行业运维服务解决方案已面向“数据中心”、“平安城市”及“智慧城市”场景成功商用,后续,我们还将陆续推出智慧园区、智慧交通等更多场景的运维服务方案。
数据中心运维场景下,华为智能运维平台内置超过12000多条数据中心运维规则,可支撑百万级虚机的实时监控、智能分析及故障自动定界。
平安城市场景下,明确定义了200多条核心应用的监控规则,实现业务应用级智能监控,同时具备海量摄像机的自动化运维能力,故障定位准确率高达98%。
智慧城市的核心是被称为“数字大脑”的IOC智能运营中心,我们通过定义数据链监控规则,对IOC及各软件层级进行流量监控,为数字大脑稳定运行保驾护航。
核心是智能平台:华为神农统一运维平台(IMOC)
说到运维,一个绕不开的话题就是:运维平台。2018年华为正式发布了华为神农统一运维平台(IMOC),一年来华为持续在智能平台方面加大投入,当前神农统一运维平台已演进至智能2.0。2019年,华为在神农统一运维平台上内置了Insight系列组件,使得该平台具备了行业核心应用、数字中台、基础设置的智能监控和分析能力,同时具备了海量智能终端的自动化、智能化运维能力。
华为神农统一运维平台(IMOC),汇聚了华为三十年来在大规模多云多数据中心运维下的经验积累,依托监、管、控、营、服的核心能力,帮助客户更快的完成数字化、自动化、智能化的转型过程。
数字化
华为神农统一运维平台具备采集和分析海量数据的能力,并且根据不同业务场景形成了多个专题分析方案,例如云资源专题,可以帮助客户快速掌握云平台资源分配和使用情况,及时发现问题,准确掌握和预测资源使用情况;应用专题可以保证随时掌握应用系统的健康情况,快速定位应用到资源之间的障碍。华为神农目前已推出六大专题:云资源专题、大数据专题、数据中心专题、应用专题、网络专题、物联网专题,后续还会基于华为的实践持续推出更多的场景。
自动化
通过大量的数据和场景的积累,华为神农可支持用户自定义来持续积累自身独特的运维经验。告警智能识别、运维对象标准管理eCMDB、自动执行管理eOps、运维可视化eSee等功能,帮助客户实现端到端的流程闭环。华为神农是开放的平台,除了内置的运维套件,还允许运维人员自助开发自动化场景。
智能化
随着数字化和自动化的不断深入,华为积累了大量的运维数据,并在此基础上,引入了AI支撑智能分析。在数据中心耗电优化、资源使用精准预测、运维效率提升上都有较好的实践效果,华为神农将会持续将华为的优秀的实践引入到平台上供用户调用。并将为用户提供开放AI训练平台,训练并建立自己个性化的AI模型。
通过以上方案的综合应用,华为神农已经为全国多个行业客户提供了数字化运维支撑,让运维人员成长为自动化策略制定及开发人员,实现了让机器运维机器。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/200552.html