什么是云环境运维 (CloudOps)?
云环境运维 (CloudOps) 是指管理云环境中运行的工作负载和 IT 服务的交付、调整、优化和性能的实践,这些环境包括多云、混合云、数据中心和边缘环境。CloudOps 会为云端运维流程制定规程和最佳实践,就像 DevOps 为应用开发和交付流程所做的一样。
云环境运维在很大程度上依赖于分析,以增强对云环境元素的可见性,从而提供高效控制资源和运行服务所需的洞察。
对于一些企业而言,随着 IT 运维从本地部署转向云端基础架构,CloudOps 逐渐取代了网络运维中心 (NOC)。正如 NOC 曾经负责监控和管理数据中心一样,CloudOps 用于监控、测量和管理在云中运行的虚拟机、容器和工作负载。开发人员、IT 运维人员和安全人员均使用 CloudOps 原则进行协作,满足业务和技术目标。
DevOps 和 CloudOps 有什么区别?
DevOps 和 CloudOps 都基于企业中不同团队之间的协作关系。
DevOps 实践可持续改进流程以增强协作,进而提高整个软件交付生命周期 (SDLC) 的可见性,并帮助减少可能会中断 IT 运维或影响开发进度表的突发事件。
DevOps 的改进可能会遍布整个企业,有助于更快地实现更可靠的软件应用,从而提高企业整体绩效。最终,DevOps 有助于改善员工和客户双方的用户体验。
CloudOps 涵盖云计算平台工程设计原则,结合了云体系架构、IT 运维、应用开发、安全性和法规遵从性要素,使企业能够管理云端应用和服务。
这使企业可以:
- 确保云计算平台(包括混合云和边缘组件)作为单一平台运行
- 为分散式员工优化应用性能,无论他们使用何种访问设备
- 确保可靠性并满足 SLA 要求
- 维护备份满足灾难恢复和业务连续性要求
- 自动执行重复性服务和配置管理
- 确保数据和应用获得端到端保护
云环境运维的最佳实践是什么?
希望建立 CloudOps 职能的企业应考虑以下实践:
制定迁移策略。每个工作负载都有自己的要求,而采用容器化应用和微服务可能会给特定解决方案的构建方式带来额外的限制。例如,基于微服务的应用可能需要访问多个云中的服务,进而导致采用多云方法,而不论是否需要。其他工作负载可能会访问敏感数据,这些数据必须保留在本地部署的私有云中,以满足法规或监管要求,而其他应用则可能需要使用特定的云服务提供商,才能在特定地理位置维护数据,或利用特定提供商的功能特性。
包括所有相关人员。 云迁移是一种变革,而许多企业和部门都抵触变革。从用户到高层管理人员,每个相关人员都应参与到迁移规划中来,以帮助确保关键业务流程不会在迁移过程中被忽视。灌输采用 CloudOps 方法的重要性,并强调它如何与现有 DevOps 策略保持一致。
强调安全性。 虽然云计算提供了许多优势,但它也为网络犯罪分子和其他不良分子提供了一个或多个新的攻击面,可能会被他们用来穿过企业的防线。首先采用零信任安全方法、端到端加密,自动执行安全监控和修复,以帮助确保小问题永远不会成为代价高昂的数据泄露事件。
通过自动化加快速度。 采用敏捷的云工作流和无中断自动化工具,包括置备和密码重置等许多自助式功能。请记住,云迁移并非一次性交易;数周或数月过去之后,CloudOps 将会发现流程、基础架构和连接方面需要改进的地方,而它们会对运维和每月的云费用产生重大影响。
在计划中包含培训。 云管理所需要的技能组合与本地部署数据中心截然不同。物理设备的维护需求消失不见,取而代之的是新的故障排除、置备和部署技能。在劳动力市场紧张的情况下,在迁移之前为现有团队成员提供培训可能会有益,这有助于确保在需要时获得所有适当的技能。
从小处着手。 找到一种要迁移的应用,通过它为运维和用户团队双方提供概念证明,并向所有相关人员展示大规模云迁移的可行性。
制定在基础架构即代码模式中存储配置数据(如服务器定义)的实践,帮助快速扩展和部署新实例,从而根据需求按需扩展。
确保迁移的第一个应用和每个应用都明确定义成功运维所需的工具、服务和数据,因为这将扩展为所有运维的依赖关系操作图。
云环境运维为何重要?
由于不断增长的应用和服务,企业对公有云的使用正稳步增加。随着工作负载从数据中心迁移到云服务提供商,对 CloudOps 的需求将同步增长。DevOps 和 CloudOps 团队可以共存并分享最佳实践,因为它们都可以促进以下方面:
- 提高云资源的效率和利用率
- 云工作负载敏捷工作环境的增长
- 自动执行安全性和可用性流程,以支持全天候运维
- 改善客户的用户体验
- 降低已交付云服务的总体成本
- 增强处理迁移应用的团队的生产力
云环境运维有什么优势?
CloudOps 为企业提供了一长串的优势,包括:
- 加速自动化。CloudOps 工具可以简化各种日常任务的自动化,包括置备服务器和存储、应用测试、监控和报告、应用构建以及安全事件修复。
- 增强安全性。 主要的超大规模云服务提供商可以利用业界出众的物理安全性,并持续监控其基础架构,以帮助防范网络犯罪或数据泄露。几乎每个企业在迁移到云后都会实现安全改进,请记住,在云计算安全方面,企业的责任与云服务提供商同样大。
- 提高 RPO/RTO。 备份和数据恢复是公有云的初始应用场景,未来仍然是云迁移的强大推动因素。备份和复制策略可以将恢复点目标 (RPO) 和恢复时间目标 (RTO) 降低到接近零,从而帮助为日益增长的全球用户和客户群确保全天候可用。
- 总体 IT 节省。由于云服务采用“按服务付费”方式,因此无需大量资金开销,同时无需购买服务合同并不断升级数据中心硬件以满足不断变化的用户需求。此外,消除数据中心基础架构可节省电力、散热甚至占地等设施成本。
- 可按需扩展。季节性需求或增长需求可通过即时增加容量来满足,通常通过自服务门户网站即可实现。置备新的虚拟机、物理服务器、存储甚至网络带宽时,只需按一下按钮即可完成,使企业能够变得更加敏捷,并在需求出现时立即予以满足。
- 不限地点进行访问。 借助 Internet 连接,企业几乎可以使用任何设备随时随地访问云应用和资源。
- 无中断升级。 基础架构和软件都可以无缝升级或更新,无需中断服务,从而在继续进行正常业务运维的同时,应用修复或添加新功能。
- 什么是云环境运维 (CloudOps)?| VMware 词汇表 | CN
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/240615.html