导读 | 如今的企业比以往任何时候都能访问更多的数据。这些数据正在以惊人的速度增长,无论是数量还是变化量。 |
如今的企业比以往任何时候都能访问更多的数据。这些数据正在以惊人的速度增长,无论是数量还是变化量。无论是传统的分析还是机器学习和人工智能等前沿技术,将这些信息从所有信息源集中到云存储库对业务至关重要。
- 企业将数据迁移到云端就像人们搬到新家一样。企业需要知道自己为什么要迁移,需要迁移什么,以及计划迁移的去向。
- 企业希望从云端获得什么?当前的设置是否已超出上限?如何更好地为企业的数据分析或机器学习堆栈提供动力?
- 企业如何利用云端提供的所有功能?是否能够利用其架构优势?其可扩展性和弹性是什么?其安全性如何?是否节约成本?将会带来什么?是一切吗?
如果对此进行一次详细调查,人们可能会对来自这么多来源的数据感到惊讶。
当然,这样复杂的举动并不是企业一时兴起的行为。相反,它需要重要的计划和正确的工具集才能取得成功。在企业构建迁移清单之前,首先考虑一些常见的注意事项:
在数据隐私正成为一个良好数据管理实践的世界中,了解哪些数据是可共享的,哪些数据是不可共享的,这一点很重要。个人用户需要确保其PII(个人身份信息)数据不会暴露给错误的各方是至关重要的。因此,重要的是要全面检查整个管道和数据库功能,以确保运动和静止数据的安全。了解数据如何分阶段,哪些系统可以访问它,以及保留多长时间对于充分了解信息的暴露程度至关重要。
此外,与传统的本地解决方案一样,应该考虑应用程序如何保护对象和数据。例如,是否存在基于角色的访问控制(RBAC)以及是否能够以适当的粒度(行或列级别)保护数据是重要的事项。解除数据标识和屏蔽数据是否是进入云平台的先决条件?并且授权用户管理是企业操作的关键因素吗?
最后,必须知道资产清单中的哪些数据对象需要进行特殊处理才能达到监管或合同目的。在开始迁移和规划过程时,确保平台和应用程序能够支持企业这些需求至关重要。
迁移到云平台时,让数据可用且尽可能保持最新状态是至关重要的。数据分析可以提供业务优势,并且依赖于数据。通常,本地解决方案经过精心人工制作和专门设计,以满足业务的用户体验要求和服务等级协议(SLA)。在迁移到云平台时,无论企业使用何种方法,在特定生产工作负载下完全审查和测试管道和数据库的性能至关重要。这是理解性能瓶颈会发生什么,在哪里发生,以及如何解决它们的唯一方法。
为连续测试和监控建立特定基准和候选工作负载无疑是最佳实践。这可以使用云监控服务和查询来完成,这些查询不断轮询并验证平台是否以最佳方式运行。
管理当前和未来的容量是本地解决方案领域的一门科学。它与维护平台消费者体验到的一致的性能水平密切相关。迁移到云平台的主要方法之一就是随着工作负载和容量需求的变化,实现弹性和自动扩展带来的优势。
在考虑未来的云计算架构时,至关重要的是,响应峰值需求场景所需的工程设计必须预先构建到平台的功能中。企业需要了解其峰值需求,并确保云平台能够处理它们。确保可以持续测试和监控这些高峰需求情景也很关键。
利用云平台原生的监控和报告服务。让企业DevOps团队了解这些技术,并预先构建这种能力,而不是在迁移之后再进行考虑。
在执行云端迁移策略之前,企业必须捕获所有数据资产的完整清单,其依赖关系以及上游和下游应用程序支持这些资产的内容。创建和维护此清单是迁移阶段所有计划活动的基础。如果没有这个清单,则无法完全了解将堆栈中的每个组件迁移到云端所带来的影响、风险和成本。
此外,通过此库存和评估练习,企业经常会发现重构和淘汰冗余数据源和服务的机会。这可以帮助企业避免在有限或没有未来价值的项目上浪费资源。企业还可以发现要迁移的新数据源。
这个迁移指南的重点是数据迁移到云端,但企业可能也需要迁移应用程序。可以选择几种不同的方法来迁移其应用程序。企业自己的特定需求和目标将决定哪种方式最适合自己。
企业是否希望将大多数应用程序迁移到云中,但是避免对它们进行更改。这通常是“提升和转移”方法的一种变体,即在云中托管的虚拟机中运行现有应用程序,而不是定制或替换。它速度更快,破坏性更小,但也无法充分利用云计算提供的所有功能。
另一种方法可能是将企业的应用程序完全迁移到云原生环境。这在成本和时间方面更加昂贵,因为企业的应用程序可能需要定制甚至更换,但最终企业将拥有一个更加强大的系统。
总之,企业需要了解其资产及其价值。了解其安全要求,并根据计划的目标架构评估风险。确保企业可以为客户提供相同或更好的服务级别,最后,利用本地云架构服务进行监控和容量管理,将迁移策略构建为将业务提升到新的水平所需的必要工具。
迁移到云端通常需要跟踪大量细节,通常有助于列出企业需要记住的事项。例如,需要租赁一辆卡车吗?有没有更改邮寄地址?当企业将业务迁移到云端时,需要一份清单:
- (1)建立团队角色,并定义成功因素。成功的迁移对企业情况有何影响?谁将帮助实现这一目标?
- (2)了解企业正在迁移的内容,依赖关系以及对应用程序使用者的影响。在这里,企业将会实现数据普查,并且可以利用迁移来执行一些数据清洁工作,并减少将要迁移的残余数据。这时企业将开始了解现在需要的容量以及将来可能需要的容量。
- (3)执行安全评估。确保数据受到保护并符合合规性或监管标准。
- (4)在采用交换机之前建立性能基准和标准。
- (5)企业事先确定其DevOps团队将如何支持其在云中的应用程序,以及将使用的云原生工具。
- (6)更新服务等级协议(SLA)以反映新环境和配置。
- (7)确保企业的应用程序在迁移之前利用本地云功能进行自动扩展,并测试这些功能。
当然,这基本上是一个跳跃点,一个让企业开始运营的地方。企业的实际实施可能会更复杂,甚至更简单。既然企业已了解基础知识,那么可以考虑在流程中添加一些额外的步骤。
虽然迁移数据是主要的问题,但是企业应该利用迁移来执行可能需要的任何数据转换。
由于企业的数据来自不同的来源,并且涉及不同的模式,因此迁移是将数据重新映射到公共模式的理想时间。企业可能还希望丰富数据或清理数据,以便进一步分析。
大多数数据管道都提供某种转换支持,无论是在加载到云端之前还是云端之后执行。
Alooma完全支持在加载期间或加载后转换数据。通过这种方式,企业可以在加载前使数据更加丰富或清理数据,然后利用云计算提供的计算能力在云计算数据仓库中执行各种连接或其他转换。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/industrynews/123844.html