95%的企业在混合云环境中运营,其中大约2/3使用多云提供商。数据在多个数据存储、多个位置、多个云甚至多个供应商环境中快速增长,促使许多组织想方设法通过单一来源简化数据管理—这种过程叫作数据存储融合。以前的尝试依赖于物理数据的移动和ETL过程,以及数据湖等庞大的非结构化数据存储库。现在有了一种更好的解决方案,它利用Data Fabric方法中的通用查询引擎,在洞察平台上融入治理,支持灵活地访问各种数据存储、治理和分析功能。
今年早些时候,IBM在Think 2021虚拟会议上介绍了通过AutoSQL功能简化数据管理的最新进展。AutoSQL使用覆盖各种不同数据源的单一分布式查询,简化数据环境。AutoSQL是一种通用查询引擎,是下一代IBM Cloud Pak® for Data的智能Data Fabric功能的一部分。AutoSQL可访问数据库、数据仓库、数据湖和流式数据,对它们执行查询,而无需额外的手动更改或数据移动。通用查询引擎执行分布式和虚拟化查询的速度要比行业标准快53%。通用查询引擎与Data Fabric中现有的数据虚拟化功能相结合,无需移动数据即可在多个云(包括公有云和私有云)中轻松查询数据。AutoSQL还独立于供应商,支持对任何供应商的云平台上的开放文件格式执行查询。综上所述,AutoSQL的作用在于减少工作量和降低成本。由于能够最大程度消除数据移动,减少调整查询特定数据源所花费的时间,以及能够在单一平台上访问所有数据,因此AutoSQL可避免数据移动带来的性能影响,使人员能够更高效地利用自己的时间。
作为下一代Cloud Pak for Data的一部分,IBM智能Data Fabric中的嵌入式治理也有助于发挥这些功能的价值和优点。借助领先的数据平台,使用者可以在所有数据存储中对经过质量和有效性验证的数据进行查询。由于基于Data Fabric的通用数据基础固有的可信性,使用者可以更轻松地信任洞察,实施有影响力的行动。此外,尤其考虑到数据对于AI模型的重要性,更高质量的数据可能意味着更高效地使用AI模型—例如,如果模型是根据略微偏离现实的数据进行训练,那么就要减少需要的更新次数。自动化元数据标记也有助于节省时间和提高准确性,帮助数据用户更深入地了解要查询的数据集。自动数据掩盖功能使数据用户能够更轻松地满足合规要求,不必担心会意外访问自己不应访问的数据。数据集成和数据准备是企业希望在2022年底之前实现自动化的前三种技术中的两种,但这方面的技术进步还无法很快实现。
查看Data Fabric信息图:https://www.ibm.com/downloads/cas/7WDAED89
治理、Data Fabric和AutoSQL只是IBM Cloud Pak for Data这样的洞察平台中的一小部分功能。包含数据收集、治理和分析等多方面功能的预先集成的端到端解决方案意味着,过去拼凑而成的解决方案将被互连而灵活的解决方案所取代,新的解决方案可随着业务需求的增长而扩展。维护多个许可或升级将由单一平台解决方案取代。当然,这并不意味着企业被单一供应商套牢。如前所述,开放数据格式和供应商灵活性可帮助企业轻松集成任何云端的现有数据仓库、数据湖和其他解决方案。无论哪种方式,单一的数据视图和为数据用户提供自助服务的能力仍旧十分重要。此外,使用IBM Cloud Pak for Data的客户可以通过广泛的合作伙伴生态系统及其解决方案来完善或增强该解决方案,从而满足自己更为独特的需求。
对于寻求更加集成、更为灵活的解决方案的企业而言,新发布的AutoSQL和IBM Cloud Pak for Data上的通用查询引擎只是新增的优势之一。随着大量有助于节省成本的功能和自动化功能的出现,进一步减少人工工作和成本指日可待。详细了解IBM Cloud Pak for Data的优点:https://www.ibm.com/products/cloud-pak-for-data
原文链接:https://www.ibm.com/blogs/journey-to-ai/2021/05/manage-all-of-your-data/?mhsrc=ibmsearch_a&mhq=data%20fabric
了解更多IBM相关:https://m.e-works.net.cn/report/202107IBMclould/IBM.html#DataAI
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/167656.html