图数据库,对于很多人来说还比较陌生。其实,图数据库是用图来存储数据,是最接近高性能的一种用于存储数据的数据结构方式之一。构成一张图的基本元素是节点(点)和关系(边)。节点和关系都可以设置自己的属性。节点经常被用于表示一些实体,但依赖关系也一样可以表示实体。节点之间的关系是图数据库很重要的一部分。通过关系可以找到很多关联的数据,比如节点集合、关系集合以及他们的属性集合。
举个例子,对于社会网络中人与人之间的关系来说,用关系型数据库存储这种数据的效果并不好,其查询复杂、缓慢、超出预期,而图数据库的独特设计恰恰弥补了这个缺陷。关系是图数据库特有的组成部分,相对于关系数据库中的各种关联表,图数据库可以通过关系包含属性这一功能来提供更为丰富的关系展现方式。
灵活性是推动图数据库流行度激增的关键因素。在过去10几年的时间里,对可用性和大规模的相同需求推动了各种NoSQL产品的开发和采用,从图数据库近期的趋势中看,这种走势将继续走强。
图数据库既然如此强大,但是过去并没有被广泛使用,主要是技术和条件上的限制:缺乏实时数据处理能力;支持的数据规模有限;计算的深度只有2-3层等。
TigerGraph公司,一个中西结合的名字,其创始人兼CEO许昱博士表示,TigerGraph的创始团队有中国背景,Tiger代表着TigerGraph强大的数据处理能力。经过在硅谷5年的开发,TigerGraph首创了业界唯一的原生、分布式、并行图数据库。日前,许昱接受了51CTO记者的采访,就图数据库进行了深入探讨。
原生、分布式、并行图数据库
原生,意味着不基于一个关系型数据库的表来存图,也不基于一些Key-Value系统,不把数据打乱存在别的存储系统里。TigerGraph围绕图做了存储、计算引擎、查询语言、可视化工具,所有这些都只是围绕图,而不基于关系型数据库,也不基于文档数据库。
说到并行,并不仅仅是多机分布式。其核心在于,图中的一个节点、一个边都存在属性,都是并行的存储单元。但并行最重要的核心是计算,多核、多CPU、多线程,是并行最核心的要素。
TigerGraph 进入中国市场不久,已经收获了金融、银行、电力等行业的大客户,这得益于TigerGraph强大的技术优势。
首先,在实时计算技术方面,一般的查询涉及到几千万到上亿个节点和边关联,点是实体,边是关系,TigerGraph的实时计算可以每秒每机遍历数亿个顶点/边,步数可达三步或更多,比传统⽅法快多个数量级。
第二,支持数据库的增、删、改、查,是业界正式商用的数据库。每台机器每⼩时可加载 100 到 200 GB 数据的能⼒,不再需要批量加载。
第三是超大规模,在只有20台商⽤计算机的集群上,能够将20亿以上的每日事件实时流式传输到具有超过1000亿个顶点和超过6000亿个边的⼤数据图谱。TigerGraph图数据库已经成功地在世界上多个行业第一的公司生产线上运行了多年。
此外,TigerGraph的产品化程度很高,用户只需在TigerGraph网站上下载软件、技术文档,就可以自己去做图模型、数据录入、二次开发等,不需要TigerGraph的人员指导。
组建本地团队:推动市场、推动生态
目前,TigerGraph在中国组建了团队,据TigerGraph中国区总经理乌明捷介绍,中国团队的工作主要有以下三个方面:
1、提高大众对图的接受度和了解度。最初,TigerGraph认为金融行业会是使用图数据库最多的行业,但是经过一年的市场推广发现客户其实来自各个行业。比如物流调度IoT,需要用图来解决路径规划的问题。中国的大数据市场比较活跃,企业也愿意尝试新技术,所以TigerGraph希望推动这个市场。
2、推动合伙伙伴生态的建设。TigerGraph不卖数据,不做具体的应用,对合作伙伴持有开放的态度,中国团队的组建将有利于推动整个生态的发展。
3、快速响应客户需求。当中国客户有需求的时候,通过目前在国内的技术和咨询团队,可以进行快速响应。
简而言之,推动市场、推动生态,帮助行业标杆企业,在中国投入更多的资源去加强和客户的直接对话,是目前TigerGraph进入中国市场的主要工作。
从客户的痛点入手
当今,很多企业往往使用若干个不同的数据库,来解决不同部门的问题。TigerGraph进入客户是一个顺势而为的过程,先解决别的数据库工具不能解决的问题,和其他关系型数据库结合在一起,构成一个成熟的、有效的分析环境。
TigerGraph凭借强大的图数据库,为企业提供实时分析应用程序,在反欺诈和反洗钱、消费者智能、智能供应链、智能电网等应用中都有着出色的表现。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/121566.html