Hadoop和HBase的区别

Hadoop:Hadoop 是 Apache 的一个开源框架,用于存储和处理分布在服务器集群中的大型数据集。Hadoop 的四个主要组件是 Hadoop 分布式文件系统 (HDFS)、Yarn、MapReduce 和库。它不仅涉及大数据,还涉及结构化、半结构化和非结构化信息的混合。亚马逊、IBM、微软、Cloudera、ScienceSoft、Pivotal、Hortonworks 是一些使用 Hadoop 技术的公司。

HBase:HBase 是 Apache 的一个开源数据库,运行在 Hadoop 集群上。它属于非关系数据库管理系统。HBase 的三个重要组件是 HMaster、Region server、Zookeeper。CapitalOne、摩根大通、苹果、MTB、AT&T、洛克希德马丁是一些使用 HBase 的公司。

下表列出了 Hadoop 和 HBase 之间的差异:

编号 Hadoop HBase
1 Hadoop 是软件工具的集合 HBase 是 hadoop 生态系统的一部分
2 在分布式环境中存储数据集 以列的方式存储数据
3 Hadoop 是一个框架 HBase 是一个 NOSQL 数据库
4 数据以块的形式存储 数据以键/值对的形式存储
5 Hadoop 不允许运行时更改 HBase 允许运行时更改
6 文件只能写入一次,可多次读取 文件可多次读写
7 Hadoop 具有低延迟操作 HBase 具有高延迟操作
8 HDFS可通过MapReduce访问 HBase可通过shell命令、Java API、REST访问

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/266897.html

(0)
上一篇 2022年6月12日
下一篇 2022年6月12日

相关推荐

发表回复

登录后才能评论