日志采集工具Flume有什么用

这篇文章主要为大家展示了“日志采集工具Flume有什么用”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“日志采集工具Flume有什么用”这篇文章吧。

Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方，用于收集数据;同时，Flume提供对数据进行简单处理，并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力。Flume的数据流由事件(Event)贯穿始终。事件是Flume的基本数据单位，它携带日志数据(字节数组形式)并且携带有头信息，这些Event由Agent外部的Source生成，当Source捕获事件后会进行特定的格式化，然后Source会把事件推入(单个或多个)Channel中。你可以把Channel看作是一个缓冲区，它将保存事件直到Sink处理完该事件。Sink负责持久化日志或者把事件推向另一个Source。

Flume的一些核心概念：

1. Agent：使用JVM 运行Flume。每台机器运行一个agent，但是可以在一个agent中包含多个sources和sinks。

2. Client：生产数据，运行在一个独立的线程。

3. Source：从Client收集数据，传递给Channel。

4. Sink ：从Channel收集数据，运行在一个独立线程。

5. Channel ：连接 sources 和 sinks ，这个有点像一个队列。

6. Events：可以是日志记录、 avro 对象等。

Flume以agent为最小的独立运行单位。一个agent就是一个JVM。单agent由Source、Sink和Channel三大组件构成，如下图：

日志采集工具Flume有什么用

　　值得注意的是，Flume提供了大量内置的Source、Channel和Sink类型。不同类型的Source,Channel和Sink可以自由组合。组合方式基于用户设置的配置文件，非常灵活。比如：Channel可以把事件暂存在内存里，也可以持久化到本地硬盘上。Sink可以把日志写入HDFS, HBase，甚至是另外一个Source等等。Flume支持用户建立多级流，也就是说，多个agent可以协同工作，并且支持Fan-in、Fan-out、Contextual Routing、Backup Routes，这也正是NB之处。如下图所示:

日志采集工具Flume有什么用

日志收集实际应用案例：

Flume：日志收集

HDFS/HBase：日志存储

Hive：日志分析

日志采集工具Flume有什么用

以上是“日志采集工具Flume有什么用”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注亿速云行业资讯频道！

原创文章，作者：3628473679，如若转载，请注明出处：https://blog.ytso.com/225681.html

日志采集工具Flume有什么用

相关推荐

发表回复