数据分析

  • Hadoop-调优剖析详解大数据

    1.概述   其实,在从事过调优相关的工作后,会发现其实调优是一项较为复杂的工作。而对于Hadoop这样复杂且庞大的系统来说,调优更是一项巨大的工作,由于Hadoop包含Commo…

    大数据 2022年1月11日
  • MapReduce-深度剖析详解大数据

    1.概述   在接触了第一代MapReduce和第二代MapReduce之后,或许会有这样的疑惑,我们从一些书籍和博客当中获取MapReduce的一些原理和算法,在第一代当中会有J…

    大数据 2022年1月11日
  • Hadoop2.x源码-编译剖析详解大数据

    1.概述   最近,有小伙伴涉及到源码编译。然而,在编译期间也是遇到各种坑,在求助于搜索引擎,技术博客,也是难以解决自身所遇到的问题。笔者在被询问多次的情况下,今天打算为大家来写一…

    大数据 2022年1月11日
  • Hadoop – 任务调度系统比较详解大数据

    1.概述   在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任务的运行情况的监控,异常问题的排…

    大数据 2022年1月11日
  • Hadoop – 实时查询Drill详解大数据

    1.概述   在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为…

    大数据 2022年1月11日
  • Hadoop-Drill深度剖析详解大数据

    1.概述   在《Hadoop – 实时查询Drill》一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节…

    大数据 2022年1月11日
  • HBase – Phoenix剖析详解大数据

    1.概述   在《Hadoop-Drill深度剖析》一文当中,给大家介绍了Drill的相关内容,就实时查询来说,Drill基本能够满足要求,同时还可以做一个简单业务上的聚合,如果在…

    大数据 2022年1月11日
  • Hadoop – Ambari集群管理剖析详解大数据

    1.Overview   Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Am…

    大数据 2022年1月11日
  • Hadoop – Kylin On OLAP详解大数据

    1.概述   Apache Kylin是一个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。 2.What …

    大数据 2022年1月11日
  • 数据分析常用图表有哪些?数据分析怎么弄曲线图?

    企业或者单位想要汇总和收集数据,可以直接做成数据表或者数据图。数据表制作需要先收集数据,然后将数据录入表格。若是制作成图,可以制作成各种数据图,比如在线生成柱状图、饼状图、异形图等…

    大数据 2021年12月30日