开源

  • Python 极简教程(五)输入输出

    输入函数,用于接收键盘输入。主要用于在学习和练习过程中,增加练习的乐趣。让我们的程序相对完整和具备简单的交互能力。输出函数,将代码运行结果打印在控制台上,同样也能让我们观察程序运行的结果。也是为了增…

    大数据 2021年11月14日
  • Hadoop3.x新特性

    Hadoop3.x概述 Hadoop3.x中增强了很多特性,并且也改进了很多地方,是Hadoop2.x的升级(这不是废话吗)。需要注意的是,在Hadoop3.x中,不能再使用jdk1.7,而是需要升级到jdk1.8以上版本。这是因为Hadoop 2.0是基于…

    大数据 2021年11月14日
  • 性能测试之工具对比-ngrinder jmeter loadunner

    性能工具对比 JMeter基于UI操作,容易上手,但是不具备编程能力。其次JMeter基于线程模拟数千用户几乎不可能。Loadrunner这个可以说是应用最多的一个,很方便,但是还是太重。往后的方向肯定是客户端工具逐步向平台…

    大数据 2021年11月14日
  • 数极客发布第10大用户行为数据分析模型-间隔分析

    数极客发布第10大用户行为数据分析模型-间隔分析 一、什么是间隔分析? 在我们分析用户转化行为时,除了利用数极客的6大转化率分析和提升模型之外,我们还会关注用户完成转化所需的时长,数极客间隔分析模型通过任…

    大数据 2021年11月14日
  • Jstorm到Flink 在今日头条的迁移实践

    作者:张光辉 本文将为大家展示字节跳动公司怎么把Storm从Jstorm迁移到Flink的整个过程以及后续的计划。你可以借此了解字节跳动公司引入Flink的背景以及Flink集群的构建过程。字节跳动公司是如何兼容以前的Jstorm作…

    大数据 2021年11月14日
  • 提交stage

      //提交stage,为stage创建一批task,task数量和partition数量相同   private def submitMissingTasks(stage: Stage, jobId: Int) {     logDebug("submitMissingTasks(" + stage + ")") &nbs…

    大数据 2021年11月14日
  • hadoop伪分布式环境搭建:linux操作系统安装图解

    本篇文章是接上一篇《新手入门篇:虚拟机搭建hadoop环境的详细步骤》,上一篇有人问怎么没写hadoop安装。在文章开头就已经说明了,hadoop安装会在后面写到,因为整个系列的文章涉及到每一步的截图,导致文章整体很…

    大数据 2021年11月14日
  • HyperLeger Fabric SDK开发(五)——event

    HyperLeger Fabric SDK开发(五)——event 一、event简介 1、event简介 event包支持访问Fabric网络上的通道事件。事件客户端可以接收区块事件,过滤区块事件,链码事件和交易状态事件。官方文档:https://godoc.org/…

    大数据 2021年11月14日
  • 精彩解密大数据之精绝古城

         Avro schema作为大数据一个项目,它可以算得上精品中的上等品,让学习或者想要学习大数据的人为之倾倒,不断挖掘学习,那么它究竟有着怎样的神秘面纱呢?我们一起来揭开! 为了理解Avro,…

    大数据 2021年11月14日
  • Flume-1.6.0学习笔记(五)sink到hdfs

    鲁春利的工作笔记,谁说程序员不能有文艺范? Flume从指定目录读取数据,通过memory作为channel,然后讲数据写入到hdfs。 Spooling Directory Source(http://flume.apache.org/FlumeUserGuide.html#spooling-direc…

    大数据 2021年11月14日