开源

  • Flink在美团的实践与应用

    作者: 刘迪珊 本文整理自8月11日在北京举行的Flink Meetup,分享嘉宾刘迪珊(2015年加入美团数据平台。致力于打造高效、易用的实时计算平台,探索不同场景下实时应用的企业级解决方案及统⼀化服务)。 美团实时计算平…

    大数据 2021年11月16日
  • 超大数据下大批量随机键值的查询优化方案

    一、问题描述 键值查询是很常见的查询场景,在数据表上建有索引后,即使表中数据记录数巨大(几亿甚至几十亿行),用键值查询出单条记录也会很快,因为建立索引后的复杂度只有 logN(以 2 为底)次, 10 亿行数据也…

    大数据 2021年11月16日
  • Hadoop2.6.0学习笔记(三)Hadoop序列化

    鲁春利的工作笔记,谁说程序员不能有文艺范?   序列化和反序列化在分布式数据处理中,主要应用于进程建通信和永久存储两个领域。 序列化(serialization)就是结构化的数据转换为字节流以便在网络上传输或写…

    大数据 2021年11月16日
  • 三、hadoop用户认证--kerberos

    一、HDFS权限问题:默认情况下,HDFS的权限认证是开启的,通过在 hdfs-site.xml中设置 dfs.permissions 为true或者false来开启、关闭。所以当客户端进入hdfs 的用户没有权限时,是无法对hdfs进行操作的。这时候可通…

    大数据 2021年11月16日
  • JVM内存模型

    上图中第6点报错Java.lang.OutOfMemoryError:java heap space 持久代也叫永久代,也叫方法区。存储每一个java类的结构信息:比如运行时常量池,字段和方法数据,构造函数和普通方法的字节码内容以及类、实例、接口…

    大数据 2021年11月16日
  • 使用JMeter测试MQTT协议

    1、MQTT是一个基于客户端-服务器的消息发布/订阅传输协议。MQTT协议是轻量、简单、开放和易于实现的,这些特点使它适用范围非常广泛,本文简单介绍下怎么使用JMeter对MQTT协议做性能测试2、要对MQTT协议进行测试,…

    大数据 2021年11月16日
  • python股票市场数据探索指北

    前言 虽然同花顺之类的金融理财应用的数据足够好了,但还是有自己定制的冲动, 数据自然不会不会比前者好很多,但是按照自己的想法来定制还是不错的。 目标 通过免费的数据接口获取数据,每日增量更新标的历史交易数…

    大数据 2021年11月16日
  • 功能测试用例设计(表格)

    项目名称 参考文档 用例作者 测试者 测试时间 测试环境 硬件环境&软件环境 测试方法 黑盒/白盒 测试类型 功能测试 兼容测试 界面UI.. 用例ID 唯一标识用例 测试目标 描述该用例要实现的功能或目标,明确测试的…

    大数据 2021年11月16日
  • istp论文格式

    istp论文格式 《科技会议录索引》(简称ISTP)创刊于1978年,由美国科学情报研究所编辑出版。该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈…

    大数据 2021年11月16日
  • 大数据服务运营之数据采集

    数据采集过程包括集成、导入、格式化。 数据采集过程中首先集成来自不同来源的数据。数据集成要考虑存储架构、采集方式、接口方式、采集周期等。 在存储架构方面,可以考虑在数据源侧设置数据暂存区(Staging Area…

    大数据 2021年11月16日