开源

  • 第二章 Data Processing Using the DataStream API

    第二章 Data Processing Using the DataStream API (中英对照)                        转载需标明出处          &…

    大数据 2021年11月16日
  • spark2.x由浅入深深到底系列六之RDD java api用JdbcRDD读取关系型数据库

    学习任何的spark技术之前,请先正确理解spark,可以参考:正确理解spark 以下是用spark RDD java api实现从关系型数据库中读取数据,这里使用的是derby本地数据库,当然可以是mysql或者oracle等关系型数据库: pack…

    大数据 2021年11月16日
  • 环形队列高效触发大量超时任务的算法实现

    基于环形队列的超时触发算法只需要一个timer即可实现批量超时任务的触发,CPU消耗低,效率高。原理介绍,下面是此算法的简单实现。 1,TaskHolder.java package com.zws.timer; /**  *   *&nbs…

    大数据 2021年11月16日
  • Yarn架构

    Yarn是为了解决MRv1中JobTracker负载过重,而设计的第二代MR运行架构。yarn是个master/slave结构,master节点运行Resourcemanager,slave节点运行nodemanager。 RM主要有两个组件:资源调度器(scheduler)和应用程…

    大数据 2021年11月16日
  • Lintcode3 Digit Counts solution 题解

    【题目描述】 Count the number of k's between 0 and n. k can be 0 - 9. 计算数字k在0到n中的出现的次数,k可能是0~9的一个值。 【题目链接】 http://www.lintcode.com/en/problem/digit-counts/ 【题目解析】 方…

    大数据 2021年11月16日
  • 详细到没朋友,一文帮你理清Linux 用户与用户组关系~

    1、用户和用户组文件 在 linux 中,用户帐号,用户密码,用户组信息和用户组密码均是存放在不同的配置文件中的。 在 linux 系统中,所创建的用户帐号和其相关信息 (密码除外) 均是存放在 / etc/passwd 配置文件中。…

    大数据 2021年11月16日
  • Hadoop单点部署与案例开发(微博用户数据分析)

    一、环境搭建 1、Hadoop运行环境搭建 1.1 安装虚拟机 (1)下载并安装VMware虚拟机软件。 (2)创建虚拟机,实验环境虚拟机配置如下图所示。 (3)安装Ubuntu系统,安装结果如下图所示。 1.2  配置JDK环境 下…

    大数据 2021年11月16日
  • 驱动认证的优势

    通过WHQL认证后的几大优势: Windows系统自动安装、安装驱动的时候无任何警告框、加载驱动无需“禁用驱动程序强制签名”。 获得硬件驱动程序的数字签名是高质量的驱动程序,减少产品召回,降低售后服务成本。 授权在…

    大数据 2021年11月16日
  • LoadRunner性能测试-下载文件脚本

    Loadrunner下载文件脚本   Action() {          intflen;   //定义一个整型变量保存获得文件的大小          lo…

    大数据 2021年11月16日
  • APM入门与实战

    篇幅一:APM基础篇 1、什么是APM? APM,全称:Application Performance Management ,目前市面的系统基本都是参考Google的Dapper(大规模分布式系统的跟踪系统)来做的,翻译传送门《google的Dapper 中文翻译》 思…

    大数据 2021年11月16日