大数据

  • 聊下 git 多账户问题

    背景 在使用 git 的时候我们都会面临多账户问题,比较常见的就是公司内部的 gitlab,开源平台 github ,我们都需要在一台电脑上同时使用,这需要解决两个问题。 git 多账号配置 git confi…

    大数据 2021年11月17日
  • Protobuf协议精品应用

      Protobuf应用广泛,尤其作为网络通讯协议最为普遍。本文将详细描述几个让人眼前一亮的protobuf协议设计,对准备应用或已经应用protobuf的开发者会有所启发,甚至可以直接拿过去用。 这里描述的协议设计被用于生产…

    大数据 2021年11月17日
  • 消息队列之kafka(整合flume)

    补充:在flume的的lib中已经有了kafka的依赖包,所以直接使用flume的配置文件即可。这里举出kafka+flume的典型场景:(Kafka-----sink) source :netcat channel:memory sink:kafka sink netcat-kafka.conf #别…

    大数据 2021年11月17日
  • 集算器多维分析服务器方案

    随着数据量的增加,用普通数据库作为多维分析服务器的响应速度越来越差,用户等待时间越来越长。如果采用预汇总方案提速,又需要巨大的存储空间而且存在很多功能盲区。

    大数据 2021年11月17日
  • 线程池类ThreadPoolExecutor介绍

    线程池类为 java.util.concurrent.ThreadPoolExecutor,常用构造方法为:ThreadPoolExecutor(intcorePoolSize, int maximumPoolSize,longkeepAliveTime, TimeUnit unit, BlockingQueue<Runnable>workQueue, R…

    大数据 2021年11月17日
  • storm记录--7-- Maven安装使用

    Maven安装使用 环境准备: JDK1.6 Maven 3.0.4 mveclipse8.6.1 (集成mveclipse) 安装Maven之前要求先确定JDK已经安装配置完成,Maven是Apache下的一个项目。 官网下载Mavenhttp://www.apache.org/dyn/closer.cgi/…

    大数据 2021年11月17日
  • Lucene学习笔记之-核心数据结构PriorityQueue的实现原理

    Luene的核心应用场景是全文检索。简单来说,就是通过用户输入的关键词来匹配相关文档,然后根据匹配程度返回TopN的查询结果给用户。 这里需要解决的一个核心问题就是如何快速返回TopN的结果,这本质上是一个排序的…

    大数据 2021年11月17日
  • 人力资源管理系统中如何应用报表分析

    无论大中小型企业都会有自己的人力资源信息系统,对当前企业所有人员的分层管理,管理人员各方面能力及信息分析,人力资源管理系统是一个体系,展开后有很多模组,如:任用、训练、薪资、福利、员工关系等子系统,…

    大数据 2021年11月17日
  • 数据挖掘领域经典算法——CART算法

    简介 CART与C4.5类似,是决策树算法的一种。此外,常见的决策树算法还有ID3,这三者的不同之处在于特征的划分: ID3:特征划分基于信息增益 C4.5:特征划分基于信息增益比 CART:特征划分基于基尼指数 基本思想 CAR…

    大数据 2021年11月17日
  • MatLab安装后打不开的问题

    因为要用到VC++调用matlab来完成某一项目,我便简单的学习了一下matlab。安装后并不能顺利打开,之后做了一点更改,问题便解决了。 在win7旗舰版上安装matlab之后,如无法打开,情况如下图: 右键->还原以前的版…

    大数据 2021年11月17日