开源

  • Apache Druid是什么?适用于什么场景?

    今天小编给大家分享的是Apache Druid的详细介绍,相信大部分人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,话不多说,一起往下看吧。 Apache Druid是一个高性能的实时分析型数据库。 概览 一个现代…

    大数据 2021年11月4日
  • 想学习大数据?这才是完整的大数据学习体系

    干货走起,闲话不多说,以下就是小编整理的大数据学习思路 第一阶段:linux系统 本阶段为大数据学习入门基础课程,帮大家进入大数据领取打好Linux基础,以便更好的学习Hadoop、habse、NoSQL、saprk、storm等众多技…

    大数据 2021年11月4日
  • haoop任务失败,修改代码设置解决问题

    一、跑etl任务,报错:Container [pid=31306,containerID=container_1479290736535_0004_01_000003] is running beyond physical memory limits. Current usage: 2.7 GB of 2.5 GB physical memory used;…

    大数据 2021年11月4日
  • 敏捷项目管理-用户画像

    用户故事:卡片、对话和确定;基于三个步骤进行开展。 举例:项目:A公司是一家检测设备公司下的子公司,主要服务对象是制造业,由于早起软件系统陈旧,导致客户满意度很低。公司决定,面向制造业的痛点,重新开发…

    大数据 2021年11月4日
  • 如何提升测试用例设计水平?

    一、定义 测试用例(Test Case)是为某个特殊目标而编制的一组测试输入、执行条件及预期结果,以便测试某个程序路径或核实是否满足某个特定需求。 首先,测试需要保证以下两点: 程序做了它应该做的事情 程序没有做…

    大数据 2021年11月4日
  • spark-sql的进阶案例

    (1)骨灰级案例--UDTF求wordcount 数据格式:每一行都是字符串并且以空格分开。代码实现: object SparkSqlTest { def main(args: Array[String]): Unit = { //屏蔽多余的日志 Logger.getLogger("org.apache.hadoo…

    大数据 2021年11月4日
  • Elasticsearch常用操作:映射篇

    [TOC] 其实就是es的字段类型是由es来做自动检测还是由我们自己来指定,因此会分为动态映射和静态映射。 1 动态映射 1.1 映射规则 JSON格式的数据 自动推测的字段类型 null 没有字段被添加 true or false boolean类…

    大数据 2021年11月4日
  • 公司为什么需要建立一套统一的开发框架?

    一、起因:野蛮生长 近十年,中国互联网发展的速度越来越快,互联网科技颠覆了越来越多的传统行业,我们的衣食住行随着互联网科技的进步,发生了翻天覆地的变化。在这个大潮中,越来越多新兴的公司如雨后春笋般的冒…

    大数据 2021年11月4日
  • 0032-如何在CDH启用Kerberos的情况下安装及使用Sentry(二)

    温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 5.Sentry列权限管理 1.在集群所有节点添加fayson_r用户 [root@ip-172-31-6-148 cdh-shell-bak]# useradd fayson_r [root@ip-172-31-6-148 cdh-she…

    大数据 2021年11月4日
  • 浅析那些大型职业技术交流群是怎么被玩变质的?

    首先,先介绍下自己,看文章得知道作者是干嘛的 IDO老徐,互联网从业者,软件测试老鸟,08年开始从事软件测试职业;前后经历3家公司,从测试小菜到公司测试负责人,带领测试团队对公司整个产品体系负责; 专注测试…

    大数据 2021年11月4日