开源

  • 数据挖掘有哪些特点

      数据挖掘有哪些特点?很多人都不太了解,数据挖掘基于大量数据、非平凡性、隐含性、新奇性、价值性五个特点,数据挖掘是要发现深藏在数据内部的知识,而不是那些直接浮现在数据表面的信息,挖掘结果必须能给企…

    大数据 2021年11月4日
  • IMF前期知识储备-What is Spark详细讲解(四大特性)

    Spark 官方网站使用如下简洁的语言描述了Spark 我们可以从中提取出如下信息: Spark是一个引擎 快速 通用 Spark可以用来处理数据 数据是大规模的 Spark本身并不提供数据存储能力,它只是一个计算框架 它的快速体现…

    大数据 2021年11月4日
  • esproc vs python 2 简单计算

    1.添加Age、Fullname字段 esproc: A 1 =now() 2 =file("C://Users//Sean//Desktop//esproc_vs_python//EMPLOYEE.txt") 3 =A2.import@t() 4 =A3.derive(age(BIRTHDAY):Age,NAME+""+SURNAME:Ful…

    大数据 2021年11月4日
  • 用http.get()简单实现网络验证防止客户不给尾款_电脑计算机编程入门教程自学

    首发于:用http.get()简单实现网络验证防止客户不给尾款_电脑计算机编程入门教程自学 http://jianma123.com/viewthread.aardio?threadid=428 给软件加上网络验证是经常需要用到的实用功能,下面简单示范下怎么用http.…

    大数据 2021年11月4日
  • spark-2.4.2.tgz下载及编译

    51CTO没有目录功能么?好难受 ========有任何问题欢迎加企鹅讨论^-^1176738641 ======== 前期准备 文件夹创建 #用户目录下创建五个文件夹 app #存放应用 software #存放应用压缩包 data #存放测试数据 lib #存放jar…

    大数据 2021年11月4日
  • java启动dos命令收集笔记二

    判断device状态是否可以用 @Test public void devices() throws Exception { Person p = new Person(); List<String> deviceslist = p.excmd("adb devices"); //执行adb devices命令 并且存放的list集合中 Li…

    大数据 2021年11月4日
  • Yarn的基础介绍以及job的提交流程

    1.YARN的基础理论 1)关于YARN的介绍:    YARN 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。 2)had…

    大数据 2021年11月4日
  • 敏捷开发一千零一问系列之二十六:如何进行优先级排序?

    问题 如何进行优先级排序?具体故事的优先级,和版本规划的优先级之间有何关系? 分析 敏捷开发里边有很多地方需要多次进行优先级排序,本文将探讨其不同的应用场景,及其关系。 值得注意的一点是,敏捷开发中有无…

    大数据 2021年11月4日
  • 报表-对于多数据进行 分sheet以及 分workbook处理

    /** * 创建本地报表文件 * @param tarinList 需要生成的数据 */ private void createWorkbookInLocal(List<TrainRecordSearchVO> tarinList) { /** * sheetcount:返回当前workbook中最大sheet数,是MAX_…

    大数据 2021年11月4日
  • spark和hive storm mapreduce的比较

    Spark Streaming与Storm都可以用于进行实时流计算。但是他们两者的区别是非常大的。其中区别之一就是,Spank Streaming和Stom的计算模型完全不一样,Spark Streaming是基于RDD的,因此需要将一小段时间内的,比如1…

    大数据 2021年11月4日