开源

  • 数据挖掘-Mahout-Canopy聚类实践

    1、原理解释 (1)原始数据集合List按照一定的规则进行排序,初始距离阈值设置为T1、T2,T1>T2。 (2)在List中随机挑选一个数据向量A,使用一个粗糙距离计算方式计算A与List中其它样本数据向量之间的距离d。 (3)根…

    大数据 2021年11月16日
  • spark VS Hadoop 两大大数据分析系统深度解读

    大数据,无论是从产业上,还是从技术上来看,都是目前的发展热点。在中国,政府控制着80%的数据,剩下的多由“BAT”这样的大公司拥有,中小企业如何构建自己的大数据系统?其他企业如何建设自己的大数据系统?  …

    大数据 2021年11月16日
  • Loadrunner进行http接口压力测试

    附件来自百度。 脚本正文: /*  * LoadRunner Java script. (Build: _build_number_)  *   * Script Description:   *                 &n…

    大数据 2021年11月16日
  • Jmeter之仿真高并发测试(集合点)

    场景: 大家在使用Jmeter测试的时候应该发现了, (1)线程启动了就会直接发送测试请求;--如果要模拟在一瞬间高并发量测试的时候,需要调高线程数量,这很耗测试机器的性能,往往无法支持较大的并发数,无法控制每…

    大数据 2021年11月16日
  • Flink在饿了么的应用与实践

    本文作者:易伟平(饿了么) 整理:姬平(阿里巴巴实时计算部) 本文将为大家展示饿了么大数据平台在实时计算方面所做的工作,以及计算引擎的演变之路,你可以借此了解Storm、Spark、Flink的优缺点。如何选择一个合…

    大数据 2021年11月16日
  • servlet 与 springboot

    @WebServlet(name = "httpServletDemo", urlPatterns = "/httpServletDemo", initParams = { @WebInitParam(name = "name", value = "username"), @WebInitParam(name = "mobile", value = "1232423434") }) @Contr…

    大数据 2021年11月16日
  • Junit 多组测试数据测试

    使用 Junit 指定多组测试数据进行测试。 测试方法使用的 SHA3Utils 代码仓库地址: java-core Parameterized 测试 批量指定多个待测参数, 按数据逐一测试 import org.junit.Test; import org.junit.runner.RunWith; …

    大数据 2021年11月16日
  • hadoop的端口简介

    hadoop的端口: 50070 //namenode http port 50075 //datanode http port 50090 //2namenode http port 8020 //namenode rpc port 50010 //datanode rpc port   查看端口  netstat -ano | more  &nb…

    大数据 2021年11月16日
  • mapreduce原理

    MapReduce从它名字上来看就大致可以看出个缘由,两个动词Map和Reduce,“Map(展开)”就是将一个任务分解成为多个任务,“Reduce”就是将分解后多任务处理的结果汇总起来,得出最后的分析结果。这不是什么新思想,其实…

    大数据 2021年11月16日
  • 手机拨号键输入*#06# 查到的是什么信息

    手机拨号键输入#06# 查到的是什么信息手机在拨号键盘按#06#的时候会出现手机的IMEI码。这个IMEI码又叫手机串号,使手机唯一的身份识别代码,跟人的×××号码一样,每一部手机都有这样一个唯一的代码,通过这个代码可…

    大数据 2021年11月16日