大数据 | 第1677页

对xgboost和lightgbm的理解及其调参应该关注的点

这两个算法都是集成学习了分类回归树模型，先讨论是怎么集成的。集成的方法是 Gradient Boosting比如我要拟合一个数据如下：第一次建了一个模型如上图中的折线，效果不是很理想，然后要新建一个模型来综合一下结果…

大数据 2021年11月16日

0

现代软件工程讲义 8 软件的血型

[这是现代软件工程讲义的一篇] 一个软件团队经历了计划/设计/开发等阶段, 达成代码完成 (Code Complete) 这一目标，似乎后面的事情就水到渠成了. 其实不然, 软件生命周期的最后阶段往往是最考验…

大数据 2021年11月16日

0

消息队列之kafka(基础介绍)

一、关于JMS 1. JMS 的基础 JMS是Java提供的一套技术规范。即Java消息服务（Java message service）。应用程序接口。是一个Java平台中关于面向消息中间件的API。用于在两个应用程序之间或者分布式系统中发送消息…

大数据 2021年11月16日

0

电商大数据项目（二）-推荐系统实战之实时分析以及离线分析

电商大数据项目-推荐系统实战（一）环境搭建以及日志，人口，商品分析https://blog.51cto.com/6989066/2325073电商大数据项目-推荐系统实战之推荐算法https://blog.51cto.com/6989066/2326209电商大数据项目-推荐系…

大数据 2021年11月16日

0

处理键值对RDD

保存Key/Value对的RDD叫做Pair RDD。 1.创建Pair RDD: 1.1 创建Pair RDD的方式：很多数据格式在导入RDD时，会直接生成Pair RDD。我们也可以使用map()来将之前讲到的普通RDD转化为Pair RDD。 1.2 Pair RDD转化实例…

大数据 2021年11月16日

0

内存卡的数据保存与读取

,内存卡 2.1数据保存 File file=new File(Environment.getExternalStorageDirectory(), name); …

大数据 2021年11月16日

0

【Druid】Druid读取Kafka数据的简单配置过程

Druid的单机版安装参考：https://blog.51cto.com/10120275/2429912 Druid实时接入Kafka的过程下载、安装、启动kafka过程： wget http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.2.1/kafka_2.11-2.2.1.tgz ta…

大数据 2021年11月16日

0

使用dubbo时applicationContext.xml报错的解决办法

引子最近在为新的小强性能测试班备课，在整理dubbo的时候一直出现applicationContext.xml的报错，我也是最了，最后查了一些资料终于解决解决方案在dubbo的jar包中把dubbo.xsd文件单独copy出来在eclipse中配置如…

大数据 2021年11月16日

0

浅聊Spark的应用场景有哪些？

　　　　Spark 是一种与 Hadoop 相似的开源集群计算环境，是专为大规模数据处理而设计的快速通用的计算引擎，现已形成一个高速发展应用广泛的生态系统，主要应用场景如下：　　1. Spark是基于内存的迭代计算框架…

大数据 2021年11月16日

0

列举系统对接技术的几种常见方式

系统对接最常见的方式是接口方式，运气好的情况下，能够顺利对接，但是接口对接方式常需花费大量时间协调各个软件厂商。因此当前各行业数据孤岛林立，对接业务软件或者是获取软件中的数据存在较大困难,尤其是CS软…

大数据 2021年11月16日

0