数据湖
-
决策树分类详解大数据
一:分类的概念 分类是一种重要的数据分析形式,分类方法用于预测数据对象的离散类别,而预测则用于预测数据对象的连续取值;…
-
机器学习 贝叶斯分类详解大数据
一:贝叶斯分类介绍 贝叶斯分类器是一个统计分类器。它们能够预测类别所属的概率,如:一个数据对象属于某个类别的概率。贝叶斯分类器是基于贝叶斯定理而构造出来的。对分类方法进行比较的有关…
-
神经网络分类算法 数据挖掘详解大数据
神经网络分类介绍: 神经网络就是一组相互连接的输入输出单元,这些单元之间的每个连接都关联一个权重。在网络学习阶段,网络…
-
处理器体系结构详解大数据
一:指令周期的基本概念 (1)指令周期 CPU取出一条指令并执行该指令所需的时间称为指令周期。指令周期的长短与指令的复杂程度有关。 (2)CPU周期 指令周期常常用若干个CPU周期…
-
SparkMlib实现线性回归详解大数据
关于线性回归的原理请参考Coursera上斯坦福大学Andrew Ng教授的“机器学习公开课” 下面直接到sparkMlib实现线性回归,spark源码下有两个关于机器学习的包,一…
-
sparkMlib逻辑回归分析实现详解大数据
参考 Coursera上斯坦福大学Andrew Ng教授的“机器学习公开课”: 逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻…
-
sparkmlib使用Pipeline实现简单的逻辑回归详解大数据
MLib 机器学习算法的标准API可以很方便的把多个算法整合到一个pipeline中,并可以把整个过程形象的比如机器学习算法流; Pipeline包括三个阶段: 第一阶段:Toke…
-
sparkMlib实现协同过滤算法详解大数据
协同过滤常被应用于推荐系统。这些技术旨在补充用户-商品关联矩阵中所缺失的部分。MLlib当前支持基于模型的协同过滤,其中用户和商品通过一小组隐语义因子进行表达,并且这些因子也用于预…
-
优化程序性能详解大数据
编写高效的程序需要以下活动: 1:选择合适的算法和数据结构—算法优化 2:必须编写出编译器能够有效优化及转化成高效执…
-
存储器层次结构详解大数据
存储器系统: 一个具有不同容量,成本和访问时间的存储设备层次结构;CPU寄存器保存着最常用的数…