数据湖
-
链接详解大数据
链接 是将各种代码和数据部分收集起来并组合成一个单一可执行文件的过程,这个文件可被加载到存储器并执行、链接可以在编译时(源代码被翻译成机器代码时候)、加载时执行,也可以在程序被加载…
-
虚拟存储器详解大数据
虚拟存储器 一个系统中的进程是与其他进程共享CPU和主存资源的,然而,共享主存会形成一些特殊的情况,如果太多的进程需要太多的储存器,那么他们中的一些就根本…
-
深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件详解大数据
在求取有约束条件的优化问题时,拉格朗日乘子法(Lagrange Multiplier) 和KKT条件是非常重要的两个求取方法,对于等式约束的优化问题,可以应用拉格朗日乘子法去求取最…
-
机器学习之 损失函数和风险函数详解大数据
损失函数 监督学习问题是在假设的空间F中选取模型 f 作为决策函数,对于给定的输入 X,由 f(x) 给定输出Y, 这个输出的预测…
-
sqoop从greenplum到数据到hive中详解大数据
关于sqoop原理详见官文,这里都不做介绍,此处就记录用sqoop把greenplum数据导到hive中的方法和我测试时候遇到的问题; 一:sqoop的解压安装后,配置sqoop-…
-
svm算法 最通俗易懂讲解详解大数据
最近在学习svm算法,借此文章记录自己的学习过程,在学习很多处借鉴了z老师的讲义和李航的统计,若有不足的地方,请海涵;svm算法通俗的理解在二维上,就是找一分割线把两…
-
线性回归原理和实现基本认识详解大数据
一:介绍 定义:线性回归在假设特证满足线性关系,根据给定的训练数据训练一个模型,并用此模型进行预…
-
租房大数据-2016年如何在北京租到好房子详解大数据
作者注:本文为“沙漠之鹰”原创文章,为了保证行文流畅,没有插入实现代码,简单统计分析博客园的读者应该都能做。 &…
-
北京买房的10点建议详解大数据
买房是一件大事,好处是你再也不用担心年年涨价的房租,不用住墙壁脱皮的次卧,能挑选自己心爱的家具和心爱的人温馨的住在一起。坏处是更久的通勤时间…
-
2015北京楼市涨价地图解密详解大数据
应不少读者的要求,笔者总结北京2014年到2015年涨幅较大的几个区域,并按照涨价百分比(而非绝对涨价值)绘制了如下的北京楼市涨跌地图: 同时,笔者总结了涨价幅度较高的六大区域(凑…