数据分析
-
sqoop从greenplum到数据到hive中详解大数据
关于sqoop原理详见官文,这里都不做介绍,此处就记录用sqoop把greenplum数据导到hive中的方法和我测试时候遇到的问题; 一:sqoop的解压安装后,配置sqoop-…
-
svm算法 最通俗易懂讲解详解大数据
最近在学习svm算法,借此文章记录自己的学习过程,在学习很多处借鉴了z老师的讲义和李航的统计,若有不足的地方,请海涵;svm算法通俗的理解在二维上,就是找一分割线把两…
-
线性回归原理和实现基本认识详解大数据
一:介绍 定义:线性回归在假设特证满足线性关系,根据给定的训练数据训练一个模型,并用此模型进行预…
-
租房大数据-2016年如何在北京租到好房子详解大数据
作者注:本文为“沙漠之鹰”原创文章,为了保证行文流畅,没有插入实现代码,简单统计分析博客园的读者应该都能做。 &…
-
北京买房的10点建议详解大数据
买房是一件大事,好处是你再也不用担心年年涨价的房租,不用住墙壁脱皮的次卧,能挑选自己心爱的家具和心爱的人温馨的住在一起。坏处是更久的通勤时间…
-
2015北京楼市涨价地图解密详解大数据
应不少读者的要求,笔者总结北京2014年到2015年涨幅较大的几个区域,并按照涨价百分比(而非绝对涨价值)绘制了如下的北京楼市涨跌地图: 同时,笔者总结了涨价幅度较高的六大区域(凑…
-
etlpy: 并行爬虫和数据清洗工具(开源)详解大数据
etlpy是python编写的网页数据抓取和清洗工具,核心文件etl.py不超过500行,具备如下特点 爬虫和清洗逻辑基于xml定义,不需手工编写 基于python生成器,流式处理…
-
你能排第几2016互联网行业薪酬数据分析详解大数据
(本文为原创文章,转载请站内联系“沙漠之鹰“博主作者) 之前写了不少房价分析文章,太俗。那咱们今天就一俗到底,谈谈钱吧。什么样的职业需求量大薪资高?选产品还是技术?什么是最好的编程…
-
光棍节之夜,用数据分析帮女神学姐选婚房详解大数据
(本文成文于2015年11月12日,为作者原创,发布在博客园方便诸君阅读) 前段时间发了一篇分析房价的文章,于是这两天在微信上咨询我的朋友络绎不绝。今天是光棍节,我什么都没抢到。下…
-
我所理解的数据分析详解大数据
(本文成文于2015年8月3日) “大数据”已经成了一个风口,几乎所有人都在谈论它。但真正理解其核心概念的人屈指可数,我也在其边缘徘徊。但起码我知道: 数据…