因为工作需要需要做一些与大数据开发有关的工作,加之网上的知识过于分散,经常往图书馆跑。看了很多与数据相关的书籍,认为以下基本比较不,错推荐给大家。因为本人接触大数据不足一年,肯定会有一些错误的观念,有错误的地方欢迎在文章下方的评论中评论。
1、《解惑大数据 》人民邮电出版社, 2013,丁圣勇,樊勇兵,闵世武编著。
此书综合讲解有关大数据的相关术语和概念,看此书的技术要求较低,非常适合想学习大数据和对大数据相关概念模糊的人员阅读。
2、《写给大忙人的Hadoop2》电子工业出版社,2016,Douglas Eadline著 ,卢涛、李颖翻译。
在技术类的书籍中“写给大忙人”系列书籍中的文字几乎句句都是干货,虽不适合新手阅读,但利于对整体知识有一个大概的了解,所以在此推荐此书。书中以hadoop v2 为主对比hadoop1进行讲解。不管是开发还是运维阅读此书相信会对您的工作带来很大的帮助。正如书中所说,“不应再把Hadoop当做整体的单独项目,而是应将其当做一种从根本上不通于传统的关系数据库模型的数据处理方法”、“一个更加务实的Hadoop定义是,一个开放(和封闭)源码工具、库和大数据分析方法的生态系统和框架”,由此可见要想学习大数据,学好Hadoop是至关重要的。
3、《Hadoop权威指南》清华大学出版社,2015第三版 ,Tom White 著 华东师范大学数据科学与工程学院译。
Hadoop之父Doug Cutting为此书做序,第三版新添加了hadoop2 的新特性的讲解,对hadoop2.x的深入学习有很大帮助,更可以作为工具书在工作中随时翻阅。如果你的英语水平较好,建议阅读此书第四版《,Hadoop: The Definitive Guide, 4th Edition》。
4、《Hive编程指南》人民邮电出版社,2013,Edward Capriolo ,Dean Wampler,Jason Rutherglen 著 ,曹坤译。
单独讲解Apache Hive的书籍非常少,个人认为此书写的比较权威,对Hive有一个全面的讲解,同时本书作者自身也是Hadoop/Hive项目的贡献者。
5、《Learning HBase》电子工业出版社,2015,Shashwat Shriparv 著,周彦伟、娄帅、浦聪译。
本书对HBase进行了全面讲解,适合开发也运维必读的工具用书。此书对本人的工作带来了非常大的帮助。
6、《Spark 最佳实践》人民邮电出版社 图灵原创,2016,陈欢 、林世飞著。
此书正如书名所说“最佳实践”,从基础讲解到应用案例进行了详细的讲解,即使对Spark 零基础也非常适合阅读此书。另外本书附录中的“Scala语言参考”让本人对Scala入门学习带来了非常大的帮助。
后期如发现好书还会继续推荐,同时欢迎大家在本文评论区推荐你们认为的好书。
原创文章,作者:3628473679,如若转载,请注明出处:https://blog.ytso.com/186648.html