案例为王，实战为主，基于spark2.x机器学习十大案例全方位剖析

课程下载地址：https://pan.baidu.com/s/1LuffQVoVjJjDkN3jT2TfQA 提取码: ytyc

本课程主要讲解Spark MLlib，Spark MLlib是一种高效、快速、可扩展的分布式计算框架；实现了常用的机器学习，如：聚类、分类、回归等算法。本课拒绝枯燥的讲述，将循序渐进从Spark的基础知识、矩阵向量的基础知识开始，然后再透彻讲解各个算法的理论、详细展示Spark源码实现，最后均会通过实例进行解析实战，帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。

十大案例全方位剖析：
案例1、基于Kaggle的StumbleUpon数据集构建分类系统
案例2、基于BikeSharing数据集构建回归模型
案例3、基于NewsCorpora数据集文本处理新闻分类
案例4、基于KMeans网络流量检测模型
案例5、基于Kaggle Avazu广告数据集构建CRT预测模型
案例6、基于聚类KMeans出租车轨迹分析
案例7、基于决策树预测森林植被
案例8、基于DataFrame API ML预测森林植被
案例9、基于Audioscrobbler数据集的音乐推荐
案例10、基于MovieLens数据集的电影推荐

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/196299.html

案例为王，实战为主，基于spark2.x机器学习十大案例全方位剖析

相关推荐

发表回复