怎样解析Spark2.2.0 MLlib,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
Spark MLlib概述
MLlib是Spark的机器学习(Machine Learning)库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。
MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
1.Spark MLlib算法库
Spark Mllib能够提供所有类型的机器学习算法:

MLlib: Main Guide
| Basic statistics | 基本统计 |
| Pipelines | 管道 |
| Extracting, transforming and selecting features | 特征提取、转换和选择 |
| Classification and Regression | 分类和回归 |
| Clustering | 聚类 |
| Collaborative filtering | 协同过滤 |
| Frequent Pattern Mining | 频繁模式挖掘 |
| Model selection and tuning | 模型选择与调优 |
| Advanced topics | 高级主题 |
MLlib: RDD-based API Guide
| Data types | 数据类型 |
| Basic statistics | 基本统计 |
| Classification and regression | 分类和回归 |
| Collaborative filtering | 协同过滤 |
| Clustering | 聚类 |
| Dimensionality reduction | 降维 |
| Feature extraction and transformation | 特征抽取和转换 |
| Frequent pattern mining | 频繁模式挖掘 |
| Evaluation metrics | 评价指标 |
| PMML model export | PMML模型导出 |
| Optimization (developer) | 优化(开发者) |
关于怎样解析Spark2.2.0 MLlib问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。
原创文章,作者:carmelaweatherly,如若转载,请注明出处:https://blog.ytso.com/tech/opensource/223439.html