怎样解析Spark2.2.0 MLlib,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
Spark MLlib概述
MLlib是Spark的机器学习(Machine Learning)库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。
MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
1.Spark MLlib算法库
Spark Mllib能够提供所有类型的机器学习算法:
MLlib: Main Guide
Basic statistics | 基本统计 |
Pipelines | 管道 |
Extracting, transforming and selecting features | 特征提取、转换和选择 |
Classification and Regression | 分类和回归 |
Clustering | 聚类 |
Collaborative filtering | 协同过滤 |
Frequent Pattern Mining | 频繁模式挖掘 |
Model selection and tuning | 模型选择与调优 |
Advanced topics | 高级主题 |
MLlib: RDD-based API Guide
Data types | 数据类型 |
Basic statistics | 基本统计 |
Classification and regression | 分类和回归 |
Collaborative filtering | 协同过滤 |
Clustering | 聚类 |
Dimensionality reduction | 降维 |
Feature extraction and transformation | 特征抽取和转换 |
Frequent pattern mining | 频繁模式挖掘 |
Evaluation metrics | 评价指标 |
PMML model export | PMML模型导出 |
Optimization (developer) | 优化(开发者) |
关于怎样解析Spark2.2.0 MLlib问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。
原创文章,作者:carmelaweatherly,如若转载,请注明出处:https://blog.ytso.com/223439.html