怎样解析Spark2.2.0 MLlib

怎样解析Spark2.2.0 MLlib，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

Spark MLlib概述

MLlib是Spark的机器学习（Machine Learning）库，旨在简化机器学习的工程实践工作，并方便扩展到更大规模。
MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。
1.Spark MLlib算法库
Spark Mllib能够提供所有类型的机器学习算法：

MLlib: Main Guide

Basic statistics	基本统计
Pipelines	管道
Extracting, transforming and selecting features	特征提取、转换和选择
Classification and Regression	分类和回归
Clustering	聚类
Collaborative filtering	协同过滤
Frequent Pattern Mining	频繁模式挖掘
Model selection and tuning	模型选择与调优
Advanced topics	高级主题

MLlib: RDD-based API Guide

Data types	数据类型
Basic statistics	基本统计
Classification and regression	分类和回归
Collaborative filtering	协同过滤
Clustering	聚类
Dimensionality reduction	降维
Feature extraction and transformation	特征抽取和转换
Frequent pattern mining	频繁模式挖掘
Evaluation metrics	评价指标
PMML model export	PMML模型导出
Optimization (developer)	优化（开发者）

关于怎样解析Spark2.2.0 MLlib问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注行业资讯频道了解更多相关知识。

怎样解析Spark2.2.0 MLlib

Spark MLlib概述

MLlib: Main Guide

MLlib: RDD-based API Guide

相关推荐