怎样解析Spark2.2.0 MLlib

怎样解析Spark2.2.0  MLlib,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

Spark MLlib概述

MLlib是Spark的机器学习(Machine Learning)库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。
MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
1.Spark MLlib算法库
Spark Mllib能够提供所有类型的机器学习算法:

怎样解析Spark2.2.0  MLlib

MLlib: Main Guide

Basic statistics 基本统计
Pipelines 管道
Extracting, transforming and selecting features 特征提取、转换和选择
Classification and Regression   分类和回归
Clustering       聚类
Collaborative filtering   协同过滤
Frequent Pattern Mining   频繁模式挖掘
Model selection and tuning   模型选择与调优
Advanced topics       高级主题

MLlib: RDD-based API Guide

Data types   数据类型
Basic statistics         基本统计
Classification and regression 分类和回归
Collaborative filtering   协同过滤
Clustering 聚类
Dimensionality reduction 降维
Feature extraction and transformation 特征抽取和转换
Frequent pattern mining 频繁模式挖掘
Evaluation metrics 评价指标
PMML model export PMML模型导出
Optimization (developer) 优化(开发者)

关于怎样解析Spark2.2.0  MLlib问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。