机器学习-阿里机器学习pai走读(1-源/目标)

背景

公司较多的使用了阿里的产品,特别是云数据库rds和大数据max compute(原odps),那么,使用机器学习pai进行机器学习和数据挖掘,理论上来说是首选(因为pai和max compute的数据是互通的)。
本博客系列将走读一下pai的基础功能,带有相关的实战和应用分析。

实战操作

创建实验

新建一个实验,所有的实战过程必须在实验中进行
机器学习-阿里机器学习pai走读(1-源/目标)

数据读取

直接使用pai的读数据表组件,设置max compute的数据表
机器学习-阿里机器学习pai走读(1-源/目标)
机器学习-阿里机器学习pai走读(1-源/目标)
右键组件框,选择查看数据,就可以查看前100条数据。
机器学习-阿里机器学习pai走读(1-源/目标)

理论分析

  • 数据源可以是阿里系列的表格,这个功能具有很大的优势。我的数据主要从odps上面来,能在不影响业务性能的情况下,自行使用
  • 数据源打通的过程,本质是在使用sql直接操作odps

评价

pai可以可视化的引入数据,甚至都不需要sql,能大大的提高效率。