2017云栖大会·杭州峰会:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇
2017云栖大会·杭州峰会:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇
实验背景介绍
了解更多2017云栖大会·杭州峰会 TechInsight & Workshop.
本手册为云栖大会·杭州峰会Workshop《云计算·大数据:海量日志数据分析与应用》的《数据分析展现:可视化报表及嵌入应用》篇而准备。主要阐述如何使用BDP个人版制作报表,将前面几个实验处理分析得来的数据进行有效的展现和洞察。
《数据加工:用户画像》实验中的结果表数据已经事先导入RDS中,表名为rpt_user_info_all_d。该表包含了:用户id、地区、性别、年龄范围、星座、访问设备、PV 等访问信息。
实验目标
承接前述实验加工好的数据表,通过BDP个人版完成网站用户分析画像的仪表板。
- 在该仪表板中,将展示用户的地区分布、设备分布和访问明细记录。
- 并能够根据年龄范围的查询条件,动态更新图表数据内容。
涉及大数据产品
实验环境准备
必备条件:
确保阿里云账号处于登录状态。
- step1:点击进入BDP个人版。
- step2:**选中规格为“金钻会员”,周期为“单月”**。
- step5:成功开通BDP个人版。
进入BDP个人版
确保阿里云账号处于登录状态。
- step1:点击进入BDP个人版。
- step2:点击进入BDP个人版。
添加数据源
《数据加工:用户画像》实验将数据导入云数据库RDS后,可以利用BDP个人版添加为数据源进行分析和展示。本章节为了大家快速的掌握BDP个人版的使用提前将数据给大家拷贝了一份在官方的RDS里,大家只需要配置即可用。
- step1:点击顶部**数据源**,进入数据源管理页,点击**添加数据源**。
- step2:在**添加数据源**界面,切换至**数据库**标签页,点击**RDS For MySQL**。
[说明] 数据量千万级别,响应速度秒级。添加RDS数据源,可以直联任何一个云上RDS数据库,或ECS中用户自建的RDS。
- step3:在**添加数据源 MySQL**界面,进行**连接配置**后,点击**下一步**。
RDS for MySQL数据源配置信息如下:
- 显示名称:workshop
- 数据库地址:rds955b606xk7e564006.mysql.rds.aliyuncs.com
- 端口:3306
- 数据库:workshop
- 用户名/密码:demo_001/demo_001
- step4:在**添加数据源 MySQL**界面,进行**数据表配置**后,点击**下一步**。
- step5:在**添加数据源 MySQL**界面,进行**高级配置**后,点击**确定**。
- step6:在“添加成功”界面,击**回到我的数据源**。在**数据源**页面中,能够看到新添加的数据源。
工作表建模
说明:
- 1. 将对表的加工过程固化保存下来以避免重复操作。
- 2. 常见加工:修改字段的数据类型、修改维度的类型、增加计算字段、创建合表、切换工作表类型。
- step1:点击**工作表**按钮,进入编辑工作表页面,点击左侧文件夹workshop,查看工作表rpt_user_info_all_d。
- step2:确认工作表中各字段数据类型是否合理。pv为数值类型,其他所有字段均为文本类型。
制作仪表板
与上一节衔接,将分析结果固化为可视化报表。随着数据的更新,报表可视化展现最新数据。我们把这个过程叫制作仪表板。
制作思路:确定内容->确定布局和样式->制作图表->实现动态联动查询。
制作模板如下:
【说明】仪表板创作界面的工具布局:
- step1:点击主导航上的**仪表盘**菜单,点击**+**下拉菜单下的**创建文件夹**按钮,在弹出的窗口中,**所属文件夹**选择**根目录**,**文件夹名称**填写**我的文件夹**。
- step2:点击**+**下拉菜单下的**创建仪表盘**按钮,在弹出的窗口中,**文件夹名称**选择**我的文件夹**,**仪表盘名称**填写**我的仪表盘**,**仪表盘类型**为**普通仪表盘**。
step3-5为创建含有钻取层级的图表,能够钻取查看用户访问的地域分布情况。
- step3:点击**添加图表**,在新建图表弹框中,选择**普通图表**,在图表编辑页面,将**region**拖拽到维度,**pv**拖拽到数值,默认聚合方式为求和,图表类型调整至**地图(面积)**,统计设置为默认状态**(按省汇总,显示全国)**,图表样式调整为**显示图表标签**,图表命名为**PV按地区分布**。