100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 大数据workshop:《用户行为分析:基于流式计算的数据处理及应用》之《实时数据分

大数据workshop:《用户行为分析:基于流式计算的数据处理及应用》之《实时数据分

时间:2021-08-18 01:43:12

相关推荐

大数据workshop:《用户行为分析:基于流式计算的数据处理及应用》之《实时数据分

实验背景介绍

了解更多云栖大会·成都峰会 TechInsight & Workshop.

本手册为云栖大会Workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《实时数据分析:海量日志数据多维透视》篇所需。主要帮助现场学员熟悉并掌握阿里云数加·分析型数据库AnalyticDB的操作和使用。

实验涉及大数据产品

分析型数据库AnalyticDB

前提准备

必备条件:确保已经获取到实验所需的阿里云账号和密码。

创建AnalyticDB表

通过DMS创建AnalyticDB数据表可以通过可视化建表和SQL窗口建表两种模式。

1.可视化建表

step1:进入DMS for AnalyticDB并使用阿里云账号进行登录。step2:选择进入区域华北2,继而点击操作栏中的进入,进入workshop_demo数据库。step3:根据自己获取的阿里云账号后三位数字选择进入对应表组。

【说明】如当前云账号为train00620@aliyun-,那么选择进入表组workshop_620。

step4:右键对应的表组,选择新建表进入可视化创建表模式。step5:配置表名、字段名称、数据类型、主键,选择对应表组、一级分区列和更新方式,如下图所示。

其中表组选择自己云账号对应的表组,一级分区列选择为pv_time,分区方式中的哈希分区数为8.

表属性中表组选择自己账号所对应的表组,表名为pv_abc(abc同为账号后三位数字),如pv_day_620。因为表名在同一个AnalyticDB数据库中应全局唯一。

step6:在新建表页面底部,点击保存按钮。step7:在提交变更弹出框中点击确定按钮,直至提示“变更执行成功”,如下图。

2.通过SQL窗口创建表

也可以通过DDL模式创建天浏览量pv的表,pv_day_abc(同上,abc为账号后三位数字)。

step1:点击顶部菜单栏中的SQL窗口,进入DDL模式。step2:在SQL窗口中依次复制并执行如下SQL代码。

建表SQL如下:(其中需要注意自己的表名、一级分区列以及建表所属的表组tablegroup属性。)

--统计当天实时浏览量pvCREATE TABLE pv_day_620 (pv_time varchar NOT NULL , pv_count bigint NOT NULL , primary key (pv_time)) PARTITION BY HASH KEY(pv_time) PARTITION NUM 8TABLEGROUP workshop_620OPTIONS(UPDATETYPE='realtime');

step3:右键对应的表组,选择刷新查看已经创建成功的表。

由于时间关系,关于区域访问量、按照小时统计浏览量、按设备统计浏览量和统计请求来源量的建表将不在此进行动手操作,但是讲师会给大家讲解。workshop结束后,会将所有指标统计过程的代码开发给大家进行体验。

>>>点击进入《流数据处理:通过StreamSQL分析用户行为》篇

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇...

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。