文章导览
目标定义
数据获取
数据抽样
探索性分析
数据清洗
用户行为分析
用户消费行为分析
漏斗分析
用户行为和商品种类分析
用户价值度RFM模型分析
1、目标定义
以淘宝APP11月18日-12月18日近1200万+条数据,近1万用户为数据集,探索用户的行为模式。具体指标包括日PV、uv分析,付费率分析、复购情况分析、漏斗流失分析和用户价值RFM分析。
2、数据获取
阿里天池比赛项目:User Behavior Data on Taobao App
网址链接:数据集-阿里云天池
3、数据抽样
选取全部样本
4、探索性分析
4.1分析方向:
查看数据类型、字段、大小、缺失情况,异常情况等
代码实现:
4.2分析结果
4.2.1数据集共有1200+万条左右数据,数据为淘宝APP11月18日至12月18日的用户行为数据,共计6列字段,列字段分别是:
user_id:用户ID,脱敏 整数型
item_id:商品ID,脱敏 整数型
behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示) 整数型
user_geohash:地理位置(加密处理过且有缺失) 字符串型
item_category:品类ID(商品所属的品类) 整数型
time:用户行为发生的时间 字符串型
4.2.2地理位置字段加密处理过,且有缺失。该列数据用不到,可直接删除
4.2.3 time列日期和小时些在一块了,应该隔开成两列,并且改变数据类型。
4.2.4 查看describe属性,未发现异常值
5、数据清洗
缺失值处理
日期列处理
代码展示:
6、用户行为分析
6.1 日访问量、日访客量变化
结果显示如上图所示,
在双十二期间,pv和uv访问量达到峰值。并且可以发现,uv和pv两个访问量数值差距比较大。平时日访问量37万左右,双十二日访问量达到70万,增长近一倍。访客量在双十二也增长一倍左右。同时,因为数据集总人数大约是10000人左右,因此,通过nv值可以分析出双十二期间淘宝用户的日活跃大概是45%浮动。
小时访问量分析
图表显示:pv和uv在凌晨0-5点期间波动情况相同,都呈下降趋势,访问量都比较。同时在晚上18:00左右,pv波动情况比较剧烈,相比来看uv不太明显,因此晚上18:00以后是淘宝用户访问app的活跃时间段
7、用户消费行为分析
定义活跃用户:该天有访问行为的人
定义付费用户:该天有付费行为的人
定义复购行为:一个月内两天以上有购买行为,一天多次不算。
7、1 购物(付费)次数探析
购物(付费)次数分析
付费用户该月平均购物次数 13.5次,最高809次购物,中位数是8次。图表分析,大多数人的购物次数在10次一下。
7.2 该月人均消费变化(付费用户)
因为本数据集中没有消费金额,因此在计算过程中用消费次数代替消费金额
人均消费次数=消费总次数/消费人数
上图显示:
付费用户的人均消费在2.35 次每人每天。双十二达到顶峰人日均3.75 次。
上图为活跃用户的日人均消费次数
上图显示,淘宝活跃用户(有过操作行为的用户)平均每天消费次数比较低,在0.5次左右,双十二期间达到最高值,有2.0左右。
7.3 计算复购率
复购率 = 复购人数/消费人数
计算结果显示:该月用户的复购率是87.1%。
8、漏斗分析
漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。
一般用户逛淘宝的行为流程:
首页-浏览商品/搜索品类-加入购物车-生成订单-开始支付-支付成功
本案例漏斗模型:点击-收藏-加购物车-支付
8.1 流失率分析
代码展示:
上表得出数据:总点击量:11550581;加入购物车量:242556;收藏量:343564;购买量:15点击量-加入购物车量 流失率:97.9\%;收藏量-加入购物车量 流失率:28.4\%;加入购物车量-购买量 流失率:50.6\%通过流失率情况的计算和分析,重视每一环节流失率可能发生的情况。
8.2 不同商品品类的转化率分析
转化率 = 点击量/ 支付量
上图可以看出,大多数的商品转化率在0.1左右。
9、用户价值度RFM模型分析
RFM的含义:
R(Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。
F(Frequency):客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。
M(Monetary):客户在最近一段时间内交易的金额。M值越大,表示客户价值越高,反之则表示客户价值越低。
RFM分析就是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。
上表显示:
对于22用户,为重点用户需要关注;对于21这类忠诚度高而购买能力不足的,可以可以适当给点折扣或捆绑销售来增加用户的购买频率。对于12这类忠诚度不高而购买能力强的,需要关注他们的购物习性做精准化营销。