100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 科大讯飞AI营销云广告投放数据分析报告【实战总结】

科大讯飞AI营销云广告投放数据分析报告【实战总结】

时间:2022-11-03 03:06:28

相关推荐

科大讯飞AI营销云广告投放数据分析报告【实战总结】

4月份项目实战的总结,前后进行了约20多天。

花了大量时间在清洗数据,虽然耗时但是觉得过程中很享受,喜欢“静静地泡在里面”的感觉。

另外,了解了涉及到的广告投放、业务指标体系、手机设备版本及API等相关知识,有趣!

感受:分析问题的思路 比 代码的实现更为重要

项目背景:科大讯飞AI营销算法大赛,点击去官网

数据集:选用训练集数据round1_iflyad_train.txt ,每一行数据为一个样本,分为5类数据,包含基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,共1001650条数据。数据经过脱敏处理。

语言:Python+panda、numpy、re、seaborn、matplotlib等第三方类库

完成:

无效数据的删选和过滤,比如NaN,unkown等缺失值缺失值的填补:比如设备品牌make大量缺失值,可以用型号model中含有的品牌信息进行补充,效果非常明显使用正则表达式re库匹配数据,比如各类设备品牌的清洗,比如将iphone,ipad,apple,ios等统一为apple;对操作系统版本型号的提取使用pandas,numpy完成数据的去重、排序、统计计算等,对能进行groupby分组操作的特征进行了汇总统计特征提取:如对城市省份代码进行切割提取特征值,对时间维度进行weekday,hour,segment时段的不同角度的分析,在一定程度上增加信息量数据可视化:使用matplotlib、seaborn库完成图形可视化完成数据分析报告

说明

具体维度的代码实现中,学习到了很多小技能,后续将整理代码陆续上传为了ppt呈现的效果,没有采用pyhton生成的图形,后续做了一版excel版本的图表放入ppt数据经过脱敏处理,数据报告中出现不少数字代码,比如“71”省份,请直接理解为某省份。也正是因为数据脱敏,所以分析更偏向数据,无法对应到业务进行阐述后续代码整理过程中,会进一步完善目前的分析结果

数分报告概图:

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。