跳至主要內容

关于跳槽手抓饼可行性的分析报告

Jelly大约 3 分钟数据分析数据分析

网络消费者购买行为分析

引言

如今电商蓬勃发展,产生大量的购物信息,如何利用这些购物信息为消费者提供更良好的购物体验成了亟待解决的问题。本文将对该数据集进行数据挖掘,找到其潜在关联规则。

数据采集

本次分析使用了阿里云天池的电商用户行为数据集open in new window

第一部分是用户在商品全集上的移动端行为数据(D),表名为 tianchi_fresh_comp_train_user,包含字段如下表所示:

字段字段说明提取说明
user_id用户标识抽样&字段脱敏
item_id商品标识字段脱敏
behavior_type用户对商品的行为类型包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。
user_geohash用户位置的空间标识,可以为空由经纬度通过保密的算法生成
item_category商品分类标识字段脱敏
time行为时间精确到小时级别

第二个部分是商品子集(P),表名为 tianchi_fresh_comp_train_item,包含字段如下表所示:

字段字段说明提取说明
item_id商品标识抽样&字段脱敏
item_ geohash商品位置的空间标识,可以为空由经纬度通过保密的算法生成
item_category商品分类标识字段脱敏

数据清洗

先对通过查看D数据集的空值情况可以知道,除了用户位置的空间标识是有大量的空值情况外,其他字段不存在空值。同时空间标识也不是必要的。

数据分析

通过观察上图可以知道,用户的主要行为是浏览商品,其次是收藏行为,与此同时,收藏数量、加入购物车和购买的行为相比浏览数量差距明显。这说明用户不能很好地找到要购买的物品。其中的原因可能是平台的推荐算法不够准确,或者是平台的广告内容投放过于频繁,也可能是用户只是想浏览商品而不购买。

通过对消费者事件产生的时间分布图(如上图所示)观察可以得知,在一天中,早上10点开始用户开始活跃于平台,并且在傍晚开始用户的用户的活跃达到最高,那么用户最有可能在晚上完成购物,也就是说晚上是消费的黄金时段。

如上图所示,这些区域的消费者产出的事件比较频繁,也就意味着这部分地区的市场较大,如果是商家可以考虑扩展该地区业务,但也要注意市场竞争压力。

总结

综上所述,通过用户事件曲线可以得知,用户通常会在晚上进行购物操作,那么可以通过将白天价格也即一般价格定在相对高点,晚上再以优惠券或折扣等方式实现降价出售,能更好地将产品销售出去。此外也可以选择热点地区进行业务拓展来增加用户浏览量,进而实现销量的提高。最后,要优化推荐算法,以缩小浏览与其他事件的差距,为消费者节约时间。