电商销售/用户运营可视化报告 —— 超可爱小组
文章地址:Link to Mubu
作品链接(动态):在线作品1(无Tab) 在线作品2(Tab)
一、选手简介
1、团队介绍
团队名称:超可爱
团队介绍:
- RainZ:AI&CS学士,乐于钻研设计思维与数据分析
- Eavan:一位研二在读的统计学学硕,喜欢可视化、喜欢研究配色方案,立志做出简洁美观又信息丰富的仪表盘。
- geng :一位大二的经济统计学学生,喜欢建模和可视化。
团队组成:世间所有的相遇,都是久别重逢。小组的成员来自天南地北不同城市,由和鲸的可视化比赛相识,组成了Tang老师全球粉丝后援会,又因为帆软BI比赛有了更深入的了解,发现大家都有着有趣且独一无二的灵魂。大家都想从事数据分析相关的职位,而这必然离不开可视化分析工具的使用。恰逢帆软公司举办了此次大赛,一拍即合,一起报名参加,一起学习软件。通过协作交流、亲手实践对软件有了较为深入的了解!收获满满!
2、参赛初衷
我们团队希望通过参与帆软数据分析大赛得到知识的学习与能力的提升,对职业发展有更加清晰的认识。如果通过努力可以获得相关荣誉那可谓是锦上添花。具体来讲,我们希望得到如下方面的提升:
- 数据可视化:团队成员都掌握一定数据可视化技能,通过使用python或R制作图表。由于编写代码进行数据可视化的步骤有些时候过于冗长,因此,我们想进一步了解企业专业的数据可视化工具,从而能够对利用可视化工具进行商业仪表盘搭建与数据分析的方法和流程有更深入的认识。
- 数据分析模型和方法:我们想在商业数据分析的过程中学习到一些数据分析模型,比如RFM、帕累托等模型。 同时也想通过活动,培养自己的数据分析能力。
- 业务的理解:我们想通过这次比赛,了解到电商零售的业务逻辑,提升自己的业务能力和商业Sense。
二、作品介绍
1、业务背景/需求痛点
简述业务背景:电商用户消费行为数据,包含日常用户的订单消费信息,部分用户信息等。
简述需求痛点:业务人员并不能用肉眼从海量的数据库数据中挖掘价值,赋能业务。但通过可视化,海量的电商消费行为数据可以被更好的整合并展示给不同部门的管理层及业务人员,从而达成“数据赋能决策”,为公司及平台创建更多价值。
因此在本次数据仪表盘中,我们决定把数据运用于不同的业务方向进行分析,希望能使得销售及运营部门的管理决策层可以更好地了解目前平台的现状,从而进行更加高效且清晰动态方针调整。
2、数据来源
自选数据来源:和鲸社区(https://www.heywhale.com/) 电商用户消费行为数据 —— 564169条数据
字段解释:
- event_time:用户进行物品购买的时间戳
- order_id:订单id
- product_id:产品ID
- category_id:分类ID
- category_code:产品一级分类 —— 大类(e.g. electronics/furniture)
- category_code_1:产品二级分类 —— 成品/中等分类(e.g. peripherals, kitchen)
- category_code_2:产品三级分类 —— 组件/细致分类(e.g. cpu, tv)
- brand:产品所属品牌
- price:产品定价
- user_id:用户ID
- age:用户年龄
- sex:用户性别
- local:用户所属地区
3、分析思路
拿到数据后的分析思考过程 —— 下图为自己整理的数分思维模型
由数据我们可以清晰的知道以下一些信息
- 订单信息 —— 包含了购买的物品种类(e.g. 一级/二级),品牌,下单时间,价格及订单id等信息
- 用户信息 —— 包含性别,user_id,用户所属区域等信息
在整体电商平台的组织架构中,销售和运营是两个相对较大的板块,这也是数据能提供巨额价值的领域。此次的BI仪表盘,我们决定针对这两个部分进行细化分析,从而为管理层提供可视化研究,完成“数据驱动决策”的目标
4、思维导图(具体分析思路)
针对销售部门,我们希望突出重头商品的存在。在经过一定模型的匹配后,我们认为帕累托(ABC)模型更加适合突出重头商品,即“少数商品贡献了大部分价值”。
针对运营部门,我们则希望进行用户精细化运营,通过不同关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户采取相应的营销策略。在挑选之后,RFM模型是我们认知中最为适合的一个分析模型。
5、数据处理
针对此次数据,我们主要进行了三个步骤:缺失值处理/重复值处理/数据整理
- 缺失值处理:当拆分一个字段去多个字段的时候,我们需要把缺失值变成空值(e.g. category_code/category_code1等都是由一个字段拆出来的)。其中,空值不做处理,因为他也代表了一个用户消费过的记录
- 重复值处理:我们不希望重复的数据影响到我们的数据分析,所以对于重复出现的数据我们只保持第一次出现的样式
- 数据整理(RFM):数据整理,把所有的数据整合成我们需要的样子。(e.g. 我们希望用户可以被RFM模型分割为8种类型的用户,从而我们可以进行用户的精细化运营)
为了使用RFM模型进行用户标签,进行精细化运营,我们首先需要根据不同的指标进行打分,从而进行用户分群。FineBI官方文档中也有涉及部分教学RFM分析
具体步骤:
在自助数据集中找出代表RFM三个字母的字段 ->
把字段转换成可以量化的Numerical Variable ->
求得字段均值 ->
如果数值超过均值,把字母分值设为1,如果数值没有超过均值,把字母分值设为0 ->
结合三个字母的分值,并贴注Label
6、可视化报告
(1)数据含义表达和图表排版布局
整体排布会遵循我们在上方表述的思维导图,主要分为两个板块展示(销售/运营)。为了使得不同部门的管理层与业务人员可以更快的找到自己需要的报表,我们使用Tab来进行切换
总体的排布我们会遵循上面的思维导图。但是经由我们测试过图例之后,我们认为下面的图形排布将会更加符合我们的逻辑拼接以及展示
(2)通过分析得出结论
销售部分总结
通过查看时间序列销售额的变化:从月份和季度两个维度,我们发现销售额的分布不均匀,且在第三季度的电商销售额远大于另外几个季度。
然后,我们通过月环比图,对销售额的变化进行进一步探索,发现5月较上月增长幅度极大,我们猜测是由于当时疫情好转从而刺激了消费;销售额在2、3、7、8、10月增长,而在4、6、9、11月份的销售额呈现减少的趋势。
性别我们从图中可以发现男女人数大致相同,消费者年龄总体较为年轻。
地区我们从图中可以看出上海、北京和广东的消费总额较高。
首先我们通过树图对不同类别的电子产品销售额进行了展示,发现电商产品一级分类下的electronics、appliances和computers 类型占据了较大的销售额。
其中,在对数据的探索过程中,我们发现,一个订单可能包含多个类别的商品。因此,经过模型比较,我们选择采用购物篮分析的方法进一步探索不同类别产品间的关联性。
因此,我们打算使用购物篮分析的方法,去探索购买商品间的关联性,从而为不同类别产品间的相关推荐提供数据支持。不同类别产品之间的支持度、置信度和提升度如图所示。
通过提升度热力图的可视化展示,我们发现其中有些商品类别的组合会有较高的提升度(e.g. Sport与Auto,Country_yard与Construction)
对于不同品牌的销售额,我们打算先使用帕累托分析法去找出重头品牌,再对重头品牌做进一步的分析。
通过帕累托图,我们发现 Samsung ,Apple,LG,Asus,Lenovo 品牌的商品是重头商品,这5个品牌的销售额占比达到总体品牌的62%。接下来,我们对这5个品牌的销售额的时间序列进行分析,查看这几个品牌在不同时间的销售额,以及总体的趋势。(点击右侧帕累托图的柱子,即可分别查看每个品牌销售额的时间序列折线图)
Samsung 、LG和Lenovo品牌的销售额在8月保持较高的水平,在9月出现了下降,而10到11月销售额波动较大;Apple 品牌的销售额在8月和9月都达到了较高的水平,且在9月达到了一个极高值;Asus品牌的销售额在8月达到较高值,而后出现下降的趋势,在10月有过较为明显的上升。
运营部分总结
通过PV/UV图,我们可以发现在某些特定时间段中,UV远低于PV,代表部分用户进行重复行为较多。其中,2020-04-27至2020-09-07期间,PV/UV上升较为明显,7、8两个月用户活跃度较高。
周一至周四为低消费时间段,不同性别用户下单总金额相差不大,男性稍微领先。周五至周日为高消费时间段,女性活跃度高于男性,其中周六差距最大,且整体活跃度最高。
建议:关注7、8月活动,有效刺激到消费。平稳时间周期关注周五至周日,针对女性加强宣传、刺激消费的运营活动。
次日留存率与七日留存率呈现整体上行的趋势,七日留存较次日留存稍微低一些。
其中,次日留存率在2020年4月2日至2020年4月25日,与2020年7月26日至2020年8月9日期间达到约45%。
通过不同群体用户面积图,我们可以发现,重要保持客户群体是消费最多的客户群体,一般发展客户次之,一般挽留客户的消费较多,而重要价值客户、重要发展客户和重要挽留客户的消费额较少;一般价值客户和一般保持客户的消费额很少。因此我们需要加大重要价值客户、重要发展客户
价值总结 —— 促进消费,以数据驱动,使得管理层更清晰直观了解产品现状并进行决策
销售
通过对销售额的描述,我们可以发现如下的一些结论:
- 1. 电子产品在第三季度的销售额远大于另外的几个季度。
- 2. 男女人数大致相同,消费者年龄主要位于20-50岁。
- 3. 上海、北京和广东的消费总额较高。
促进销售额提升的建议
1. 对于不同消费额的时间段采用不同的方式促进消费。
- (1). 在消费额较高的时间段内进行广告推广,加大与各大品牌合作从而稳定或提高消费额。
- (2). 在消费额较低的时间段内加大宣传力度,提供优惠措施,从而促进消费。
2. 对销售额较高的地区,进一步推广或者提供促销活动。
3. 对于帕累托分析筛选出的5个重头品牌,我们可以采取以下的措施。
- (1). 加大推广与合作力度。
- (2). 通过关联规则挖掘其他具有提升度的商品,对其进行推荐组合,促进消费。
4. 对于帕累托分析发现的众多非重头品牌,我们可以采取以下的措施。
- (1). 通过关联规则找出具有提升度的商品,对其进行产品组合,从而提高销售额。
- (2). 采用促销和优惠的方式吸引用户购买。
运营
对于运营部分
- 1. PV和UV总体变化不大,均在8月达到较高的值。
- 2. 周一至周四为低消费时间段,不同性别用户下单总金额相差不大,男性稍微领先。周五至周日为高消费时间段,女性活跃度高于男性,其中周六差距最大,且整体活跃度最高。
- 3. 次日留存和七日留存率呈现整体上行的趋势,七日留存较次日留存稍微低一些。
- 4. 重要保持客户群体是消费最多的客户群体,一般发展客户次之,一般挽留客户的消费较多,而重要价值客户、重要发展客户和重要挽留客户的消费额较少;一般价值客户和一般保持客户的消费额很少。
营销建议
- 1. 对于某些用户数较多的地区提供优惠活动维护用户;对于用户数较少的地区,则采用通过加大宣传力度等方式提高用户数。
- 2. 关注7、8月活动,有效刺激用户消费,挑选可控变量, 通过AB Testing假设检验来寻找活动模型并长期应用。
- 3. 平稳时间段关注周五至周日时间段,加强针对女性的宣传、刺激消费的措施。
三、参赛总结
通过这次项目,我们对BI工具的理解变得更加深刻。BI工具的存在极大程度的提升了业务人员自己探究数据的可行性,同期,它使得这份探索可以被展示并分享给其他成员。我们认为BI工具是强大且富有美感的。
数据仪表盘的美体现在它是灵活的,是动态的,这是早期代码绘图包难以做到的(e.g. Seaborn, Matplotlib)。BI工具的强大则是体现在,不但可以大幅度减少编写代码的时间,还可以创造出更强交互性,更震撼的各类图表。
对于数据分析的价值,我们认为是通过数据分析,能够创造实际的商业价值,从而对企业的不同部门提供帮助,为管理层的决策提供支持。
在过程中,我们最开始对于很多操作还有数据分析模型都不熟悉,后来通过参考FineBI的帮助文档,学习到了各种图表的使用,各种数据分析模型和方法,还有数据分析的思路和技巧。
在过程中,我们团队逐渐磨合,开始配合与分工,能够更高效和高质量地完成任务。在仪表盘搭建好了之后,我们又进行了很多新的尝试,添加了一些特效,作为对仪表盘的美化。在数据分析模型和方法的探索中,我们从最开始只会用描述性统计,到逐渐去探索各类数据分析模型,寻找到能够在这份数据中产生实际业务价值的模型。
经过最后一些简单地调整,成果如下:
PDF:电商销售用户运营可视化报告 _超可爱小组.pdf (5.97 M) |