【2023BI数据分析大赛】【2023BI数据分析大赛】电商母婴数据分析
一、选手简介
1、选手介绍
(1)团队选手版
团队名称:快乐打工人
队长介绍:刘小弟 >>>>数据产品
成员介绍:
肖小妹 >>>> 资深HR
刘大弟 >>>> 数据开发
汤小妹 >>>> 数据分析师
刘小妹 >>>> 资深财务
2、参赛初衷
一群有趣的打工人,想做一些不一样的事,给自己一段不一样的经历;
二、作品介绍
1、业务背景/需求痛点
业务背景
店铺从开业至今,业务量虽有上涨,但是针对当前的一个经营情况和用户的喜好不甚了解,根据近2年的数据情况,挖掘出店铺商品的布局是否合理,用户的喜好偏向;
需求痛点
a、销售情况分析,了解销售的整体情况;
b、商品布局分析合理性;
c、用户喜好分析;
2、数据来源
天池数据:https://tianchi.aliyun.com/dataset/45
3、分析思路
4、数据处理
借用BI自助数据集时间转换
移动平均线周期分组
移动平均线分母,计算每个分组对应的汇总值
桑基图因涉及到多个流向,需要创建多个数据集进行拼接
5、可视化报告
(1)数据含义表达和图表排版布局
销售模块分析
通过柱状图,组合图,警戒线等功能分析可得出:
1、因数据只有2年的数据(2012年数据不全),从年度数据看,销量整体呈增长趋势;
2、从季度数据来看,每年一季度的销量均为全年的销量最低季度,之后每季度呈增长趋势;
3、通过移动平均线分析,整体的销量呈增长趋势;通过当月的销量与销售移动平均线对比,大于30%以上的月份,基本上发生在5月、11月。主要的原因:年终促销和双11活动;
4、2014年11月销量最大,通过按星期分析对比成交量,可看出星期二和星期三销量较高,星期六和星期日反而较低;按下单量看,工作日用户必周末多;
大单销售情况分析
通过玫瑰图、气泡图、柱状图、组合图结合分析,可得出以下结论:
1、大单集中在大类别为28的商品。说明此类商品一次使用量比较大;
2、热门小类别的商品主要集中在:50018831、50016006、50013187三小类别中;
3、从大单产生的数量上看,11月产生的大单较多,10、12月的大单较少,说明需求集中在11月爆发;
4、从大单的销量上看,7、8、9产生的大单虽然较多,但平均销量没有线性增长;
5、6月的大单数量不多,但是大单销量很高;
品类分析
这一模块主要使用的是柱状图的功能,从中可以看出:
1、从大类别销量和下单量可看出大类别28销量和下单量的比例关系约为2.5;50008168销量和下单量的比例约为1.24;38单量和销量都不高,但比例约为3.12;
2、大类50008168虽然品类少,但是子类平均销量比较高
3、销量前10且用户购买量前10的子类共有8个
4、热门分类的销售情况在各月内并不平均,可有针对性的在特定的月份针对某些品类有针对性的加强推广;
性别分析
从4个饼图中可看出:
1、用户的整体男女比例差异不大,但男女销量比例约为:7:3;
2、从品类上看,男女比例在50014815、50008168和28三个大类占比之和均超过70%以上,说明用户更偏向于这三个大类别的商品;
年龄分析
通过以上四张图可得出:
1、店铺的主要用户群体的年龄段主要分布在5岁以下;
2、针对各大类别来看,可以得出每个年龄段的用户喜好的主要类别;
3、从桑基图可看出,男女、年龄段、大类别三者之间的流向,可看出3-5年龄段的男性更偏向于50014815这个大类;3-5年龄段的男性更偏向于50008168这个大类;
(2)通过分析得出的结论
1、该店铺近2年的销售呈增长趋势;
2、50014815和50008168这两个大类的商品为该店铺的爆款类别商品,可有针对性的挖掘出对应的爆款标签及属性,复用到其他类别上;
3、从受众群体角度看,店铺的整体用户男女比例较为均衡,但不同年龄段的用户在各大类上有不同的喜好,可着重在重点品类里面增加SKU;
看板公共链接:
https://bisolutions.fanruan.com/webroot/decision/link/jqN7
三、参赛总结
1、FineBI工具
a、因为使用的是官方提供的线上账户,涉及到SQL数据集处理,参数等相关应用无法得到满足,很多数据需要在线下进行清洗;
b、桑基图实现起来太方便了,跟其他的BI软件比起来提效杠杠的;
2、参赛总结
本次参赛还是比较匆忙,知道这次比赛的时间已经接近赛尾,加上团队内部人员刚巧都遇到了工作繁忙时期,整体的规划过于仓促,从选题、找数据整个过程都很仓促,整体的分析模块仍有很大一部分不足,还待完善,期望下次还能再次参与吧。