【2023BI数据分析大赛】体外诊断预测数据看板

楼主
我是社区第1022381位番薯,欢迎点我头像关注我哦~

选手简介

1、团队选手版团队名称:无敌帅之队

1.队长—郭帅,帆软社区用户名GS2599875。目前就职于北京博晖创新生物技术集团股份有限公司,我司在医疗器械行业主要经营HPV检测等检测设备及试剂业务;我目前从事销售效能管理类工作(SFE经理),个人感兴趣行业分析方向是医药健康、医疗器械、新能源、碳中和......,本次参赛中主要负责统筹安排、模型搭建及作品总结编制。

2.成员1—季姗姗,帆软社区用户名yzmMEZnM0254552。目前就职于北京博晖创新生物技术集团股份有限公司,目前从事销售效能分析类工作(SFE专员),本次参赛中主要负责历史业务及预测数据的展示及公式辅导。

3.成员2—成俊燕,帆软社区用户名yzm7AkpW0195212。目前就职于北京博晖创新生物技术集团股份有限公司,目前从事数据管理类工作(数据主管);本次参赛中主要负责全部数据源的梳理及数据清洗。

4.成员3—崔英南,帆软社区用户名暂无。目前就职于北京博晖创新生物技术集团股份有限公司,目前从事公司自有平台项目开发工作(开发组负责人),本次参赛中主要负责全部数据脱敏和模型方法的查找。

5.团队组成:公司2021年搭建自有数据平台时SEF团队与项目开发团队一起平肩作战,如期完成了公司平台的搭建,现平台仍在销售端和商务端运行良好并逐步迭代中。再有既往合作的基础上,借此FindBI大赛的筹办,我们一帮喜欢思考、愿意迎接挑战,志同道合的小伙们再次聚到一起,历经1个月的时间齐心协力完成作品,并以此来解决公司现存业务端实际存在的问题。

团队照片

2、参赛初衷

FineBI已经升级到6.0版本了团队成员都希望通过比赛实践提升BI工具的使用方法和技巧用到自己的实际工作中,提高工作效率,并希望通过参赛结识更多FineBI大神,与其做更多的交流学习,扩充分析思维和实践案例。此外,也希望通过此次参赛提高团队及个人的可视化技能水平,并想测试下我们在众多帆软人中的能力水平。

作品介绍

在选题阶段我们也进行了充分的讨论和头脑风暴,从销量预测模型、装机拜访有效性、经销商投入产出、公司利润分析、经销商的历史行为、掉量分析、价格测算等多个已议题中进行甄选,基于时间、现有数据、后期实用性等考虑,最终选择了预测模型作为本次主题。

1、业务背景/需求痛点

公司属于医疗器械行业,主要以渠道业务模式为主。为提高公司整体系统运营能力,2021年6月起开始收集销售预测,主要以销售业务员上报滚动3个月数据为主,利用前端销售业务员对市场实际存量客户、新开客户的了解,用收集的预测来指导生产,做到以销定产,良性循环。但在1年(2021年7月-2022年6月)的实际操作中,销售逐月预测准确率较低,准确率维持在60%左右,不能满足80%的基准线,使生产积压了部分库存,带来了资金的占用。为解决此问题,实现库存最小化,我们在历史实际销售产出的基础上,加入新开增量、停机掉量、指标管理、渠道库存等多维度进行预测模型的搭建与验证,希望通过预测模型输出的销售预测可以真正为生产带来指导意义。

2、数据来源

本次参赛的目的之一是解决公司现存业务端实际存在的问题,故选取了企业历史年份数据,并对数据进行了脱敏处理,去除了客户全称,单品类展示,数据均做了放大处理等。涉及表有:实际销量表、预测销量表、装机数量表、月末库存表。

3、分析思路

1.对历史预测做分析:逐月预测与实际对比,各省维度预测情况,标准线80%。利用柱图、线图、箱线图及地图呈现。

2.对痛点进行业务维度的分析,确认关联性,4个维度——客户用量、装机增量、停机掉量、库存情况。利用柱图、散点图呈现。

3.利用回归分析进行预测模型的设计,模型成立的情况下用模型进行2022年7-9月的逐月预测。利用回归统计分析呈现。

4.预测后用对应时间点的实销数据做验证。利用模型公式和柱图对比呈现。

最终达到预测帮助销售、指导生产、降低库存的目的

4、数据处理

可视化分析之前将实际销量和预测销量进行了上下合并,对客户用量进行了分组汇总,对装机数据进行了条件标签列的新增,本想直接用客户用量数据进行装机启用的验证,但介于实际业务较复杂:存在跨年;存在历史老设备新客户使用,老设备内的数据没有完全清除,出现用量早于装机时间的情况,现有水平无法直接用帆软进行清洗,故线下做了分析后,将分析归整的数据直接上传后使用。停机用量影响也是如此。

原始数据表连接如下:findBI客户用量分析-验证分析(装机启用、停机用量).xlsx (5.06 M)

5、可视化报告

1.排版布局:选用的是清新多彩,显得更理性字体更清晰

2.报告分为三个模块:历史预测数据分析、预测模型建立、预测模型验证

3.历史预测数据分析

  • 每月销量预测数据选取上月月底销售提报的最新预测;
  • 实际出库数量依据采购客户最终进货为准,并假设采购客户进货数量均已出货,规避缺货造成的预测影响波动;
  • 2021年7月-2022年6月每月实际出库数量与预测数量整体趋势相同,均呈季度性波动,与渠道为主的业务模式相符(即季度最后一个月大约备2个月左右库存);
  • 2021年7月-2022年6月10个月预测准确率均低于80%,仅2个月高于80%,整体预测不佳,且5月出现实际远大于预测的情况。在生产无法满足的情况下,给客户带来了延迟交货的不满。同时,每月各省的准确率均值不足80%,年度均值只有39%,对生产的稳态带来较大影响。

4.预测模型建立

  • 结合体外诊断厂商的实际业务特殊性,涉及先销售仪器并装机,待仪器在客户端真正启用后才能产生实际的试剂用量,故对装机后启用情况做启用分析。

     1)从2019年-2022年10月装机的485个客户数据中进行规律分析,假定用量大于48人份的第一个月为启动月份(正常<=48人份属于仪器启用前的测试环节);

     2)用当年的启动月份减去当年的装机月份,获得的差值记为启用月长,但由于装机中涉及旧机迁址或旧机盘活的情况,里面有老客户使用记录,但从数据维度无法区分,故将这些异常值(启用月长为负)剔除,减少干扰;

     3)最终梳理出225个正常值做最终启用规律分析,验证结论如下,近50%的客户在当月内启用,80%以上的客户在3个月内启用(含装机当月)。

  • 同时,有新的装机就会有老设备和老客户的停用,停用后前期产生的用量将会归为0,故对停机后用量对用量的影响进行分析。

     1)截止2023年6月底有时间记录的停机共计80台;

     2)由于终端数据从2019年才有记录,故停机时间剔除在2018、2019年的9台,剩余71台进行停机用量影响的分析;

     3)最终停机对用量的影响均值仅在2.27%,对用量下降的影响较小,但可能存在停机客户在完全停机前已在逐步减量的情况,逐年有上涨趋势,需关注。

  • 从业务实际出发,老客户的用量和新客户的装机启用以及渠道商的库存应该均会对公司月度的试剂出库量有一定影响,故对3个维度的数据与实际出货做了相关性分析

     1)各省客户用量与实际销量做对比分析,结果成正相关性;

     2)各省装机台数与实际销量做对比分析,结果成正相关性;

     3)各省单月库存占比与实际销量做对比分析,结果成负相关性,但相关性弱(库存属于即时性数据,汇总数据会出现失真,故选用单月库存占比情况);

     4)最终用统计学的回归分析将三个因素作为自变量(X),实际销量作为因变量(Y),三因素结果:MR 近50% 有相关性,其中客户用量X1 P值<0.05有显著正相关、装机台数X2 P值<0.05有显著正相关、库存占比X3 P值>0.05无显著相关。故提出X3的干扰,对X1、X2与Y进行新的回归分析,推断出预测模型公式:Y=0.4394*X1+0.0325*X2。

特殊说明:回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。

5.预测模型验证

  • 根据预测模型推测当月预计实际销量。

     1)将上月实际用量带入预测模型X1;

     2)与截止上月装机的台数带入预测模型X2;(说明:根据模型建立时的装机启用分析,80%装机后3个月内即会启用,并考虑到启用前渠道商要提前进货的因素,故选取截止上个月的装机台数,同时,考虑停机对用量的影响较小且有滞后性故暂未直接扣减)

  • 利用7月、8月、9月的实际销量数据对模型进行反向验证。

对后三个月模型预测销量与实际销量进行对比并计算出预测准确率看是否达到80%的标准

  • 最终获得7月模型预测销量与实际销量的准确率在82%,8月模型预测销量与实际销量的准确率在77%,9月模型预测销量与实际销量的准确率在84%,整体提高了销量预测准确率。

6、最终结果呈现的页面布局

三、参赛总结

1、FineBI工具

亮点:多数据源共同分析友好、布局调整方便、可视化配色也较为美观、自定义看板复合特定需求,在可参考的基础上也保留了大家的多样性和拓展性;帮助文档、操作简单、无需程序语言对于新手很友好;组件联动,有助于聚焦问题。

吐槽:多用户不能同时编辑不同的看板、指标卡的样式略少希望能多丰富些、组件大小不能自定义输入长和宽、修改字段名称时颜色会变(希望保持);文本框文字上下间距较大,建议优化或可自定义,增加美化效果;公式需要重新学习与excel有加大差异。无法做模型类分析展示,需要线下做统计分析,在使用界面上最好有提示“不支持二开”

2、参赛总结

FineBI工具操作起来很容易上手。大赛期间,通过与组员之间的相互讨论,我们都收获很多。大家牺牲了业务的休息时间,积极参与其中,建言献策互帮互助,回顾整个参赛过程,团队合作是我们最终将此作品完成并呈现的关键。每个人都发挥了自己的专业能力,共同推动比赛进展。但本次数据处理中也体会到同一数据源不同人关注的重点不同,不同重点或维度展现出的报告结果也差异较大,最终大家需要聚焦最佳方案切中主题开展,所以在数据分析上我们能学的还有很多,好好重新复习数据分析科目内容,期待看到本次参赛的其他选手的优秀作品。

 
 
 
 
分享扩散:

沙发
发表于 2023-8-16 10:29:12

恭喜通过大赛初审!!
1、建议使用文字排版(图片有点模糊影响阅读),点击文末“编辑”按钮,进入文章编辑选择“导入Word”
2、如果使用本地BI制作,请确保提交的附件resources.zip内容完整(附件如有更新请微信发送苏茜);组委会将在8月16日后统一进行作品资源迁移,将您的作品导入大赛公共平台,形成在线模板查看链接,方便评委查看。

截止8月16日20:00仍可继续修改完善,期待选手完善之后的作品~~

板凳
发表于 2023-9-12 16:01:30
打卡:看楼主在研究回归分析的时候,运用其它分析工具反复验证回归因素的影响,确实finebi中趋势分析太肌骨了,根本的不出明显的结论
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

地板
发表于 2023-9-14 15:51:21
打卡:分析数据清晰,整体的看板内容可能再丰富一下会更完美。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

5楼
发表于 2023-9-16 18:13:16
打卡:
工具运用的很多,整体的分析思路不错,UI设计的整机很舒服。整体故事化的讲解,逻辑贯穿始终
6楼
发表于 2023-9-27 17:32:58
打卡:“体外诊断”又是被作品标题吸引过来的,看完作品还是没明白体外诊断是个什么概念,哈哈~~作品应该是对某仪器的销售数据进行预测分析,是一份销售数据分析作品,作品基于企业脱敏数据,分历史预测数据分析、预测模型建立、预测模型验证三个模块展开,作品中的业务逻辑、预测模型过程都描述的很清楚,最终呈现的仪表板布局也很舒适,对我来说是一份优秀的预测模型分析作品,学习了!
参与人数 +1 F币 +6 理由
兔子酱 + 6 打卡奖励-最走心评论

查看全部评分

7楼
发表于 2023-10-13 10:30:19
打卡:完整的数据分析过程,配色统一,布局合理美观,图表类型选取合理,故事化表达相关的数据分析场景,值得学习。
8楼
发表于 2023-10-20 15:45:24
一篇不错的医疗器械看板,提个小建议,可以考虑更改下背景色,图框中的缝缝的颜色调整为一致,会更好看一点点。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

8回帖数 1关注人数 9706浏览人数
最后回复于:2023-10-20 15:45

返回顶部 返回列表