【2023BI数据分析大赛】企业供应链管理和信贷违约风险分析
一、选手简介
1、选手介绍
团队名称:遨龙
队长介绍:小遨(花名),就职于一家金融机构,从事金融服务类业务,我从事数据分析岗,个人喜欢做业务及商业分析、数据建模等这类与业务和数据科学相关的工作
成员介绍:遨龙队有1名组员,现龙(花名),是我的好搭档!
2、参赛初衷
我们通过公众号文章看到了本次大赛的信息。我们参赛的初衷,一是,比赛的含金量高,是业界难得的能力锻炼、专业水平考核的机会,若参与并拿到不错的结果可以给个人履历增光添彩。二是,帆软作为商业智能化的领头羊,FineBI已经被广大公司普及使用,通过参与本次比赛可以提升BI工具的使用方法和技巧。三是,大赛的奖励诱人,可以弥补当前收入的窘迫。
二、作品介绍
1、业务背景/需求痛点
评估和改进企业的供应链管理效果,旨在提供全面的供应链管理视角,帮助企业发现潜在问题并制定相应的改进策略,以优化运营效率、提高客户满意度、建立可持续的供应链合作关系,最终帮助企业增加盈利空间。
供应链管理水平与企业的财务稳定性密切相关,希望通过结合信贷违约数据来帮助企业识别暗示财务健康风险的先行指标。
2、数据来源
我们使用的数据是从网络上下载的开源数据,该数据是各企业的供应链管理数据和使用一款金融产品的违约情况数据。我们基于原始数据进行了真实值脱敏,将这些数据经过关联、并表等操作加工处理后形成一张宽表。这张表以每户企业为维度,共计123条数据,数据字段如下:
3、分析思路
以终为始,围绕分析背景和目标,我们拆解了3个主要的分析方向:1)业务基本面分析 2)企业间对比分析 3)信贷违约相关因素分析
1)业务基本面分析:
对各指标的整体情况进行分析,全面了解企业的供应链管理的整体趋势和现状,帮助我们建立起对数据的整体认知,这为后续的深入分析提供了基础和背景。
我们使用了指标“出货金额”衡量这些企业的销售和市场需求体量,指标“出货天数”衡量企业交付效率,指标“有效出货发票率”结合指标“被动退款次数”衡量交付质量,指标“供应商数量”、指标“服务商数量”、指标“供应商数量与服务商数量的比”衡量供应链合作关系的体量及合作关系模式
2)企业间对比分析:
将不同企业进行对比分析,可以揭示行业内的最佳实践和优势,并发现潜在的问题。
我们从企业市场销售体量、企业在供应链中的强弱势地位、供应链合作关系模式、业务类型这4个方面,使用了帕累托分析、top分析、词云图等分析方法和工具进行对比分析。
3)信贷违约相关因素分析:
探索性分析供应链管理中影响信贷违约的相关因素,有助于把握企业的财务健康状况,并采取必要的措施来降低潜在的信用风险。
我们使用了饼图、箱线图、堆积柱状图等多样的可视化图表助力探索性数据分析。
4、数据处理
由于此份数据已较为干净,没有缺失值和不合常理的异常值,因此直接将记录一些指标的明细表进行聚合加工,与企业维度表关联形成最终的宽表。这些加工处理操作使用Python完成,主要涉及的技术有:
聚合求和
在上述代码中,我们使用agg()方法并传递参数'sum'来对数据框的列进行求和聚合。通过调用sum()函数,agg()方法将应用于每一列,并返回每列的总和作为结果。
聚合去重计数
在上述代码中,我们获取所有列名,并使用for循环遍历每一列。在循环中,我们首先使用drop_duplicates()方法对当前列进行去重操作,然后使用value_counts()方法计算每个唯一值的出现次数。
表关联
在上述代码中,我们创建了两个表df1和df2作为示例数据。df1包含ID和姓名列,df2包含ID和年龄列。通过调用merge()函数,我们将两个表按照ID列进行左关联。参数on='ID'指定了关联的列名,而参数how='left'表示执行左关联操作。
5、可视化报告
模块1:核心业务指标
1)结论
这一模块展示了9个关键业务指标,提供了销售和市场需求体量,企业交付效率、交付质量、供应链合作关系的体量、合作关系模式这些方面的数据感知。总出货金额为159.11亿元,平均出货天数为961天,平均进货天数为958天。供应商稍多于服务商的数量,企业整体上更关注原材料和产品的供应,与多个供应商建立合作关系以确保供应链的稳定和灵活。有效出货发票率为88%,整体上企业的交付订单较准确,较为受到客户满意。
出货金额:各企业出货金额的总和。企业的出货金额是指企业在一定时间内销售产品或提供服务所获得的收入总额。总出货金额共计159.11亿元,反映着这些企业的销售体量和市场需求,较高的出货金额表示企业销售活动活跃、产品受欢迎或服务得到认可。
平均出货天数:各企业出货天数的平均值。企业的出货用时是指从接收订单到将产品或服务交付给客户所经过的时间。平均出货天数为961天,反映了企业的交付和响应时长,较短的出货用时表示企业能够及时满足客户需求,提供高效的交付服务。
平均进货天数:各企业平均进货天数的平均值。企业的进货用时是指从下单采购原材料或商品到收到货物的时间间隔。平均进货天数为958天,反映了企业的供应链管理和采购效率,较短的进货用时表示企业能够快速获取所需物资,有利于保持生产和经营的连续性。
供应商户数占服务商户数的比:供应商户数总和/服务商户数总和。当前比值为1.06,整体上供应商与服务商数量接近,供应商稍多于服务商的数量,反映企业更关注原材料和产品的供应,并与多个供应商建立了合作关系以确保供应链的稳定性和灵活性。
平均有效出货发票率:有效出货发票张数的总和/出货发票张数的总和。当前比率为88%。发票开具后作废可能由于发生销货退回、开具发票时发生错误、误填等情况需要重开发票、发生销售折让等原因导致,因此有效出货发票率则反映了企业的订单准确性和客户满意度。
2)数据可视化
本模块中的关键业务指标的加工使用了FineBI提供的“计算字段”功能实现。数据展示使用了FineBI提供的“KPI图表”功能来生成,通过自定义文本的文字大小、颜色、排列,实现KPI指标的样式美化。
模块2:企业销售能力和市场需求分析
1)结论:
这一模块主要围绕市场需求及销售情况展开分析。出货金额、进货金额在各企业间具有一定的差异。E1***电器销售有限公司的总出货金额位列第一,销售活动更活跃,但出货金额稍低于进货金额,可能具有销售不畅或者成本控制不善的问题。E15***劳务有限公司的总出货金额仅2.3亿元,但出货金额远高于进货金额,盈利能力较强。出货金额前3大业务类型为生活用品、科技技术服务、工业工程。10%的企业(共计12户)贡献了80%的出货金额,符合80/20法则,金额贡献明显集中于E1***电器销售有限公司、E2***技术有限公司。
首先,我们使用描述性统计的方法对进出货金额进行全面认识和洞察。对比中值和均值发现,无论进货还是出货金额,都存在极大值拉高平均数。
之后,我们从总出货金额、出货金额与进货金额的比这两个指标综合分析各企业。可以看到,虽然E1***电器销售有限公司的总出货金额位列第一,表明该企业在这些企业中销售活动更活跃,但是出货与进货金额的比为0.7,出货金额稍低于进货金额,可能具有销售不畅或者成本控制不善的问题。然而,E15***劳务有限公司的总出货金额仅2.3亿元,但其出货与进货金额的比高达48,反映该企业的销售额超过了采购成本,盈利能力较强。
进货金额:各企业进货金额的总和。企业的进货金额是指在一定时间内购买原材料、备货等用于生产或经营的物品的总额出货金额与进货金额的比:各企业出货金额的总和/各企业进货金额的总和
接下来,我们使用词云图按企业类型的维度统计了出货金额的分布情况;其中,出货金额前3大业务类型为生活用品、科技技术服务、工业工程。
最后,我们使用帕累托分析识别对市场销售体量贡献较大的头部企业。可以看到,10%的企业(共计12户)贡献了80%的出货金额,符合80/20法则;其中,E1***电器销售有限公司、E2***技术有限公司的出货金额明显高于其他企业。
2)数据可视化
进出货金额的描述性统计使用了FineBI提供的“基础图表”功能实现。我们对出货金额、进货金额分别在FineBI中建立计算字段,使用sum_agg()、avg_agg()、median_agg()函数生成总和、均值、中值。
各企业总出货金额和出货金额与进货金额的比这一图表使用了FineBI提供的“组合图表”功能实现。我们在FineBI中建立计算字段,使用公式sum_agg(出货金额)/sum_agg(进货金额)生成“出货金额与进货金额的比”这一指标。
我们使用了FineBI提供的“词云图”功能,将企业的总出货金额放置在“大小”选项中,将字段“业务类型”放置在“颜色”、“文本”、“细粒度”选项中,这样出货金额越高,文字展示越大,以此来直观展示出货金额的分布情况。
对于帕累托分析,我们使用了FineBI提供的“组合图表”功能实现。首先我们创建了各企业的出货金额柱状图,并将各企业按出货金额降序排序。之后又创建了各企业的出货金额的累计占比,并设置为折线图。然后,点击“指标聚合”选项,将两张图表放置在一个横纵轴内,并设置为使用左值轴。为了清晰地查看80%金额的贡献企业,我们建立了一个计算字段,公式为(IF(${出货价税合计金额-累计占比}<=0.8,1,2)),并将该计算字段添加进“颜色”窗格,对累计占比80%及以内的企业填充橙色,其他企业填充灰色来提高划分的清晰程度。除此之外,我们还对出货金额的累计占比这一指标添加了常数为0.8的预警线。
模块3:企业交付能力和供应链管理水平分析
1)结论
这一模块使用有效出货发票率、退款、进出货用时、供应商与服务商数量关系这4个指标展开分析。对于有效出货发票率,按企业看,E120***陈列广告有限公司、E123***创科技有限公司、E101***灯饰工程有限公司出货后有效的发票数不到全部出货发票的一半;按业务类型看工业工程类的有效出货发票率最低。退款情况,E111***科技有限公司虽然被动退款金额不大,但占其总出货金额的比超一半;按业务类型看,电子机电设备的被动退款金额、占比均较高。E117***人力咨询管理有限公司、E101***灯饰工程有限公司、E115***装饰工程有限公司、E97***美工装饰部,出货用时和进货用时均较短,竞争力较强。E68***花木总公司出货用时较短但进货用时较长,需多关注与上游的合作关系或做好自身的采购模型。E12***建筑劳务有限公司进货用时较短但出货用时较长,需关注自身的流程管控优化。
平均有效出货发票率为88%,中值为91%,有较低的有效出货发票率拉低了整体平均数。有效出货发票率较低的企业有,E120***陈列广告有限公司(31%)、E123***创科技有限公司(51%)、E101***灯饰工程有限公司(51%),出货后有效的发票数仅为全部出货发票的约一半及以下,值得注意。按业务类型看,工业工程类的有效出货发票率最低(74%)。按业务类型看,电子机电设备的被动退款金额较高(2.5亿元),占总出货金额的比高达67%
当企业交付商品时,因客户不满意商品质量问题而带来的被动退款金额,平均一户企业为601.24万元,占总出货金额的3%;其中,E111***科技有限公司虽然被动退款金额不大,但占其总出货金额的比高达56%,值得注意。按业务类型看,电子机电设备的被动退款金额较高(2.5亿元),占总出货金额的比高达67%,值得注意。
出货用时和进货用时均较短的企业有:E117***人力咨询管理有限公司、E101***灯饰工程有限公司、E115***装饰工程有限公司、E97***美工装饰部,表明这些企业竞争力较强,既对上游较为强势,能获得较短的进货用时以保证自己快速获取所需物资,保持自身生产和经营的连续性,又能及时满足客户需求,提供高效的交付服务。
出货用时较短但进货用时较长的企业有:E68***花木总公司,这类企业需多关注与上游的合作关系,将其纳入进自身的供应链体系,或做好自身的采购模型,提前规划,提升经营效率。
进货用时较短但出货用时较长的企业有:E12***建筑劳务有限公司,这类企业需要关注自身的流程管控优化,优化从市场调研、设计、制造、交付各环节的效率,例如引入精益化生产方法。
从这些企业中可以看到有两类合作关系,即,面向多供应商的供应链体系、面向多经销商的供应链体系。建筑劳务、工业工程类是典型的面向多供应商的供应链体系类型,其供应商数量与服务商数量的比为7.3、5.9。劳务总包公司主要面向固定客户,而其项目制的临时组织使得其劳务人员随着项目和地点的变动而需广泛与全国各地的劳务分包公司形成合作关系。工业工程类企业主要向固定的开发商提供服务,而为了完成各地的基建工程需要与多地、多种的供应商建立合作关系。
2)数据可视化
这个模块中包含了多个指标,为了保证内容的易读性,减少观众的认知负荷,我们对每个指标的分析都按照先描述性统计图表、再从企业维度和业务类型维度展开分析。在这一模块里,我们都使用了FineBI提供的“柱状图”来分析企业维度和业务维度的数据;其中,对于需要与其他企业或业务类型进行区分的项,我们创建计算字段,填写公式(IF(AND(SUM_AGG(${出货天数})<=600,SUM_AGG(${进货天数})<=600)=1,"进出短",IF(AND(SUM_AGG(${出货天数})>=1000,SUM_AGG(${进货天数})>=1000)=1,"进出长","其他”))),并给不同类型赋具有区分度的颜色。
模块4:信贷违约相关因素探索性数据分析
1)结论
这一模块中,我们从信誉评级、业务类型、出货时长、出货金额与进货金额的比、有效出货发票率这几个方面来探索其与企业信贷违约的影响。其中,信誉评级的降低、有效出货发票率的降低可能暗示着财务状况出现危机,主营业务为科技技术服务、生活用品的企业需要加强注意自身财务状况。
经分析,信誉评级影响着企业信贷是否违约。信誉评级为A的企业在该金融产品中没有任何违约,而信誉评级为D的企业在该金融产品中全部违约。这表明当企业由于发生一些失信事件而导致信誉评级较低时,其财务状况可能出现危机,更易不断发生违约。
按业务类型看,科技技术服务、生活用品这类企业更容易违约。
按出货/进货用时看,违约的企业其进货用时整体更短,因此拥有较短的进货天数的企业,更可能违约。
出货金额与进货金额的比这一指标未明显影响企业信贷违约,违约客户与非违约客户的出货金额与进货金额的比例接近。
有效出货发票率越低,越可能违约。
2)数据可视化
在这个模块中,我们使用了FineBI提供的多种图表来实施探索性数据分析。对于信誉评级维度,由于只有4个评级类型,可以选择“饼图”功能来展示各信誉类型中违约与非违约的企业数占比。对于业务类型,由于类型众多,我们选择了“堆积柱状图”功能来分析不同业务类型中违约与非违约的企业数占比的区别。对于连续型数据指标,我们选择“箱线图”功能来分析违约与非违约企业在这些指标中的差异。
三、参赛总结
1、FineBI工具
FineBI工具提供了很多现成的可以“一键生成”的可视化图表工具,可以让初学者快速上手实现多种可视化图,比如漏斗图、瀑布图等,这是行业内难得的。当前业内较为成熟的BI工具,例如tableau,如果要用其制作漏斗图、瀑布图、双轴柱状图等,需要靠使用者自行改造数据底表和自行设置功能元素,对初学者来说较为困难。FineBI也为进阶者给予很多自由发挥的空间,比如可以通过创建计算字段,灵活使用内嵌函数来实现较复杂的指标等。FineBI在可视化美观方面的功能更强大,软件提供了丰富的主题模板、更灵活多样的元素样式,拖拽的交互方式生成仪表板,操作便捷、丝滑流畅,用户体验佳。
FineBI可“一键生成”的多种可视化图表帮助数据分析师聚焦于数据的分析,不必耗费过多资源精力在目标图表的制作上。FineBI内嵌的函数和分析功能助力数据分析师开展科学、严谨的数据分析工作。FineBI良好的用户操作体验、美观的数据可视化视觉效果,帮助数据分析师提高工作效率,快速产出美观的、丰富内容的数据可视化仪表板。
2、参赛总结
FineBI其实非常好上手,我们是先初步摸索了一遍软件的各种功能,之后结合大赛导师发的培训视频对进阶功能进行了初步了解。FineBI还有一个知识完备的帮助中心,针对一些特殊的问题,我们直接在帮助中心里查看知识文档。其中令人感到体验很好的一点是帮助中心的对用户的应答性非常好,那里会收集用户对文档内容解答的反馈,如果有问题在里面留言,很快会有运营人员回答。
通过参与本次大赛,给了我一个接触新BI工具的机会,push我不断学习。由于选了企业供应链管理相关的数据做分析,也让我对企业供应链管理相关的业务进行了学习,补充了我的知识库,未来在公司碰到类似的业务场景便可以快速上手,产出更有价值的数据分析。
最终结果呈现页面布局