1.选手简介
1.1 选手介绍帆软社区用户名:zz20200 职业简介:现就职于上海某激光切割公司,在公司的岗位是数据分析工程师,日常负责可视化报表的工作。
1.2 参赛初衷- 平时在直播课程中找不适合我们公司业务的分析模板和思路,想寻求更多可借鉴的数据分析案例
- 学习数据分析思维
2 场景介绍
2.1业务背景介绍&数据来源
业务背景: - 激光切割有着传统数控机床无法达到的切割精度,并且因其切割速度快,切割平整的被越来越多的切割厂家所喜爱,可以利用激光来切割的板材多种多样,但是不同的材料具有不同的特点,所以其切割工艺也不尽相同,此时就需要切割控制系统需要对不同的材质对切割进行不同的控制处理。
需求背景:
- 本公司所属激光切割行业,需要深入了解激光切割的用料,在切割系统中分别对其进行工艺区分,因此需要尽可能全面地去了解钢铁行业的产品。
- 起初的需求只是需要从钢铁世界的网站收集最全的材质型号和产品名用于公司内部切割系统的,但之后发现在还能对钢厂、价格进行一定的分析,于是就选择换一个角度——作为钢材的卖家来分析钢铁产品。
数据来源: - 个人获取的数据:本次数据是利用后羿数据采集器中的流程图模式来获取,爬取的是乐从钢铁世界网站上多个维度的数据,如产品、供应商、服务、销售员等。
2.2分析思路
围绕分析主题——钢铁世界的产品,拆解了产品、供应商、销售经理、钢厂这几个分析方向。 产品方面,可以分析在产品基础上钻取型号和规格,分析产品数量和平均价格;选好产品后选择去哪家供应商买,选好了供应商之后应该联系谁来进行购买,销售员一般手里有多个钢厂的资源,应该选哪个钢厂的呢? 具体流程图如下:
3.数据整理
- 源数据库表中有关供应商的表(包含company的表)有4个,需要对其进行字段的合并,形成一个新的供应商画像的数据集——
- 具体操作是将company表分别与另外三个表以公司名为合并依据合并,于是对于每个公司我们就多了三个字段,是否是实力商家,是否是推荐商家,附加的服务有哪些,
- 另外由于源数据中商家标签是合并在一起的,如下图。
- 为了计算供应商的综合推荐指数,另做了一个计算推荐指数的表——供应商推荐指数。推荐指数由下面的所有指标综合评价,每个指标满分为1分,除了经营面积和经营时长,其它指标的分数只有两种——0或1,即是或否。
- 对于经营面积和经营时长,首先新增列求得该值在所有值中的排名,再除以总数求得这个排名在该指标中击败了多少,求得一个0~1之间的百分数。
- 推荐指数 = sum(下图中8个指标的分数),因此满分为8分。
4.完成分析报告
由于图表较多,仅选择制作起来稍微复杂的图表进行描述。
要展示产品在不同区域的数量和占比,此时应使用自定义地图,框选出固定的区域,并以数据库中对应的名称为区域名称。 4.1.2. 热门产品和型号TOP20
这张表需要反映不同的产品名和材质的数量关系,两个维度,一个指标,用矩阵块的形式能很好的通过颜色展示每对(产品名和材质)对应的数量,同时将供应商数拖入细粒度,还可以展示供应商的数量。
4.1.3. 供应商详情表
此表主要展示供应商的具体信息,方便买家在查询非排行榜内的其它供应商的推荐指数。 由于全表为数字,不易于观看,于是在字段中拖入本字段的值作形状,将0后显示红色⚪,1后显示绿色⚪,是表格更加一目了然。
4.1.4. 另外在仪表板中,我们加入多个箭头流程来引导用户阅读,以免长篇大论的表格看起来让人觉得枯燥,没有阅读的欲望。
4.2 图表结论: 4.2.1.从产品维度来看:
- 供应商卖得最多的产品是热平直板和热轧卷板。
- 卖得最多的管材应该是不锈钢无缝钢管和不锈钢焊管。
- 卖得最多的型材应该是槽钢。
- 型号Q235B和Q235则应该是最受欢迎的材质,由它们制造的产品种类最多。
- A区为产品的主要分布地区,其次是C区。
4.2.2.从供应商维度来看:
- 推荐指数最高的供应商为佛山市顺德区巨恒贸易公司。
- 在钢铁世界入驻了许多拥有较长经营时长的老店,其中最久的经营了24年,一共有3家——分别是佛山市顺德区乐从镇鸿信贸易有限公司、佛山市顺德区国惠贸易有限公司、佛山市顺德区乐从镇华基贸易有限公司。
4.3 作品展示 图表主题色主要是红橙绿的热力色,标题是由灰色渐变条展示,体现一种如钢铁板材一般地流畅平滑感。最终作品截图如下图。
5.总结 这次的仪表板可能是用时最长的了,总共花了一周的时间做仪表板,由于平时公司需求都是对现成的数据库进行分析,这次主动去尝试了一下自己爬取网站数据来进行分析,有许多收获,也有许多不足。 5.1.欠缺 数据的分析维度较少,原因是爬取网站数据花了挺久的(2周),而且不知道应该爬取数据的哪些维度,许多字段都有重复,或者没用上。 - 从完全没接触过后羿数据采集器到学会用流程图模式。【ps:以后爬虫需要更少地依赖软件来做,而且自己写代码去实现,这样可操纵性强并且速度快。】
- 学会创建自己的mysql数据库,并用后羿采集器往数据库里导入数据。
5.3.感悟 故事性和结构化很重要:在做可视化报表的过程中需要添加一些标志来引导观看者阅读,最重要的是要有清晰的结构。【这个是请教了公司的UI设计师时,他告诉我不需要过分追求美观,要展示的内容一定要有结构性,比如用一段故事去展开分析。】
|