【2023BI数据分析大赛】电商售后分析与探索--球球客官别再退了
一、选手简介
1、选手介绍
团队名称:芋泥咸蛋黄肉松甜品脑袋
团队组成:
两个黄鹂:团长。架构出身有数据分析经验,0经验的BI可视化新手。
多肉葡萄:颜值担当兼数据分析担当。是公司可视化业务的扛把子,也是本次参赛的“产品经理”。
2、参赛初衷
希望能够通过比赛熟悉FineBI的用法。实际操作中,我发现自己还有很多需要学习和掌握的地方。参加比赛可以让我在实践中不断尝试、探索,逐渐掌握FineBI的各种功能和应用技巧。
当然还有奖金啦^ . ^
二、作品介绍
退货率分析、物流履约分析和用户满意度分析。在退货率分析中,我们将通过收集不同电商平台的退货数据,分析退货率的高低、退货原因、退货商品类别等,找出影响退货率的主要因素,并提出降低退货率的策略。在物流履约分析中,我们将评估物流供应链中每个环节的交付时间,以确定是否符合承诺的交货时间。这可以通过比较预期交货时间和实际交货时间来实现。最后,在用户满意度分析中,我们将通过收集用户的售后服务评价数据和用户行为数据,分析用户满意度与售后服务质量、退货率、售后服务成本等指标的关系,找出提高用户满意度的关键因素。
为了更好地完成这些分析,PDCA模型则可以帮助我们更好地规划、实施、监控和改进我们的分析过程,以确保我们的分析结果更加准确和可靠。
通过这些分析模型的运用,可以为电商平台提供更加全面和准确的数据分析结果,帮助他们更好地了解退货率、物流履约和用户满意度等关键指标,并提出有效的解决方案,以提升电商平台的竞争力和用户满意度。
专题介绍:
退货率分析:通过收集不同电商平台的退货数据,分析退货率的高低、退货原因、退货商品类别等,找出影响退货率的主要因素,并提出降低退货率的策略。
物流履约分析:评估物流供应链中每个环节的交付时间,以确定是否符合承诺的交货时间。这可以通过比较预期交货时间和实际交货时间来实现。
用户满意度分析:通过收集用户的售后服务评价数据和用户行为数据,分析用户满意度与售后服务质量、退货率、售后服务成本等指标的关系,找出提高用户满意度的关键因素。
1、业务背景/需求痛点
随着电商平台的不断发展,市场上的竞争越来越激烈,导致电商平台之间的同质化现象越来越明显。这种同质化现象不仅导致了电商平台的盈利能力下降,还使得用户在选择购物平台时难以做出明确的选择。在这种情况下,售后服务成为了电商平台的重要竞争点之一。
售后服务是指在用户购买商品后,为用户提供的一系列服务,包括退换货、维修、投诉处理等。在电商平台中,售后服务的质量直接影响到用户的满意度和忠诚度。如果电商平台的售后服务质量不佳,用户就会选择退货或者不再购买该平台的商品,这不仅会增加电商平台的退货率和退货成本,还会降低用户的满意度和忠诚度。
因此,在电商平台日益同质化、竞争激烈的背景下,加强售后服务的运营,提升用户的满意度,降低退货率和退货成本,成为了电商平台必须要面对的问题。通过提高售后服务的质量,电商平台可以增强用户的忠诚度,提高用户的满意度,从而在激烈的市场竞争中获得更多的优势。
2、数据来源
企业数据:共有5个表,数据下载之前已做了脱敏处理。
售后订单信息表
字段备注
字段名
脱敏情况
售后单号
AFTER_SALES_ORDER_NUMBER
脱敏
订单号
ORDER_NUMBER
脱敏
商品单号
PRODUCT_TRACKING_NUMBER
脱敏
商品名称
PRODUCT_NAME
脱敏
商品ID
PRODUCT_ID
脱敏
商家编码
MERCHANT_CODE
售后类型
AFTER_SALES_TYPE
应付金额(元)
PAYABLE_AMOUNT
脱敏
商品运费(元)
FREIGHT_COST_OF_GOODS
脱敏
支付优惠(元)
PAYMENT_DISCOUNT
脱敏
商品税费(元)
COMMODITY_TAX_AND_FEE
脱敏
商品发货状态
PRODUCT_SHIPMENT_STATUS
退商品金额(元)
AMOUNT_OF_RETURNED_GOODS
脱敏
退运费金额(元)
REFUND_SHIPPING_AMOUNT
脱敏
退支付优惠(元)
REFUND_PAYMENT_DISCOUNT
脱敏
退税费金额(元)
TAX_REFUND_AMOUNT
脱敏
售后状态
AFTER_SALES_STATUS
售后申请时间
AFTERSALES_APPLICATION_TIME
退款方式
REFUND_METHOD
售后原因
AFTER_SALES_REASONS
售后原因标签
AFTER_SALES_REASON_LABEL
退货物流单号
RETURN_LOGISTICS_TRACKING_NUMBER
退货异常
ABNORMAL_RETURN
退货发货时间
RETURN_SHIPPING_TIME
退货物流公司
RETURN_LOGISTICS_COMPANY
是否拒签后退款
REFUND_AFTER_REFUSAL
发货物流单号
SHIPPING_LOGISTICS_NUMBER
发货物流状态
SHIPPING_LOGISTICS_STATUS
换货物流单号
EXCHANGE_LOGISTICS_TRACKING_NUMBER
退货物流状态
RETURN_LOGISTICS_STATUS
售后完结时间
COMPLETION_SALES_SERVICE_TIME
用户售后说明
USER_AFTER-SALES_INSTRUCTIONS
评价管理表
字段备注
字段名
脱敏情况
用户昵称
USER_NICKNAME
脱敏
评价日期
EVALUATION_DATE
评价ID
EVALUATION_ID
脱敏
订单ID
ORDER_ID
脱敏
商品ID
PRODUCT_ID
脱敏
商品名称
PRODUCT_NAME
脱敏
商品规格
PRODUCT_SPECIFICATIONS
脱敏
商品品质得分
PRODUCT_QUALITY_SCORE
商家服务得分
MERCHANT_SERVICE_SCORE
物流体验得分
LOGISTICS_EXPERIENCE_SCORE
评价内容
EVALUATION_CONTENT
评价等级
EVALUATION_LEVEL
追评内容
REVIEW_CONTENT
追评时间
REVIEW_TIME
评价有礼活动表
备注
字段名
脱敏情况
活动时间
ACTIVITY_TIME
脱敏
活动ID
ACTIVITY_ID
脱敏
评价ID
EVALUATION_ID
脱敏
返券金额
REBATE_AMOUNT
物流信息表
备注
字段名
脱敏情况
运单号
WAYBILL_NUMBER
脱敏
订单编号
ORDER_ID
脱敏
发货时间
DELIVERY_TIME
业务模式
BUSINESS_MODEL
快递公司
EXPRESS_DELIVERY_COMPANY
包裹状态
PACKAGE_STATUS
揽收省
COLLECTING_PROVINCES
揽收城市
COLLECTING_CITIES
当前异常类型
CURRENT_EXCEPTION_TYPE
异常说明
EXCEPTION_DESCRIPTION
异常状态
ABNORMAL_STATE
订单备注
ORDER_REMARKS
处理状态
PROCESSING_STATUS
揽件时间
PICKING_UP_TIME
签收时间
SIGNING_TIME
评价标签信息表:
备注
字段名
脱敏情况
评价ID
EVALUATION_ID
脱敏
标签名称
LABEL_NAME
标签内容
LABEL_CONTENT
正反馈标志
POSITIVE_FEEDBACK_FLAG
中性反馈标志
NEUTRAL_FEEDBACK_FLAG
负反馈标志
NEGATIVE_FEEDBACK_FLAG
指标说明如下:
指标名称
指标含义
退货金额
全端退款成功的退款金额汇总。在退款成功日期+1天计入支付日期中,数据每日回溯历史30天。包括发货后退货退款、发货后仅退款、发货前退款、换货退款、其他退款
退货订单数
全端退款成功的退款订单数汇总。包括发货后退货退款、发货后仅退款、发货前退款、换货退款、其他退款
退货人数
全端退款成功的退款人数汇总
退货率
退款率=退款金额/GMV
发货后仅退款金额
全端发货后,用户在未收到货的情况下申请仅退款的退款金额总和
负反馈退货数
按筛选日期前推14天支付的订单,在订单支付后14天内因商品问题退货、换货的订单量/按筛选日期前推14天支付的订单总量。如选择1/15日数据,实际统计1/1日支付订单的品质退货单量。
非负反馈退货数
按筛选日期前推14天支付的订单,在订单支付后14天内因非商品、物流问题退货、换货的订单量/按筛选日期前推14天支付的订单总量。如选择1/15日数据,实际统计1/1日支付订单的品质退货单量。
物流原因退货数
按筛选日期前推14天支付的订单,在订单支付后14天内因物流问题退货、换货的订单量/按筛选日期前推14天支付的订单总量。如选择1/15日数据,实际统计1/1日支付订单的品质退货单量。
好评数
商品评价结果为【好评】的评价数,不包含申诉后执行剔除的数据。
差评数
商品评价结果为【差评】的评价数,不包含申诉后执行剔除的数据。
评价有礼获评数
通过评价有礼活动获得的有效评价数
揽收-签收时长
从订单支付到时效签收(有末端记录的,包括驿站、快递柜、用户签收等)的平均时长,单位小时。
线路时效达成率
从订单支付到时效签收(有末端记录的,包括驿站、快递柜、用户签收等)时长大于比平均时长*1.3的物流订单数/总物流订单数
超长单占比
从订单支付到时效签收(有末端记录的,包括驿站、快递柜、用户签收等)时长大于比平均时长*1.8的物流订单数/总物流订单数
分析思路
4、数据处理
①数据加工及清洗
售后订单信息表、物流信息表、评价管理表和评价有礼活动表的原始数据的数据量非常庞大并且其中设计多个维度表和事实表的关联,根据整理的分析思路,将原始的相关的DW表和维度表在数仓进行维度退化将其拉成宽表。原始数据加工过程中,用到MPP分布式的数据库DORIS对数据进行去重、异常值处理(申诉成功,异常订单,赠品)等操作,还用使用了Python的pandas对标签数据清洗和格式化。
②数据脱敏
将订单号、评价ID,物流ID和活动ID等进行加密处理,购买金额乘以特定系数等进行数据脱敏处理后,导入到CSV及Excel文件中。
③利用GPT对用户评价信息进行关键标签提取,提取后在使用python清洗和格式化数据
例:利用GPT对用户评价提取关键的标签信息:
GPT 提取到的标签信息:
④建立自助数据集
将事实表和维度表的CSV、Excel文件导入到FineBI中,通过建立各表之间关联图,添加公式等做成所需的自助数据集
建立各个视点用到的自助数据集
④退货订单的数据集
⑤订单评论的数据集
⑥物流信息的数据集
其他的自助数据集也是根据实际分析需求自助创建,此处不再一一赘述。
5、可视化报告
总览:
首先,整体的分析选择了指标卡去展示核心的售后指标,这样会让阅读者第一时间清晰的掌握目前售后情况是怎么样的。
售后分析:
对总体的情况掌握之后,就从退货订单/金额、客户满意度、退款纠纷率等方面的指标进行趋势分析,帮助用户更好地理解售后情况的变化趋势和规律,识别出数据中的趋势和周期性变化,以及异常值和离群点。这些信息可以帮助用户做出更好的决策。
商品评论是消费者分享购买体验的重要渠道,可以帮助增强购买信心、 提升商品的口碑和知名度、促进消费者互动和忠诚度监控商品评论数的趋势,分析好评差评的占比,以及其中多少是通过好评有礼活动吸引进来的。
通过列表展示好评、差评TOP10的品牌
对各个快递公司的线路运营能力进行拆解,冲揽收、时效达成、超长单占比、物流退货数和差评数等指标进行分析
使用对比柱状图,观察每个标签的正负反馈情况和比例
(3)最终结果呈现的页面布局
最终作品如下:https://bisolutions.fanruan.com/webroot/decision/link/jVlV
三、参赛总结
1、FineBI工具
在点赞方面,我认为帆软BI的以下亮点功能非常实用:
数据整合功能:能够快速有效地整合不同来源的数据,方便更好地分析和呈现数据。
数据可视化工具:能够将复杂的数据以直观、易懂的方式呈现给用户,方便用户快速了解数据背后的趋势和规律。
数据交互功能:用户可以通过对数据的交互操作,进一步了解数据的细节和规律。
2、参赛总结
在这个数据分析比赛里,我遭遇了不少挑战,但也收获了不少帮助和成长。
首先,学 FineBI 这事儿,给我造成了不小的困扰。一开始,我试着通过阅读官方文档和在线教程来学习,但那些资源并不能完全解决我的问题。后来,我加入了一些在线社群,向其他使用者请教,并从他们的经验中学习。除此之外,我还尝试了各种操作方法,通过不断尝试来理解并掌握 FineBI 的功能。在处理数据和分析的过程中,我也遇到了不少问题。有时候,我会遇到数据缺失或数据异常的情况,这会影响到我的分析结果。
感恩的是通过这次大赛,我能更好地理解业务,并提出改进建议。这让我更深入地了解了自己的工作,也让我更自信了。在团队协作和参赛交流中,我遇到了许多志同道合的小伙伴。他们给了我很多鼓励和支持,也分享了许多有用的经验和技巧。我学到了很多新的思路和方法,也建立了许多有意义的联系。