1.选手简介
1.1.选手介绍 帆软社区用户名:yaho 职业简介:目前待业状态,之前是公司的数据分析师。
1.2.参赛初衷 在参加BI可视化冬季挑战赛之前,了解到fineBI,自己试用了fineBI,很方便好用,这次参赛希望能够通过比赛考验下自己数据分析的能力,也想在挑战赛中得到帆软的一些老师的指导,向其他的大佬学习分析思维。
2.场景介绍
2.1.背景介绍&数据来源 - 业务背景:本次大赛的主要目的是分析某互联网用户行为,包括那种营销推广渠道更好,新老用户的停留时间以及用户的性别年龄水平等,为该公司总经理做明年的规划提供数据和决策思路。
- 数据来源:使用官方提供的参考数据:数据7:互联网公司用户行为分析。
2.2.分析思路 拿到数据后,首先研究用户行为分析的三大主要分析方向及其延伸的分析主题,然后仔细观察相应数据及是否有异常,进行数据加工,最后制作仪表盘。
根据用户行为表现,可以分为三类指标:黏性指标、活跃指标和产出指标。 - 产出指标:主要衡量用户创造的直接价值输出,比如页面浏览量PV、独立访客数UV、点击次数、跳出次数、总停留时间、消费频次、用户数等。
- 活跃指标:主要考察的是用户访问的参与度,比如活跃用户、新增用户、平均停留时长等。
- 粘性指标:主要关注用户周期内持续访问的情况,比如新用户数与比例、活跃用户数与比例、用户转化率、用户留存率。
以下从几个角度对用户行为进行分析。 - 用户行为趋势分析:统计时间内用户浏览量趋势,每月用户的浏览量,每月成交频次。
- 用户性别年龄分析:用户年龄分布(哪个年龄段浏览量,用户数情况),用户性别分布。
- 用户渠道、地区分布:用户来源渠道分布情况,各渠道占比,各地区浏览分布,不同地区渠道分布各地区成交的用户来源于哪些渠道。
- 用户类型、访问平台分析:每月用户数变化趋势,新老用户分布占比,用户浏览分布情况(哪些用户浏览多,哪些少),不同用户类型各平台分布。
- 用户转化分析:页面各阶段转化情况,不同渠道、不同访问平台,各用户类型转化率
- 用户留存分析:当日留存率,月留存率等,用户活跃率。
2.3.数据整理 2.3.1合并表格 添加自助数据集,将两统计表合并,方便制作可视化仪表盘。
2.3.2空值处理 - 将一级渠道名,二级渠道名列新建列,将空值赋值为其他,并过滤掉原列
- 将年龄字段空值过滤掉
2.3.3异常值过滤 将地区属性中错误字段过滤,包括:不详市,县,区等
2.3.4漏斗转化数据集
2.3.5过滤字段 - 过滤注册日期字段,此日期在统计日期之后,为问题字段,删除
2.3.6新增列 - 新增用户最早统计时间列,即将每个用户最早的统计时间作为时间起点分析留存率。此过程是在Excel中完成,再将字段与用户访问统计数据集合并。
- 新增时间统计差
2.4.完成分析报告
2.4.1用户访问趋势分析 从浏览趋势图上看,每日浏览量基本平稳,在平均值上下波动,但有三个时间段浏览量明显增加,分别为国庆节,圣诞节,情人节,或为节假日期间消费需求增加,或为这三个时间段进行了营销推广。10月,12月,2月用户浏览量较高,是节假日引起当月浏览量增加。
2.4.2用户性别年龄分析 从用户年龄分布图看,网站用户年龄在20岁,21岁,23岁,30岁,31岁访问页面人数最多,浏览量/访问次数/跳出次数也相对高,年轻用户较活跃,说明平台主要用户为15-43岁年轻人群。根据用户性别分布图看,女性用户较男性活跃,女性用户浏览量占54.62%,访问次数占55.39%,跳出次数占53.95%,女性用户人数也较男性多,占53.85%,但网站男女用户分布差异不大。
2.4.3用户渠道、地区分布 从访问用户渠道分布看,访问用户主要来源于线上渠道、新媒体渠道,来源于新媒体渠道的用户总浏览量最多,其中,线上渠道的基础上线工作浏览量最多,占总体的20.66%,新媒体渠道的轮台、贴吧推广,微信推广,品牌基础推广,微博推广浏览量也较多,这五个渠道占总体的77.8%,因此,营销推广可主要针对新媒体渠道和线上渠道。由各地区访问分布看,来自东莞市的用户浏览量最多。如上不同地区各渠道浏览量top10分布图,可以知道以上几个地区对应渠道的浏览最多。根据各地区成交用户渠道分布图,列出各地区成交用户的对应渠道来源,发现基本上每个地区成交的用户来源渠道唯一,其他的渠道可能只看不买。
2.4.4用户类型、访问平台分析 根据每月新老用户变化趋势图,到2016.5新用户,老用户,VIP用户数急剧下降,返回原数据发现数据截止2016.5.2,并不能说明用户流失。看新老用户占比情况,新用户用户数最多,占47.35%,浏览量最多,占46.86%,近乎全用户的一半。VIP浏览量仅占16.29%,用户数仅占比15.15%,是用户数较少导致的浏览量少。从用户访问分布图显示呈现浏览量top10的用户及浏览量最少的10个用户,浏览量最多的10个用户为重点用户。从不同用户类型访问平台分布看,用户访问平台停留时间为IOS>Android>移动浏览器,数据显示主要访问平台为IOS和Android,移动浏览器访问较少,各访问平台停留时间均为新用户>老用户>VIP用户,与客户总体分布一致。
2.4.5用户转化分析 用户转化漏斗图展示访问操作各阶段用户数及转化率,可以看出,从搜索阶段到添加购物车,用户转化率为51.22%,从下单到付款转化率为50%,用户成交率主要是这两个阶段转化减半导致的,增加这两个阶段的转化率,可增加成交量。从不同渠道搜索-交易成功转化率表格,可以看出,其他渠道虽访客数少,但成交转化率最高,手机厂商预装,行货店面,微博推广渠道成交转化率也高。从平台成交转化率看,IOS和Android Q平台成交转化率稍高。
2.4.6用户留存分析 从用户留存率情况看,当日留存率高,第一月内及第五月内没有用户留存,其他情况均有用户留存,数据截止2016.5.2,第九月内因数据不完整导致,没有明显的用户流失情况。根据用户活跃分布图,用户在10月,12月,2月最活跃。
2.4.7完整仪表盘
2.5.总结 带着目的去观察数据,发现异常,明确分析方向,分析内容,再去制作仪表盘,这一过程很重要,不然会做一些重复工作,浪费时间。
|