【2022BI数据分析大赛】共享单车租借因素分析报告
作者:刘泽欢
一、背景介绍
共享单车是指企业在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供自行车单车共享服务,是一种分时租赁模式,是一种新型绿色环保共享经济。
共享单车系统是一种租赁自行车的方法,注册会员、租车、还车都将通过城市中的站点网络自动完成。
使用共享单车,可以注册会员,存入一定金额用于使用结束后自动扣费结算;也可以不注册会员,临时使用后通过其提供的支付方式结算费用。
人们通过下载APP使用这个系统进行扫码开锁取车,然后从取车地骑到自己的目的地后停放锁车归还,系统自动按实际使用时长计费。
二、分析思路
1、共享单车的用户数与哪些因素有关?
2、提取出可以帮助增加用户数的建议。
三、数据理解
数据来源https://www.kaggle.com/c/bike-sharing-demand/data。
数据源中有三个csv文件,分别为:sampleSubmission.csv、test.csv、train.csv,考虑此分析仅做描述性分析,因此只选择train.csv文件的数据集。
train.csv文件是跨越2011-2012年两年的每小时租赁数据,包含天气信息和日期信息,每月只有1-19号的数据,全部数据为10886行12列,各列的字段含义如下:
序号
字段
翻译
序列
1
datetime
时间
2
season
季节
1,春天;2,夏天;3,秋天;4,冬天
3
holiday
假期
1,是;0,否
4
workingday
工作日
1,是;0,否
5
weather
天气
1,晴天;2,阴天;3,雨雪天;4,恶劣天气
6
temp
实际温度
7
atemp
体感温度
8
humidity
湿度
9
windspeed
风速
10
casual
未注册用户
11
registered
已注册用户
12
count
总用户数
四、数据清洗
数据清洗加工步骤包括:选择字段(全选),字段重命名(按照上文翻译),删除重复值(无),一致化处理(把时间字段分列成“日期”和“时间”),数据排列(无),异常值处理(无)。处理完后导入FineBI共10886条记录。
最终整理数据集如下所示:
五、分析过程
5.1探索用户数与时期因素的关系
分析结论:
①由图1可知,总用户数量在2011-2012这两年内保持持续增长的趋势,并且具有明显的季节周期趋势。
②由图2可知,用户数高峰期在秋季和夏季,其次是冬季,而最少在春季,是因为受春节以及雨季影响。
③由图3可知,用户高峰期出现在5-10月,然后出现下降趋势,同样验证了上述结论中的季节周期趋势。
5.2探索用户数与时间因素的关系
分析结论:
①由图3和图4可知,用户数在工作日分布图中出现两个波峰,对应为上下班时间(早上8点,下午6点),为通勤高峰期;
②在假期,如图5所示,用户数在白天时间段8-18(点)持续上升保持较高数量,夜间持续下降保持较低数量,符合人们白天外出游玩需要用车,夜间休息的生活规律;
③另外,对比可知,注册用户在工作日增多假期减少,非注册用户在假期增多工作日减少。
5.3探索用户数与天气因素的关系
分析结论:
①用户数量随着实际温度升高而逐渐增加,在25-30摄氏度之间达到高峰,而后逐渐减少。
②在晴朗的天气用车人数最多,阴天次之,雨雪天骤降,恶劣天气几乎无人用车。(受天气影响很大)
③用户数量随着体感温度升高而逐渐增加,在0-35度之间达到了峰值,而后逐渐减少。
分析结论:
用户数量在湿度的20-25之间时达到高峰,而后随着湿度增加,用户数量逐渐减少;而用户数在风速0-45之间基本保持平稳,在风速达45之后大起大落,受大风天气影响较明显。
六、结论建议
共享单车由注册用户与非注册用户构成,而主要群体以注册用户为主;共享单车的用户总数主要受季节因素、摄氏度、体感温度、湿度、时刻影响比较明显。根据数据分析提出几个建议:
1、用户总数随时间在持续上升,可以增加共享单车的投放数量以满足业务需求;
2、用户总数在夏季、秋季较多,而在春季较少,可以选择在春季大批量回收车辆进行维修保养;
3、用户总数在工作日的上下班时段达到高峰期,因此在此时间段前进行车辆调度集中投放在地铁口、公交站台、小区出口等附近以供人们方便使用,提高用户量;而在假期,则在白天时刻集中投放在各小区出口、地铁口、景点等附近以供人们方便使用,用以提供用户量;
4、用户总数在温度达到20-25摄氏度之间达到高峰期,因为温度较舒服,人们喜欢骑单车出行,因此在这种天气时增大投放量。
最终仪表板展示: