Airbnb运营数据分析

楼主
我是社区第3112393位番薯,欢迎点我头像关注我哦~

一、分析背景与目的

1.1分析背景

      Airbnb成立于2008年,短短9年时间成为了短租民宿行业的巨头,并且仍在不断的冲击着传统酒店行业,抢占着这一市场。

      目前Airbnb作为一款社区平台类产品,其业务遍布了191个国家,我们的分析主要以探索为主,旨在发现airbnb在做好了产品体验、房源美感、民宿共享服务之后,其务是否存在可以改进的地方。

      airbnb目前的市场背景:短租民宿行业的绝对巨头;业务布局区域极广,airbnb的业务遍布全球191个国家;产品和业务发展成熟,无论是客户端还是后端供应链系统,其研发的成熟型在当时可谓屈指可数。

 

1.2提出分析问题

      探索airbnb产品的业务存在哪些可以改进的地方?

      针对分析的目的,提出以下三个方向目的:

      ①airbnb的目标用户群体具有什么样的特征,以便于在付费投放获客时,精准的圈定出产品用户画像的人群,使获客的ROI变得更好。

      ②airbnb获客阶段,哪些推广渠道是优质的,优质的条件 = 量大+转化率高。

      ③在转化率方面哪一环节存在可提升的潜在机会。

 

二、分析维度

      根据以上设定的三个问题,提出来2个分析维度:

      将着重从airbnb的用户画像、推广渠道分析2个方面进行分析,去探索和分析airbnb在产品和业务上有哪些可以改进的地方,并给出实际性的建议,以提升和改进airbnb的渠道推广策略和产品设计。

      用户画像分析:用户性别的分布特征、用户年龄的分布特征、用户地区的分布分布、中国地区去国外预定的地区占比。

      推广渠道分析:每月新增用户、不同用户端的注册量、不同推广渠道的注册量、不同营销内容的注册量、不同推广渠道的转化率、不同营销内容的转化率,注册用户占比,下单用户占比、实际支付用户占比等。

 

三、数据表理解与预处理

3.1数据集描述

      Airbnb顾客预订数据下载,下载地址:www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data。

      此数据聚集包含两张数据表,其中train_user表中为用户数据,sessions表中为行为数据。

 

3.2数据预处理

1、重复值处理

      train_users:作为用户信息表,未避免重复用户影响统计,需要检验ID是否有重复值。

      sessions :为用户会话记录表,存在一个用户多条记录,无需处理。

      按照业务理解,用户表中的id应当是唯一非重复的,所以只需要排查train_users中是否存在重复值。执行SQL后得出:count_id = 0。说明train_users数据表中不存在重复值。

2、缺失值处理

      数据缺失数量较多,以下为存在缺失值的列及处理办法。字段缺失值说明:

      ①date_first_booking 首次预定时间:存在缺失值数量124544个

      ②gender 性别:存在缺失值数量95688个

      ③age 年龄:存在缺失值数量87991个

      ④first_affiliate_tracked 注册渠道:存在缺失值数量6065个

      ⑤first_browser 注册浏览器:存在缺失值数量27266个

      ⑥action_type 操作类型:存在缺失值数量1126204

      ⑦action_detail 操作详情:存在缺失值数量1126204个。

      处理:多数空值不需要处理;如果使用到字段如果出现空缺,做针对性的过滤,再进行分析。

3、异常值处理

      age(年龄)异常值处理:age(年龄)的异常数据非常多;0~150之间的数值都有,并且包含了2014、2015等数值。推测这些"脏数据"产生的原因是用户在客户端随意填写造成,分析时剔除这些异常数据。

 

四、用户画像分析

4.1用户的性别分布特征

1.用户性别比列分析:

 

 

女性用户数量=(占比53.2%)、男性用户数量=50428(占比46.8%),其中女性用户多于男性用户。

 

 

4.2 用户的年龄分布特征

 

airbnb的用户主要为“中年群体”(30岁~40岁),其次为“青年群体”(20岁~30岁),然后再到40岁~50岁。

 

 

4.3 用户不同地区(根据语言)的分布

使用最多的语言是英语,人数达到120172人,为方便分析过滤掉英语之后

 

排名前5的分别是英文、中文、法文、西班牙文、朝鲜文。

有超过90%的用户是英语国家(欧美);airbnb是2013年开始进入中国市场的(此数据集止于2014年),所以此时中文用户数量虽然排名第二,但是占比却非常小。

 

4.4 中国用户去国外预定的地区占比

从数据结果可以看出,中国人去国外预定民宿最主要集中在美国、然后是法国,除了这两个国家外,样本中其他国家的数量非常少。

中国用户去国外预定,占比最多的是美国。其余国家占比很小,总和不到20%。

 

五、流量渠道分析

 

5.1每月新增用户

airbnb用户2010-2012平稳增长,从2012年之后开始快速增长。

2012与2013年的7~10月,产品都会迎来用户增长的高峰,推测为夏季是旅行的旺季,而短租本身就是旅行消费的一种。

2014年2-4月,用户急速增加,迎来用户增长的高峰,推测为airbnb进行了相关的促销与宣传。

 

5.2不同用户端的注册量

从图中可以看出注册量top5的用户端:(1)Mac Desktop  (2)Windows Desktop  (3)iphone  (4)ipad  (5)其他设别

 

5.3不同渠道供应商的注册用户量

除direct直接下载之外,google是其主要的下载来源,注册用户量也比较多(79911)。

 

5.4不同渠道注册用户转化率

 

上面是分析出的是册用户转化率前五名的渠道分别为:direct,baidu,craigslist,bing,email-marketing

 

虽然craigslist、bing,email-marketing虽然注册用户量少,但是转化率高,应该尽可能的扩大规模这三个渠道的获客规模。

 

六.分析结论及建议

6.1、用户画像总结

1、结论

      ①用户性别中,女性偏多,差距并不明显。

      ②用户年龄以中青年为主。

      ③截止2014年,用户分布地区最多的为欧美地区,其次是中国。

      ④中国用户预订的最多的其他国家是美国,占比高达90%以上。

2、建议

      据年龄分布特征,建议付费广告投放时,投放广告的流量结构要尽可能的接近airbnb的用户人群,例如青年女性群体。

 

6.2流量渠道总结

1、结论

      ①2012开始快速增长,并且速度很快。

      ②7~10月是旅行旺季、此时也是airbnb用户增长的旺季。

      ③某些渠道虽然注册用户量少,但是转化率高;需要选择这些渠道扩大投入规模。

2、建议

      综合考虑ROI表现最好的渠道,同时要结合市场战略和多哥指标综合考虑;某些渠道虽然注册用户量少,但是转化率高,可以尽可能的尝试扩大规模。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表