一、选手简介
1、选手介绍
- 团队名称:跟着大佬学数据分析
- 队长介绍:社区ID:小尾巴。目前是XX企业员工,主要负责包装设计方面的研究工作,本次比赛中主要担任学习和实践工作,毕竟有大佬带,学习提升方面走的弯路很少。
- 成员介绍:
- 社区ID:晕晕cc,和我是同事关系,其在2021年finebi比赛中成绩优异,故本次邀请作为指导顾问,全程指导可视化比赛数据分析思路、清洗、建模、美化。
2、参赛初衷:
- 希望通过本次比赛,学习数据分析思维能力,结交到优秀的朋友
- 希望跟随大佬的步伐,弥补自己的不足
- 边学习帆软还给发奖金,这点很不错
二、作品介绍
1、业务背景
没啥业务背景的,所选取的数据和自身企业没有半毛钱关系,纯粹是想验证下大佬的真实水平,
2、数据来源
选取了推荐1:八爪鱼采集器部分已采集的数据供参考:
链接:https://pan.baidu.com/s/1eLkwXAjKf1opWEqur8l4Xg 提取码:fsad
【交通】酒店信息
3、分析思路
作为初学者拿到这份数据的时候我十分迷茫,不知道该如何下手,毕竟数据中的相关内容和我的本职工作相差甚远,故在开展分析的时候,我遇到了恨到坑,不过本次报名参赛是以小组的名义,队里有位大佬,在他的帮助下,让我走了很多弯路。
如:酒店ID,在开展分析的时候,我没有很关注这个指标,但是队友细心指导下,通过对数据的仔细核对后,发现同一ID大部分信息基本都相同,但是城市、价格相差较大,百度酒店地址都是同一个地方,感觉诧异,故对于此类数据,我采取了过滤处理,避免干扰因数影响最终的分析。
过滤掉频数大于1的值
当然,队友也细心的给我讲解了什么是文本型、数值型和日期型,让我数据分析中最基本的几个条件有所了解,因为这个在后续的建模中十分关键。
我们的整体思路是这样的,通过对数据的展示,我们首先要了解全国有多少家酒店,其酒店星级的分布情况。全国酒店分别可以利用地图、酒店星级分布可以用直方图。
接下来,对评论数进行分析,作为经常逛淘宝、美团的我来说,假如我要选择一个好的酒店,我首先要看的是他的销量,而不是推荐指数,毕竟,评论的人越多,这个指标会被明显的拉低,故我们可以选择评论数较多,且集中的几个城市展开分析。同步对比了酒店品牌及评论数
其次再看评论的内容,毕竟好与坏在这里面有明显的体现,将这种思维逻辑转换,酒店这张表中,刚好环境、服务、设施、卫生,刚好就是好与坏的衡量指标。这个几个指标刚好可以通过雷达图,展示其好坏。
最后对比价格情况。
通过以上的研究方向,我们找到了比较集中的几个酒店品牌,同时对比评论数,让我们感到差异的事,全国酒店数量排名不在前三的7天酒店,其评论数全国排第二,针对这个特殊的原因,我们逐一对这个差异点展开了分析,发现了其背后真正的原因。就是7天连锁酒店的低价位吸引了大多数客户。
结束部分,简单展示了排名前三城市,7天酒店的明细表。
作品公共链接:全国酒店分析简报 (fanruan.com)
三、参赛总结
大佬还是有一点真才实学的,对于我这个初学者来说。
通过本次的学习,让我明白了看似简简单单的一份数据分析报告,涵盖了很多知识。我一直以为建模做的好就是牛,但是真正在实践时,却卡壳了,原因是什么呢?主要还是不清楚需求是什么,这点很重要,因为这会导致你所做的分析都是浪费时间,毫无逻辑可言。
当然,我还有很多的不足,未来我将努力提升自己的不足,让菜鸟的自己的变得不是那么菜鸟。 |