【2023BI数据分析大赛】2021年成都存量住宅交易分析
选题背景
队长是来自成都的一个数据分析师,由于家庭居住和投资需要,比较关注成都楼市动向。自2000年初中国商品房由国家主导转向市场主导,楼市的赚钱效应吸引的额外多的社会关注。房住不炒是近年来的主基调,选择优质的房子不仅让全家住的舒服,更可以为日后置换居住需求的升级提供了强有力的支撑。
一、选手简介
1、选手介绍
(1)团队选手版
· 团队名称:三个臭皮匠
· 队长介绍:帆软社区用户名石头石头你最棒,目前就职于上海电信;目前从事大数据分析岗位,个人感兴趣的方向和领域-社会民生,公共服务等。
· 成员介绍——帆软社区用户名lbstjw,目前就职于郑州市销售企业,目前从事IT工作。自从去年一起组队后,感觉挺好玩的,自己这个臭皮匠今年申请再次出战,于是我们几个从疫情到现在、从选题到仪表板、从个人兴趣到作品展示,经历了令人难忘的一段美好时光......希望能借此机会继续磨炼分析水平。
· 成员介绍——好苗子鸭:有一定的数据分析经验,平时在工作中用过BI做仪表板,但总体来说理论大于实践,本次参赛很好地运用了所学。
· 团队组成:因在官方的学习群而结缘,去年组队并且参数拿奖。
2、参赛初衷
· 希望通过比赛实践提升BI工具的使用方法和技巧
· 准备在部门内推广BI工具,先来学习了解
· 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞
· 大赛奖励很诱人
二、作品介绍
1、业务背景/需求痛点
· 简述业务背景
· 在国家“房住不炒”的大力号召下,我们作为购房者应该如何在众多房源中挑选出自己满意的房子呢?房子不仅是一家老小遮风避雨的港湾,也是全家人几代人资金的沉淀池,选择一个好房子不仅可以居住舒适,还可以在日后有置换需要的时候可以卖的快卖的高。
· 简述需求痛点,
· 对于首次置业的购房者来说,如何了解楼市的信息是一个痛点。网上自媒体文章可能是软文,立场客观且分析专业的博主相对不多;中介业务水平良莠不齐,也只对自己负责的区域板块相对了解;亲戚朋友更是观点各异;所以如何快速全面的对整个成都楼市有初步的了解对楼市小白是一个不小的考验。本分析报告是对21年成都楼市二手房交易市场一份全面清晰的洞察,对购房者选择二手房源提供参考。
2、数据来源
· 自选数据:阿里天池平台——成都市二手房交易信息_2021
· 链接: https://tianchi.aliyun.com/dataset/154888
· 数据字典
字段名称
字段类型
注释
序号
文本
城市
文本
成都
房屋所属市辖区
文本
行政区
房屋地址(街道)
文本
行政区下属的街道,约等于楼市中的“版块”概念
房屋户型
文本
房间基本格局分布,x室x厅x厨x卫
所在楼层
文本
高中低楼+所在楼栋总层高
建筑面积(平方米)
数值
户型结构
文本
建筑类型
文本
房屋朝向
文本
建筑结构
文本
装修情况
文本
配备电梯
文本
有/无
挂牌时间
时间
交易权属
文本
房屋用途
文本
单价(元/平方米)
数值
3、分析思路
核心指标计算公式:
房屋总价=DEF_ADD(AVG_AGG(${单价(元/平方米)}))*DEF_ADD(AVG_AGG(${建筑面积(平方米)}))
钢混房源占比=DEF(COUNT_AGG(${建筑结构}),,${建筑结构}="钢混结构")/DEF(COUNT_AGG(${建筑结构}))
街道数量=COUNTD_AGG(${房屋地址(街道)1})
商品房数量占比=DEF(COUNT_AGG(${交易权属}),,${交易权属}="商品房")/DEF(COUNT_AGG(${交易权属}))
市辖区数量=COUNTD_AGG(${房屋所属市辖区})
4、数据处理
· 过滤掉脏数据,比如房屋户型=“0室0厅0卫0厨”。
· 补全数据,比如房屋用途=普通住,结合上下语义补充为“普通住宅”。
· 分列,所在楼层拆分为=高/中/低楼层+共X层,具体步骤见下图:
5、可视化报告
5.1组件介绍
5.1.1标题
5.1.2 房源基本情况介绍
①简述
总体上对房源数据的数量,区域分布做介绍
②图表设置
指标卡片:使用大号数字以及亮色,以便于一目了然所使用数据的样本数量;
明细表:每个市辖区(可下钻到街道)房源分布,开启数据条直观展示不同区域数据对比。
③分析结论:
(1)样本数据为14837套二手房源交易数据,平均每套交易住宅的面积为101.63平方米。
(2)数据覆盖成都20个市辖区,168个街道,其中属金牛区二手交易量最大为1574套,都江堰二手交易量最小224套。
5.1.3 房源基本情况介绍
①简述
分析房源在不同视角下的特征。
②图表设置
词云:展示建筑楼层的主流数据
饼图:房屋户型,建筑类型,交易权属,建筑结构,楼层等维度下不同种类占比
雷达图:房屋朝向优势
地图:市辖区内房源数量与成交单价,颜色越深成交量越大。
折线图:在时间维度上展示挂牌量走势
矩形树图:从矩形块大小直观展示主流户型
柱状图:成交套数和建筑面积在不同建筑结构下的数量对比;面积段分布对比;
明细表:不同房屋用途数量和面积明细;不同交易权属在数量和面积上明细;
迷你表:是否配有电梯和房屋用途明细对比;
③分析结论:
(1)在二手交易市场中总层高为6层,7层和18层的建筑最多。
(2)在不同户型结构中,平层占比最大,约为9成。
(3)在不同建筑类型中,板楼和板塔结合的房源占比最多且接近,分别超过三分之一。
(4)东南朝向和南朝向的房源交易量遥遥领先其他房源。
(5)商品房占比96.17%,钢混结构占比约为50%。
(6)从地理圈层来讲,越靠近核心区域(一圈层)成交量和成交单机越高,值得注意的是同等圈层的城市南向(天府新区)比北向(新都)成交数据更多。
(7)电梯房源占比为了7成,普通住宅占比超过99%。
(8)高楼层的房源成交比中低楼层更多。
(9)2021年年度成交的房源中挂牌时间从2017年第二季度横跨到2021年第四季度,随着时间越靠后数量越多,可以理解为优质的房源很快会被市场消化掉,越是挂牌久远的房子可能因为存在某些劣势而越难卖。
(10)成交的主力户型为:3室2厅1厨2卫和2室1厅1厨1卫。
(11)钢混结构的房子成交量最大,不同结构的房原套均面建筑面积基本持平。
(12)90平方米以内的房源成交占比最大,刚需购房者才是成都二手楼市消费的主力军。
(13)在10层以上的高层建筑中,超过6成为钢混结构,超过3成为框架结构。
(14)普通住宅的成交数量和套均面积遥遥领先于商业办公类。
(15)商品房的成交数量和套均面积遥遥领先于其他交易权属。
5.1.4 房源成交单价的影响因素分析
①简述
分析房屋每平方米单价可能受到的影响因素分析
②图表设置
矩形块:从颜色深浅观察出有无电梯和楼层2个维度下成交数量对比
条形图:展示出每个街道平均单价的前10名和倒数后10名。
折线图:随着面积段增加,单价的走势
柱状图:不同户型结构成交单价对比
③分析结论:
(1)在配备有电梯的房源中高中低楼层的房源的价格都较为理想,而在没有电梯房源中只有底层住宅的单价较为理想。
(2)在成都168个街道中,单价最高的前10名全部为南门——高新区和天府新区,单价超过3万,而排名第一的双流区牧马山板块为纯别墅区豪宅板块,单价甚至超过了惊人的14万。单价最低的10个街道多数为三圈层(郊区新城),单价均不过万。
(3)随着面积段增加,房源单价也在逐步上升。
(4)在4种户型结构中,平层的价格最低约为每平方米1.3万元,其他户型结构多存在别墅和洋房等豪宅中,所以单价较高。
5.1.5 房屋成交总价影响因素分析
①简述
分析房屋总价可能受到的影响因素分析
②图表设置
矩形块:装修情况和面积段不同的成交总价
柱状图:挂牌时间不同套均总价不同
区域地图:每个市辖区的套均总价
折线图:不同房屋户型的总价变化
雷达图:朝向对总价的影响
③分析结论:
(1)面积越大,装修越好的房屋,总价也随之上涨。
(2)挂牌时间越短的房子总价越低,可以理解为总价低的房源好卖,总价高的房源需要更多的时间才能被市场消化。
(3)房间数量越多的房源总价越高,与之类似的是面积越大总价越高。
(4)坐南朝北的房子总价最高,南向房源采光好,在阴天为主的四川盆地,阳光更加的珍贵。
(5)从地理上来讲,套均总价呈现出“南门高、北门低”的态势。
5.2 完整仪表板
仪表盘公共链接:
https://bisolutions.fanruan.com/webroot/decision/link/mbEh
三、参赛总结
1、FineBI工具
本次可视化分析报告的制作让我对FineBI的运用更加得心应手,以下是我的使用感受:FineBI为新手小白配备了相应的基础学习课程,使得我们可以快速熟悉软件。此外,FineBI的帮助文档应有尽有,在制作仪表板过程中所遇到的问题基本上都可以解决。FineBI页面简洁明了,提供了丰富的图表样式、一系列的配色方案和仪表板样式,使得我们可以制作出直接美观的报告。自助数据集可以随时更新,更新完毕后,组件也会同步发生变化。组件之间可以实时联动,动态的数据一方面增加了数据的趣味性,另一方面便于我们挖掘更多的数据信息。
2、参赛总结
去年和我的队友们在帆软官方学习交流群里面相识并组过队了,还拿了一个奖,还参加了官方举办的线下颁奖典礼,十分开心!今年比赛肯定要再来一次!今年软件也有了一个很大的升级,新增加了def函数功能,这块需要我们持续跟进工具优化来调整,新的版本意味着更加强大的功能。这可以助力我们数据分析师在工作中提高效率,感谢我的队友们,感谢官方提供的平台,感谢背后的工作人员和研发工程师。