【2022BI数据分析大赛】北京市城市边缘地区与中心地区的差异性分析
作品介绍视频连接:https://haokan.baidu.com/v?vid=4361352935593917423&pd=pcshare
一、选手简介
1. 选手介绍
个人介绍:尚进,来自于首都经济贸易大学统计学院,统计学学硕,对数据分析比较感兴趣。
个人照片:
2. 参赛初衷
希望通过这次比赛提升自己的数据分析以及数据可视化能力,同时为自己的家乡北京市房山区的建设作出绵薄之力。
二、作品介绍
1. 业务背景/需求痛点
业务背景:共同富裕是全体人民通过辛勤劳动和相互帮助最终达到丰衣足食的生活水平,也就是消除两极分化和贫穷基础上的普遍富裕。在实现共同富裕的新征程中,最艰巨最繁重的任务仍然在农村。然而,连接城市与农村的城市边缘地区,既保留了城市区域的部分特征,同时也存在着由于边界效应带来的新的特征。这样特殊的区域在实现共同富裕的进程中也同样需要我们重点关注。房山区作为北京市的城市边缘地区,虽然矿产、旅游等资源较为丰富,但经济始终都没发展起来。在北京市16个区县中,房山区的GDP位于中下游水平,而且从GDP增量指标来看,房山区与中心城区的差距还会增大。可见,从宏观角度来看房山区受到边缘效应的影响还是很大的。
需求痛点:北京市房山区作为北京市的城市边缘地区,虽然矿产、旅游等资源较为丰富,但经济始终都没发展起来,而且由于缺少大型企业以及地理位置偏远的劣势,众多中小企业都呈点状而非网状分布,形不成系统抵抗力,这使得房山区很难形成高端的产业链结构。产业集聚度、关联度不够、内生力不足、过于依赖外向发展,种种问题值得深思。在北京市16个区县中,房山区的GDP位于中下游水平,而且从GDP增量指标来看,房山区与中心城区的差距还会增大。
2. 数据来源
自选数据:数据来自于北京市统计局2020年统计年鉴。
3. 分析思路
通过对房山区的发展现状进行分析,并将房山区与北京市中心城区的经济、教育等指标进行比较,说明其中产生边缘效应的影响机制,从而对此类城市边缘地区产生相对贫困现象做出解释并给出合理的解决方法和建议。
4. 数据处理
对绿地覆盖率进行计算,采用随机森林机器学习的方法进行缺失值填补,使用三倍标准差的方法识别异常值。
5. 可视化报告
(1)数据含义表达和图表排版布局
图1 北京市各区县城镇人口分布图
通过上图可以反应北京市各区县城镇人口分布,房山区的城镇人口还是比较少的,说明房山区城镇化程度不高。
图2 北京市各区县生产总值分布图
通过上图可以反应北京市各区县生产总值分布,房山区的生产总值还是比较低的,说明房山区经济发展程度不高。
图3 北京市各区县小学在校生条形图
通过上图可以反应北京市各区县在校小学生人数,房山区的学校数量处于中游水平,说明房山区的小学教育做的还不错。
图4 北京市各区县执业医师数气泡图
通过上图可以反应北京市各区县执业医师数,房山区的医生数还是比较少的,说明房山区医疗资源不多。
图5 北京市各区县民用汽车拥有量词云图
通过上图可以反应北京市各区县民用汽车拥有量分布,房山区的居民汽车拥有量还是比较少的,说明房山区居民生活水平较低。
通过在校学生数量比较房山区与中心城区的教育情况,结果如表1所示:
表1 北京市房山区与城市中心地区的各阶段在校学生数统计表
区县
幼儿园在园幼儿
小学在校学生
普通中学在校学生
人数(万人)
所占比重(%)
人数(万人)
所占比重(%)
人数(万人)
所占比重(%)
房山区
3.39
2.58%
5.77
4.39%
2.75
2.09%
东城区
1.96
2.76%
6.55
9.24%
3.92
5.53%
西城区
2.35
2.12%
9.92
8.97%
5.45
4.93%
朝阳区
8.89
2.58%
15.58
4.51%
6.02
1.74%
海淀区
7.24
2.31%
17.96
5.73%
11.01
3.52%
丰台区
4.50
2.23%
6.66
3.30%
2.72
1.35%
石景山区
1.54
2.71%
2.41
4.24%
1.20
2.11%
从表1可以看出,房山区的幼儿园在园幼儿数为3.39万人,占总人口比重2.58%;小学在校学生数为5.77万人,占总人口比重4.39%;普通中学在校学生数为2.75万人,占总人口比重2.09%。通过对比表中数据可以发现:在幼儿数所占比重上房山区与北京市中心城区没有差别,但在中小学生教育上,房山区的学生比重明显低于北京市中心城区。
通过计算绿地覆盖率,比较分析房山区与北京市中心城区的绿环情况,画出北京市所有区县的绿地覆盖率热力图,结果如图6所示:
图6 北京市房山区与其他区的绿地覆盖率(%)热力图
根据公式的计算结果以及图6的热力结果显示,房山区的绿地覆盖率为4.19%,北京市中心城六区中绿地覆盖率最高的是石景山区,为52.09%。北京市所有区县的绿地覆盖率均值为14.48%。在16个区县中,房山区的绿地覆盖率排在第11位,位于中下游水平。从热力图中可以明显发现城市边缘地区的绿化建设有所欠缺。从图5中也可以看出,房山区等北京市边缘地区的绿地覆盖率明显低于城市中心地区,说明城市边缘地区的绿化以及居住环境不容乐观。
房山区与北京市中心城区的社会保障设施数比较结果如表2所示:
表2 北京市房山区与中心城区的社会保障设施统计表
区县
65岁及以上人口
医疗卫生
机构数
(个)
执业
医师数
(人)
社会
组织数
(个)
社会救助
对象总人数
(人)
人数(万人)
所占比重
房山区
17.4
13.3%
1047
4269
549
6946
东城区
12.9
18.2%
548
10446
699
10290
西城区
20.1
18.2%
699
14205
701
14158
朝阳区
49.3
14.3%
1729
22650
1057
11343
海淀区
40.9
13.1%
1253
14749
945
5317
丰台区
32.0
15.9%
548
9621
493
9559
石景山区
9.3
16.4%
223
3206
318
7359
从表2可以看出,北京各区的65岁及以上人口分布人数最多的区为朝阳区和海淀区,人数最少的是石景山区,其中医疗卫生机构数最多的是朝阳区,明显高出其他城区的多,最少的是石景山区,房山区的医疗卫生机构数为1047个,医疗机构的数量还是较多的,执业医师的人数中占比最多的是朝阳区有22650个医师,房山区的医师人数明显较少,只有4269个医师,可知房山区的医师人数明显不足。社会组织个数中房山区有549个,相对于中心城区来说组织数量较少但多于石景山区和丰台区。社会救助对象总人数分布来看对西城的帮助人数最多。结合上述分析,房山区的社会保障设施略少于北京市中心城区,房山区等城市边缘地区在经济、社会帮扶、医疗状况等方面与北京市中心城区有着明显的差距。
(2)通过分析得出的结论
房山区地处于北京市的城市边缘地区,其经济建设、教育资源等方面的发展现状是较为落后的。
房山区在经济、教育及民生状况等方面与北京市中心城区有着明显的差距。
(3)最终结果呈现的页面布局
三、参赛总结
1. FineBI工具
FineBI工具是我使用的第一个商业智能工具,对我在日常的学习产生了极大的帮助,尤其是数据可视化效果,我的导师非常赞赏我每次做的图,真不错。
2. 参赛总结
很高兴能够参加这次比赛,作为一名统计学的学生,对于数据分析的热爱是不言而喻的,感谢帆软组织了这个比赛,谢谢!