设为首页收藏本站

北京业主的网上家园 北京地区具有影响力的小区业主论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 2094|回复: 0

大数据看城市之北京市小学排名

[复制链接]
发表于 2018-2-19 11:09:49 | 显示全部楼层 |阅读模式
转自全球大搜罗

     首先声明,本篇排名不仅仅是教学质量排名,不仅仅是教学质量排名,不仅仅是教学质量排名,重要的事情说三遍。
因为有了娃,想着看看学区房的信息,在网上翻了翻后发现好像并没有官方的小学或中学排名,各个论坛的民间排名互相出入或大或小,但也没讲是怎么排出来的,遂萌生自己动手的想法,于是就算了这个北京市小学的排名。
作为曾经整天摆弄数据的老郭,若干年前用住房成交数据算过一些小学中学的空间价值梯度和需求弹性,当时是用来处理城市公共设施产品的一些问题。用房价“挖掘”学校的“价值”具有较坚实的理论基础,同时因为学区房的概念具有很强的现实意义,又是老郭比较熟悉的领域,所以可行性较高。
需要说明的是,本篇排名中评分的含义是各个小学的综合“价值”或“效用”,教学质量肯定是其中的最主要内容,但除此之外也包含教学之外的一些“社会因素”,比如一些小学社会声誉高,或者需要很强的社会资源才能进入,或者位于较高端的区位,从而给在其中就读的学生及其家长带来一定的社会“符号”价值,等等。这一综合性结果是房价数据挖掘的必然,比之各论坛上主要地以教学质量和经验推测的排名,很难说孰优孰劣,至少有理论上的方法论。当然,如果教学质量不行,单纯的“社会因素”也不足以支撑排名。
最后在技术层面还需要说明的是,既然是通过数据进行挖掘,主要限于样本数量等因素,本篇计算的结果对于个别小学可能产生较大的偏差,甚至出现遗漏(数据缺失),尽管这并不会对整体趋势造成严重影响,但作为一种“榜单”毕竟影响准确性(这次排名里就有几个“名校”因数据缺失未出现)。同时由于初次尝试,将空间范围基本限定在六环以内,所以也会造成一定的数据缺失。随着数据的积累,如果后续持续更新的话相信准确性会越来越高。不管怎么样,结果只代表个人观点和个人水平,模型尚在不断迭代改进中。废话不说,先上结果,按本号惯例,前面部分以展示结果为主,酌情简评,文末简述计算方法。
一、北京各小学评分及排名(前20名)

2001.jpg
【简评】结果跑出来后第一感觉是应该似乎差不多……还算靠谱吧,除了奋斗小学(确实也比较牛)排第一外,个人感觉这前20里还有3个学校比较有意思。排名第3和第6的两个学校,都是大名校在教育“洼地”朝阳区近年新设立的小学,据了解硬件设施超一流,师资也不错,只不过年头太短还没有“出成绩”,所以按照传统经验排名估计是不可能上榜的,但大数据分析也许是想告诉我们它们的潜力,记住这个表,过几年回来看【笑,实际上它们的社会因素发挥了较大作用】。另一个是史家小学,仔细看了下,最终参与计算的与史家小学有关的样本仅为个位数,样本量偏低,可能在计算结果上产生偏误。还有另外个别几个大名校(这里不提名了),没有出现的原因是样本缺失。在本文的最后附上本次计算的300所小学的大排名。
二、北京部分区各小学评分及排名
(1)海淀区

2002.jpg
【简评】海淀没啥说的,牛啊。听说娃特别累,得仔细斟酌一下。
(2)西城区

2003.jpg
【简评】不仅牛,而且硬,不是学区房那么简单,符号感很强。
(3)东城区

2004.jpg
【简评】看着这些胡同名字,北京大爷的形象跃然眼前,不硬不行啊。
(4)朝阳区

2005.jpg
【简评】看未来吧。
(5)丰台区

2006.jpg
(6)石景山区

2007.jpg
(7)通州区

2008.jpg
【简评】成为北京城市副中心后,相信会极大提高教育质量,更会因为以政府带头的人口流入、以规划定位的高端格局而给区内小学带来更大的“社会”价值。
(8)昌平区

2009.jpg
三、关于评分计算方法的简要说明
(1)计算方法
  • 主要采用的模型是Hedonic特征价格模型。
  • 用到的数据包括2016年以来北京二手房市场挂牌数据(链家抓取)、北京(六环内)城市公共设施及商业服务空间可达性数据(基于GIS地理信息数据自己计算)、北京各小学学区划分数据(链家、搜房及若干论坛最新信息综合)。
  • 各小学被处理为哑元变量,其参数为自然常数指函数,采用对数线性回归模型进行参数学习,参数学习的标准化结果即评分值。

(2)主要难点
Hedonic模型处理这种大截面数据具有很强的理论优势,但在实际操作中受变量选择和样本选择的影响较大。为了更为精确地估计参数值,需要在模型中很好地控制其它重要城市设施的影响。为此,计算了北京城市尺度的几乎包含各类城市设施的空间可达性数据库,精度为500米X500米,可较好控制任意位置上的区位特征。也算是城市空间分析的“利器”了。以下贴几个北京城市设施空间可达性数据的图样。
  • 地铁大型医院加权空间可达性数据热力图示意:


2010.jpg

2011.jpg
严谨如数字,
热情如醇酒,
都是热爱生活的方式。
感谢珍珠连着睡了3个多小时,给老郭时间算数写字。
记于珍珠第20天。
醒了,拍嗝。
附:北京市300所小学排名表

1.png
1.png
2.png
3.png
4.png
5.png
6.png
7.png
8.png
9.png
10.png
11.png
12.png
13.png





您需要登录后才可以回帖 登录 | 注册

本版积分规则

管理员QQ1192595503|小黑屋|手机版|Archiver|山后网 ( 京ICP备12001442号  

GMT+8, 2024-3-29 01:56 , Processed in 0.223000 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表