回龙观和三里屯 谁才是"北京"

第一财经日报
摘要:城市功能布局割裂,一些行政上属于北京的地区,并没有传说中“北京城”的精神生活。
转眼间,春节来了。DT君这两天明显感觉到往日熙熙攘攘的帝都,突然间冷清了许多,而不久前的元旦假期,出门还到处人满为患,西单、三里屯和朝阳公园这样的传统休闲娱乐街区,拥堵更是变本加厉。这个问题归根结底,还是回到北京城市功能布局的割裂与分离。数据侠鸡丝小分队的队员们,通过分析出租车数据和城市信息点(POI)的数据,为大家还原一个真实的“折叠北京”。

哪怕码表跳一轮,也要开进三里屯
去年获得雨果奖的科幻小说《北京折叠》,讲述了一个生活在北京不同阶层市民高度割裂的科幻故事,让许多读者产生了共鸣。
现实生活中,与《北京折叠》相似的是,对于身处帝都不同地理空间的居民,对城市服务功能区的可达性大相径庭。
也就是说,对于一个西二旗的码农来说,如果他想追一个住在东三环的女神,经常陪她去三里屯共进晚餐,几乎是不可能完成的任务。
考虑到在帝都买车经济和政策上的不可能性,以及冬季干燥寒冷的雾霾天气,坐出租车出行常常是帝都人民逢年过节的最佳选择。
我们以北京出租车的载客数据为研究对象,对比了平常日和节假日时帝都人民打的士出行的情况。发现节假日出租车载客量显著增加,同时发现,以三里屯为代表的东三环不愧为京城“最热”休闲区。
下图展现了平常日和平安夜的北京市出租车载客次数,在平安夜,帝都出租车的载客量整体明显偏高,看来我们还是喜欢在节假日出去玩儿。

(图片说明:平常日和平安夜期间北京出租车载客次数对比)
接下来,我们用出租车的OD数据(DT君注:OD也就是交通起止点,起点Origin和终点Destination的简称)还原了平安夜那天京城川流不息的出租车行驶轨迹。

(图片说明:12月24日下午4点至12月25日凌晨4点,五环内出租车OD数量分时统计)
从下午4点开始,全城的出租车数量开始进入活跃状态。此时晚上需要赴约的应该已经开始筹划着下一步的动作,动作快的已经打上车了。这些有先见之明的人,在中关村、三元桥、望京、西直门、国贸等地显著集中。
晚上7点,吃完饭的大家纷纷从西单、三里屯、蓝色港湾、王府井出发,踏上约会的第二轮征途。
没能成功提前下班的各位,继续从中关村、三元桥、望京甚至更远的地方涌入城内,让晚高峰的汹涌衬托对平安夜浪漫的渴望。
城东一路飘红,集中了全城最大数量的出租车出发和到达数量。
夜里9点,时全城出租车载客量达到最高峰,还有3个小时就到零点了,这个时候体力差的已经熬不住了;体力好的到了去三里屯、五道口继续夜生活的时候。
无论什么时刻,东三环作为的热门出发地和目的地的地位始终无法撼动。
跨越人山人海也要挤进东三环的秘密
看过了平安夜一晚上充满欲望和等待的征途,我们不禁会问,北京的人们为什么一定要去东三环、去三里屯呢?
一个可能的原因是,三里屯的饮食丰富度最高,毕竟各种娱乐活动都离不开“吃”这一核心命题。我们拿出了POI数据,来看一看北京市各类功能的空间格局。从图中可以看出,朝阳区的餐饮热度明显更加明亮。

(图片说明:北京市六环内餐饮类POI分布热度图)
但是,东三环地区服务功能密度大,不仅餐饮娱乐类POI数量众多,其他类型POI的数量也远远高于其他地区。
因此,虽然上图东三环地区的餐饮类POI密度很高,单纯的以餐饮类POI绝对数量来断定东三环地区是餐饮服务的中心显然缺乏说服力。
因为在传统的POI研究中,我们常用核密度作为POI热度分析的方法。但在这种方法中,不同类型的POI在地图网站中收录的机会和概率是完全不同的。
例如,一个小区的规模很大,但其对应的POI可能只有寥寥几个。如果其周边存在着大量的餐馆和超市POI,传统方法中该地区会被错误的归类为商业功能主导。
为了解决这个棘手的问题,小分队采用了TF-IDF文本分析的方法对北京市的各类 POI 数量重新进行了分析、确定权重。通过TF-IDF加权我们对所有类型的POI又进行了一遍统计,得到北京1.5万个功能地块各类型POI的总权重。最终得到餐饮类POI权重分布。

(图片说明:去掉了极小值之后的餐饮娱乐POI加权分布)
(图片说明:去掉了极小值之后的餐饮娱乐POI加权分布)
看到了吗?那一片飘红的东三环!
也就是说,即使去除了数量因素,东三环餐饮娱乐主导地块依然非常多!而南城则更加黯淡,餐饮娱乐的可达性极低。这也更加科学的证明了,北京市民想要在吃饭上多些花样,东三环无疑是首选中的首选。那么逢年过节时候,堵上加堵对于平日里已经拥挤不堪的东三环来说,也是情理之中的了。
这样看来,的确除了了东三环到东四环、中关村、亚运村几个地区之外,北京大部分地区、尤其是南城的餐饮服务真的没有我们想象中那么丰富。
想吃好些,只能走远些了。
闪闪发光的TF-IDF文本分析法
前文在计算POI权重时,小分队使用了TF-IDF文本分析法。这是自然语言处理、搜索引擎、文本分析中较常用的词语权重分析方法,常用于确认文章主题、关键词筛选、计算关键词权重等工作。
在给你看高能模型公式之前,为了体现鸡丝小分队贴近群众的友爱精神,我们准备用通(gao)俗(shen)易(mo)懂(ce)的方式再详细解释一下这个方法的基本原理。
简单来说,一个词语在文章中出现的频率越高,这个词语的重要程度也就越大,这就是TF(Term Frequency)的功劳。但是读到这里你可能会有这样的疑问,像“我”、“的”这样的词语,每篇文章几乎都会有很多,这权重算出来明显不对啊。
所以才需要第二部分——IDF(Inverse Document Frequency、逆向文件频率)来帮助我们挑出那些真正影响力大的词语。一般来说,如果一个我们计算TF得出的高频词语在某个文章中出现频率很高,但是在其他文章中出现的频率却很低,这样的词语才是我们真正需要的、能够影响文档主题判断的关键词语。
比如在一大堆城市规划大数据论文中,我们发现几乎所有的文章中都大量出现了“POI、指标体系、职住平衡”这样的关键词,而只有一篇文章出现了一个叫“鸡丝小分队”的关键词,那么“鸡丝小分队”这个词必然会成为把这篇文章和其他文章明确的区分开来。用学术一点的方法来描述的话,也就是说这个词的IDF值很高。
——前方高能模型公式,非战斗人员请迅速撤离——

在计算完每个词语的TF和IDF之后,我们把这两个值的乘积作为这个词在文章中的最后权重,这样我们就知道了所有文章中所有词语通过TF-IDF计算加权后的权重。
说到这里你可能还在疑惑这个TF-IDF和我们的POI研究到底有什么关系?
其实是这样的:我们将整个北京市切割成了500米*500米的网格,把每个网格中的POI与网格进行匹配。这样,你就可以把每一个网格看作一篇文章,而网格中所有的POI点的类型就是这篇文章的所有词语。这样一来,我们就可以使用TF-IDF计算不同类型POI的权重啦。(话说全北京小吃快餐POI这么多,权重不低才怪)。
一个真实的折叠北京
为了进一步摸清北京市不同功能的空间差异,平复一下其他地区民众的心情,我们用同样的方法查看了餐饮娱乐和其他五类POI的前15‰主导地块,看一看他们在北京城内的空间分布。就算去东三环改善伙食不方便,去学院路听个讲座总可以吧。

(图片说明:除餐饮外其他POI类别领先的地块)
-
住宅小区类POI——天通苑、回龙观OUT了。
居住功能最为集中的地块居然也集中在北京城的东边,以崇文门内、朝阳北路、青年路、方庄最有代表性。另外西北边的万柳和北边的亚运村也是这样类型地块的典范。在这里,我们并不是说崇文门、青年路这些地方的居住规模要大过天通苑回龙观。而是相比于大规模的传统居住区,这些地方有着更高的居住集中度,而相应的配套设施可能更少。
延伸阅读
卫星城不该变“睡城”
燕郊、通州、回龙观、天通苑,以及更多。
-
科研院所类POI——占领智商高地。
帝都平均智商最高的地方在哪里呢?当然是清华北大、学院路、中关村的地盘。据统计这里65岁以上老年人的本科比例都比其他地区25岁以上的高。

-
商业大厦类POI——愿节假日没有加班狗。
这类POI的集中地不出所料,国贸、中关村、上地,找工作没投过公司在这三个地方的,当真来北京混过?大上地终于进了一次前三名,看吧,虽然你们吃得少,但是你们干的多啊……
-
公司企业类POI——南城的市民们,找回优越感的时刻到了。
这类设施在全市多点开花,既有传统的东三环办公区域,南城也终于有群星闪耀,大亦庄脱颖而出。在你们还风花雪月大快朵颐的时候,这里的高级蓝领们把钱包捂得紧紧的,人家不是穷,人家是有钱没地儿花。
-
宾馆酒店类POI——还是要以办事方便为主。
不看不知道,一看吓一跳。宾馆酒店主导地块全部位于二环以内,包括西直门内和前门地区。聚集的热度则以前门地带最为耀眼。西直门内交通便利,与各部委距离适中,乃商务出行之首选。在南边的前门,不知有多少怀揣梦想的一家老小为了看升旗挤在招待所的地下室,又不知有多少外国友人为了体验胡同风情睡在青旅的上下铺。原来酒店主导的地方都在二环里边。
现在你知道为什么你明明在北京,却又好像离北京那么遥远;现在你理解了,为什么平安夜中,千军万马挤破独木桥,也要冲进西单三里屯,排上两个小时的队,吃一顿不那么平静的平安夜晚餐;同时你也明白了,为什么公司附近的房源那么难找,但凡能够接受的,又都在离公司很远的地方。
延伸阅读
李国平:北京亟待优化功能布局
与面积基本相当的东京都相比,城六区人口密度仍高于东京都的6029人/平方公里,但人均GDP显著低于东京都的6.5万美元。
你远离的不是东三环那些地标建筑,不是正阳门下的熙攘人流,而是丰富多彩的功能,有滋有味的生活。在这个城市,还有许多许多的人,都离精神慰藉之物有点远。
本文著作权归第一财经日报所有,如有侵权请联系新浪新闻客户端。
微博热议——
@新财富杂志:
因距离北京的CBD仅30公里,燕郊近年来承接了大量的北京外溢人口与购房需求。据官方数据统计,截至2014年底,燕郊人口已达65万人;去年以来又添了15万,俨然中等城市体量。在80万的人口体量中,“北漂”一族约占30万。
@童大焕(学者):
大东京是多少人呢,3750万。那么大东京为什么这么多人口呢,它当初1200万人口的时候跟北京市一样,下决心要把人口控制住,于是就修了一条高速铁路,说半个小时就能到大阪,说东京人都到大阪去吧,于是呢大阪人就都到东京来了。北京也修了一条,修到天津,说半个小时就到天津,于是天津人就到北京来了。
@中岛(评论人):
燕郊位于北京市中心区国贸向东30公里,这里居住着6O多万在北京上班人群,被称为著名的睡城。这里有一向东必经的火车站,很漂亮,花国式的,每天有四、五趟列车停靠,在这上车的人每天也近千人。但没有人想到,这却是一个没有厕所的火车站。原来旁边超市唯一1元也没了 。
@yqdsfy93(微博网友):
雾霾加高房价还是没把人逼走,依旧拼尽全力的想留在北京。