在评估一座城市的内部空间时,新一酱一直有一个困惑:要怎样才能知道哪些小区可能会住着更追求生活品质的人?
简单的小区房价数据并不能帮上这个忙。从微观空间来讲,房价的决定因素中,房子的位置几乎是起到了决定性的影响力,而房子外部的因素——比如学区——带来的偶然影响也往往高于房子内部的居住品质本身。
看下面的上海小区房价等高线图就可以很轻易地发现,小区相对市中心距离的因素直接影响到了城市内的房价数据产生了明确的圈层效果。
有朋友告诉新一酱一个经验,物业费的高低是衡量小区品质非常直观的一个参考数据:在上海,别墅的物业费通常在4元/平方米/月以上,顶级豪宅的物业费单价能高于10元,而“老破小”的这个数字一般会低于1元。
在上面的等高线图中,新一酱也尝试做了一份物业费的等高线图,但几个远郊别墅区出现的明显高值聚集区又让我们产生了犹豫——物业费的确对最高端的一批小区有比较明确的识别力,但对市中心更复杂的居住环境来说,它很难在狭小的区间段内作为单一指标来识别出那些诸如“适合城市的中产阶层家庭”居住的,具备一定品质的小区。
经历了两个重要数据直接关联识别失败后,新一酱认真地静了一静。我们总是期待能有一些与现实经历具备严格相关性的“超级指标”能够直接映射出某个结论。但实际上,城市的运转总是无数事物交织在一起互相作用的。
就好像走在街道上路过一个小区的时候,你的大脑经过对它的楼高、外立面新旧、绿化效果或者隔着围栏看到的遛狗的大爷,通常都能够处理出来一个结果:这个小区的房价是该比周边房子更贵还是更便宜,或者简单点,“不考虑买不买得起,我是否会愿意住在这样的一个小区里”。
因此新一酱认为,要想分析出一座城市里哪些居住空间更有品质,更合适的办法是模拟类似这样的一套主观感知与决策的过程,将更多人脑认为能够纳入小区是否更适合居住的因子都放入一个大池子里。
运气很好的是,最近几年链家开始大规模要求门店中介对辖区内的所有小区进行详细的数据录入,不仅记录小区的建筑年代、楼栋数与户数、物业费、车位配置等基本的数据,还包括对小区的景观与设施配置、业主及租客特征、安保与保洁,以及其他优缺点特征都作了详细的文字记录。(感恩)
这些数据与文本信息,正好是新一酱希望在分析池中用到的。于是以上海为案例,新一酱在链家上抓取了约1.7万个小区的所有详情数据。对所有数据进行清洗及标准化之后,新一酱最终从1.7万个小区的总量中筛选出了8169个数据全面的小区作为分析样本。
在《这些年,上海是如何一点一点变大的》中,新一酱曾经对上海所有小区的建成年代展开分析,而如果叠加它们的外立面描述——它通常也是我们见到小区的第一印象,你会看到类似上面词云图表展现的结果:间隔40年,上海的小区外立面在风格、色彩和材质上已经有了明显的多次迭代。当然,建设时间更早的小区得到最大的评价是“老”,这也意味着它们的居住空间品质会在观感层面被直接减分。
小区内的配套设施也是这种直觉印象的组成部分。健身器械已经成为了上海小区内部的标配,但如果小区可以拥有更为小众的公共空间——除了分类更细的运动设施,新一酱在数据中发现了烧烤区域、红酒室、雪茄室这样的配置,小区的品质感会一下子得到很高的加分。
当然外部设施通常只是第一印象,人们最终将最多的时间花在自己的房子内部。
2017年,上海市城镇居民的人均住房面积是36.7平方米,这低于很多级别更低的城市。住在更宽敞的房子里,是很多人换房子的主要诉求,而住在更有品质的房子里,通常是在满足“更大的房子”前提之后才会考虑的问题。基于这个判断,新一酱认为,如果一个小区的主力户型面积更大,则它会更倾向于提供更高品质的居住空间。
要识别一个小区的主力户型,新一酱首先对每个小区内的户型面积数据展开第一轮分析,排除过高的异常值后,取小区内所有户型面积值的频数最高区间中间值作为小区的代表户型面积。如果有并列的频数最高区间,则取它们中间值的平均值。
综合上海所有小区的代表户型面积数据,你能在上图中看到从市中心向外,小区的代表户型越来越大,并在闵行、松江方向形成了“大户型聚集分布区域”,这里也确实是上海近郊主要的一大片别墅区。而在上海的北部,户型则没有进一步扩大的趋势。
当然户型相关的数据也不仅仅只是面积。户型朝向及内部规划的有效性都会影响到人们在内部的居住品质。人们对这一点的重视尤其出现在大约2000年之后开发的楼盘上,对那些由品牌开发商操盘的楼盘来说,户型的略微差异都会显著影响销售价格,乃至品牌声誉。