北京市
二手房
价格
影响
因素
研究
杨杰
行业聚焦房地产世界2023/0425北京市二手房价格影响因素研究杨杰邵欣怡彭子君阿斯木古丽艾麦提江房地产经济是我国国民经济中的重要组成部分,其在很大程度上支持着建筑、机械、建材、金融等行业的发展。近年来,房地产市场一直保持着较高的活跃度,房地产业是支撑中国经济增长的重要动力之一。过去几年,北京的房地产市场持续繁荣,二手房交易量也一直保持在较高水平。二手房价格的影响因素可以通过对二手房价格的统计和分析来得到。例如,黄明宇、夏典利用多元线性回归模型分析了合肥市二手房交易数据1,胡夷等人利用半对数模型研究了上海市房地产价格的影响因素。2以上研究结果表明,分析房地产价格影响因素,能够为当地的房地产交易提供较为合理的定价参考。1 数据处理笔者从链家网获取 2021 年 6 月至 2022 年 6 月的北京市二手房交易数据,通过缺失值处理、归类等操作,最终得到有效数据 10 800 条。笔者以单位面积房地产价格为因变量,有无电梯(有、无)、楼层情况(低楼层、中楼层、高楼层)、装修方式(毛坯、简装、精装)、行政区划(东城区、西城区、朝阳区、海淀区、丰台区、石景山区、通州区、昌平区、大兴区)为自变量。北京市二手房交易数据如表 1 所示。由表 1 可知,从电梯分布来看,样本大部分为“有”,共有 5756 个,占比为 66.83%。还有 33.17%的样本为“无”。“中楼层”的占比为 47.10%。在装修方面,“精装”占比最大,为 55.63%,“简装”样本的占比为 42.64%。行政区划中各区域的占比较为均匀,基本在 10%左右。2 模型建立2.1 模型概述多元线性回归模型是一种统计分析方法,用于研究两种或两种以上变量之间的关系。其中,一个变量被称为自变量,另一个变量被称为因变量。应用多元线性回归模型的目的是建立自变量与因变量之间的数学关系式,以便预测因变量的值。多元线性回归模型公式如下:y=b0+b1x1+b2x2+bnxn (1)式(1)中,y是因变量,x1、x2xn是自变量,b0、b1、b2bn是系数。笔者通过观察数据,用最小二乘法等方法估计出这些系数的值,从而得到多元线性回归模型。2.2 回归分析本文将上述数据输入 SPSS 软件进行回归分析。回归分析结果如表 2 所示。由表 2 可知模型 F 检验结果,F值为 1 655.979,对应的P值为 0.000,说明模型的线性关系显著。拟合度R2为0.755,说明因变量的变化中有 75.5%可以由自变量的线性变化来解释;拟合度R2较高,说明模型拟合效果良好。下面,笔者对模型进行共线性检验。共线性检验结果如表 3 所示。由表 3 可知,模型的平均方差膨胀系数小于 10,这说明模型的共线性并不明显。然而,在装修方式中,简装与精装的方差膨胀系数分别为 14.830 和 14.820,均大于10,这说明装修方式的共线性较为明显。因此,笔者对此做了适当调整。笔者将装修方式作为连续性变量来处理共摘要:本文分析了约一万条北京市二手房交易数据,应用 SPSS 软件构建多元回归模型,得出因变量(单位面积房价)和有无电梯、楼层情况、装修方式、行政区划等自变量之间的关系。研究结果显示,两者之间的相关性显著,故此模型可以为北京市二手房的实际交易提供参考。关键词:北京市二手房价格;多元回归模型;单位面积房价;房价预测基金课题:中国矿业大学(北京)大学生创新训练资助项目,中央高校基本科研业务费专项资助(项目编号:202205010)。行业聚焦262023/04REAL ESTATE WORLD表 1北京市二手房交易数据名称选项频数比例/%有无电梯无285733.17有575666.83楼层情况中楼层405747.10低楼层221925.77高楼层233727.13装修方式毛坯1491.73简装367342.64精装479155.63行政区划东城区93410.84西城区87310.14朝阳区118213.72海淀区98311.41丰台区108812.63石景山区8179.95通州区99911.60昌平区8589.96大兴区87910.21表 2回归分析结果变量系数标准误差t值P值95%置信区间显著性面积-71.4147.540-9.4700.000-86.194,-56.634*卧室数2 023.877347.2875.8300.0001 343.111,2 704.643*客厅数2 691.856498.7995.4000.0001 714.091,3 669.621*装修方式简装2 517.6401 408.6191.7900.074-243.590,5 278.871*精装6 786.0401 401.6094.8400.0004 038.549,9 533.53*楼层情况低楼层546.939448.7151.2200.223-332.650,1 426.529高楼层-402.045438.273-0.9200.359-1 261.165,457.074有无电梯有4 812.397422.33911.3900.0003 984.511,5 640.283*行政区划丰台区-5 0412.724751.031-67.1200.000-51 884.925,-48 940.522*大兴区-67 709.321792.543-85.4300.000-69 262.896,-66 155.745*昌平区-63 045.292801.277-78.6800.000-64 615.988,-61 474.596*朝阳区-41199.964739.447-55.7200.000-42649.457,-39750.47*海淀区-11 245.858769.909-14.6100.000-12 755.064,-9 736.653*石景山区-57 780.187809.149-71.4100.000-59 366.313,-56 194.06*西城区16 940.910792.86421.3700.00015 386.706,18 495.115*通州区-67 645.693766.178-88.2900.000-69 147.586,-66 143.8*东城区102 666.971 628.76263.0300.00099 474.204,105 859.73*因变量均值73787.327标准差因变量33 884.394拟合度R20.755观测值数目8613F检验结果1 655.979P值(概率F)0.000赤池信息量192 039.424贝叶斯信息准则192 159.462注:表示p 0.01,表示p 0.05(表中未显示),表示p 0.1。行业聚焦房地产世界2023/0427表 3共线性检验结果变量VIF(方差膨胀系数)1/VIF面积3.0500.328卧室数2.4200.413客厅数1.5700.637简装14.8300.067精装14.8200.067低楼层1.1800.847高楼层1.1600.862有电梯1.2100.826丰台区1.9000.526大兴区1.7600.568昌平区1.7600.568朝阳区1.9800.505海淀区1.8300.546石景山区1.7200.581西城区1.7500.571通州区1.8400.543东城区3.4200.292表 4经调整后的回归分析结果变量系数标准误差t值P值95%置信区间显著性面积-71.0817.534-9.4300-85.850,-56.311*卧室数2 030.524347.2465.85001 349.837,2 711.21*客厅数2 694.756498.8025.40001 716.984,3 672.528*装修方式4 097.853346.85911.81003 417.927,4 777.779*楼层情况低楼层535.722448.6191.1900.232-343.680,1 415.123高楼层-410.718438.217-0.9400.349-1 269.729,448.293有无电梯有4 826.379422.17511.43003 998.815,5 653.943*行政区划丰台区-50 403.197751.001-67.1100-51 875.339,-48 931.055*大兴区-67 725.486792.436-85.4600-69 278.851,-66 172.122*昌平区-63 047.165801.292-78.6800-64 617.889,-61 476.441*朝阳区-41 184.521739.341-55.7000-42 633.807,-39 735.235*海淀区-11 244.662769.923-14.6000-12 753.896,-9 735.428*石景山区-57 794.165809.075-71.4300-59 380.146,-56 208.184*西城区16 937.978792.87621.360015 383.751,18 492.205*通州区-67 623.492765.953-88.2900-69 124.944,-66 122.041*东城区97 056.3711 184.21581.960094 735.025,99 377.717*因变量均值73 787.327标准差因变量33 884.394拟合度R20.755观测值数目8613F检验1 766.218P值(概率F)0.000赤池信息量192 038.767贝叶斯信息准则192 151.743注:表示p 0.01。行业聚焦282023/04REAL ESTATE WORLD表 5经调整后的共线性检验结果变量VIF(方差膨胀系数)1/VIF面积3.0500.328卧室数2.4200.413客厅数1.5700.637装修方式1.0400.962低楼层1.1800.847高楼层1.1600.862有电梯1.2100.826丰台区1.9000.526大兴区1.7600.568昌平区1.7600.568朝阳区1.9800.505海淀区1.8300.546石景山区1.7200.581西城区1.7500.571通州区1.8400.543东城区1.7400.575线性问题。经调整后的回归分析结果如表 4 所示。由表 4 可知,该模型与第一个模型基本一致,并且拟合度R2均为0.755,这说明该模型的效果也极为显著。其中,装修方式变量取值情况为“毛坯=1,简装=2,精装=3”,该结果说明装修程度越好,则房屋均价越高。各变量的方差膨胀系数均小于 5(见表 5),这说明该模型共线性小,拟合良好。笔者还得到如下模型:单位面积房价=-71.081面积+2 030.524 卧室数+2 694.756 客厅数+4 097.853 是否为精装(是,取值为1;否,取值为0。下同)+535.722是否为低层楼-410.718 是否为高楼层+4 826.379 有无电梯(有,取值为 1;无,取值为 0)-50 403.197是 否 位 于 丰 台 区-67 725.486 是 否 位 于 大 兴 区-63 047.165 是否位于昌平区-41 184.521 是否位于朝阳区-11 244.662 是否位于海淀区-57 794.165 是否位于石景山区+16 937.978 是否位于西城区-67 623.492是否位于通州区+97 056.371 是否位于东城区。从该模型可以看出,单位面积房价与总面积成负相关关系,与卧室数、客厅数、装修水平、有无电梯成正相关关系,与楼层高度成负相关关系。此外,核心区域西城区、海淀区的房价较高,稍偏远区域大兴区、通州区的房价较低。由此可以看出,区位也是影响房价的重要因素。2.3 模型预测假如现有朝阳区两室一厅的 90 m2精装修房,处于低楼层,无电梯。由模型得知,此房屋单位面积价格约为60 863.94 元/m2,总价约为 547.78 万元。该模型拟合良好,其可以为相关二手房市场的交易提供价格参考。3 总结本文从