一线城市房地产价格的统计预测

一线城市房地产价格的统计预测

摘 要
房地产行业为我国国民经济健康发展提供了重要的物质保障。然而随着我国社会经济的不断发展,各大城市的房价不断升高,尤其在经济发达、人口聚集的一线城市。即使国家出台了一系列政策以抑制房地产价格泡沫的产生,但房价仍然呈现走高趋势。针对这种情况,进行一线城市的房地产价格分析与预测是非常有必要的。
本文以北京、上海、广州、深圳四个一线城市的房地产价格为研究对象。收集了多年来房价的相关数据,并进行了分析。本文首先对四个一线城市的房地产价格的影响因素做了定性分析,并做了描述性统计。其次,由于影响房价的多个因素之间存在多重共线性,所以利用主成分分析法,建立主成分回归方程,找出影响每个城市房价的主要因素。结果显示影响北京、深圳房价的主要因素为人均可支配收入,影响上海、广州的主要因素分别为政策和房地产开发投资额。最后,利用2013年1月到2017年12月四个城市的月度数据,建立ARIMA模型、因变量关于时间的回归模型、两参数指数平滑模型进行预测,并预留2018年1月到5月的数据,对模型进行检验,选择最佳模型。结果显示,回归模型和指数平滑模型的预测效果好于ARIMA模型。

关键词:一线城市房地产价格,主成分分析法,ARIMA模型,因变量关于时间的回归模型,两参数指数平滑模型

1 绪论

1.1 选题背景与研究意义

1.1.1 选题背景

房地行业作为支撑国家经济运行的支柱性产业之一,其发展不仅影响着自身的平稳与健康,还会对钢铁业、水泥业等相关原材料供应行业,电力、水利等能源供给行业产生牵一发而动全身的紧密影响。自从改革开放以来,房地产行业随其他相关行业繁荣发展,为我国人民生活水平的提高提供了基础。据相关数据显示,房地产每投资1000亿元就可以带动GDP增长2%。目前,我国房地产行业整体投资规模不断扩大,施工面积每年的递增速度达到25%。
但是房地产行业的区域发展却极度不平衡。由于一线城市经济发展水平较高,房地产行业起步较早,所以发展相比而言更为完善。近几年来,尽管中西部地区的房地产行业也有了很大的发展,但是仍与一线城市之间存在很大的差距。从总体上来看,一线城市由于经济发达,居民可支配收入较高,使得房地产行业表现的异常活跃,其中四个一线城市的房地产价格更是达到了城市居民人均可支配收入的50余倍,是其他地区一般地级市的10倍,20倍,甚至更多,房价涨幅明显呈现两极分化的趋势[1]。相比之下,中西部地区发展基础显得十分薄弱,居民可支配收入较低,但受到地广人稀的特点,居住地反而更加宽松。
本文选取北京、上海、广州、深圳为主要研究对象(根据《第一财经周刊》一线城市除北上广深外还包括成都、杭州、天津等15个城市)。其中,北京为我国首都,是我国经济与政治文化中心;上海是我国首批沿海开放城市,经济发展快且起步早;广州是一带一路的枢纽城市;深圳是我国对外开放特区,已经发展为有一定影响力的国际化都市。北京、上海、广州、深圳这4个一线城市由于人口大量聚集,房地产价格上涨快,已经成为引领我国房地产价格上涨的风向标。深入研究影响一线城市房地产价格变动的影响因素,预测出未来房价走势,并提出相关建议,对其他城市的房价变动也可起到正确的引导和指示作用。

1.1.2 研究意义

1.理论意义
任何行业的发展都会随着经济的发展和时代的进步趋于成熟化,对于复杂的房地产行业更是如此。基于目前房地产行业价格涨幅过高,政策不完善等基本情况,对房地产价格的预测势在必行。目前,大多数学者对房地产价格的分析大多是定性分析,而定量分析却较少。本文从北上广深四个城市入手,利用主成分回归的方法,从需求、供给、宏观及政策方面,深入分析了影响房价的主要因素,对一线城市房地产价格进行定性分析。同时,利用四个城市的月度数据,建立适合的模型,对今后的房价进行定量分析,深入科学的预测房地产价格走向,促使一线城市房地产开发走向良性稳定发展。
2.现实意义
对于大量财富聚集的一线城市,由于房地产行业发展历史较久,价格涨幅较大,因此制定合理的政策尤为重要。合理的进行价格预测,有利于相关部门制定科学的决策,把握市场动态,对于开发商而言,有助于在竞争激烈的市场中处于有利地位,对于消费者而言,有利于对房价做出合理的判断,进行理性消费。从而推动我国房地产市场的长远健康发展,为当前来之不易的经济结构转型升级减小阻力。

1.2 本文研究思路及方法

1.2.1 研究思路

本文以北上广深四个一线城市的房地产价格为研究对象,收集相关数据,对一线城市房地产价格进行预测并找出主要影响因素,本文主要研究思路为:
(1)利用Excel对四个一线城市的房价及主要影响因素进行描述性统计,观察增长幅度及其变化率,对一线城市房地产价格有一个初步认识。
(2)收集四个一线城市商品房平均售价、常住人口、人均可支配收入、房地产开发投资额、房屋竣工面积、地区生产总值从1998年到2017年数据,并将政策因素考虑在内,用SPSS软件,利用主成分回归的方法,建立回归方程,找出影响房价的最重要的影响因素。
(3)收集四个一线城市2013年1月到2018年5月房地产价格的月度数据,利用SAS 9.4,分别建立ARIMA模型,因变量关于时间的回归模型、两参数指数平滑预测模型,预留2018年1月到5月的数据,利用2013年1月到2017年12月的数据进行建模与预测,根据2018年1月到5月的实际房价计算出各个模型的相对误差,比较出模型的优劣。并以四个一线城市的GDP为权重,计算出四个城市的平均房地产价格,并进行预测。

3.1 变量的选取

选取影响房地产价格的8个因素,常住人口(万人)、人均可支配收入(元)、房屋销售面积(万平方米)、房地产开发投资额(亿元)、房屋竣工面积(万平方米)、地区生产总值(亿元)、政策。
由于深圳的房价收入比最高,已经远远超过北京、上海、广州,故选取深圳为主要主成分回归研究对象。
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测

3.3 实证分析

根据3.2中选取的解释变量与被解释变量的数据,对影响深圳市房地产价格的各个因素先进行相关分析,再进行主成分分析,为消除量纲影响,将x1-x6标准化。

3.3.1 相关分析

利用SPSS软件,计算出y分别与x1到x6的相关系数,结果如表3.3所示,由表3.3可以看出,多数变量之间存在高度相关,变量之间多数相关系数的绝对值大多在0.5以上。为了避免用多元线性回归丢失变量,且保留更多的信息,下面使用主成分分析。
一线城市房地产价格的统计预测

3.3.2 主成分分析

(1)检验数据是否适合主成分回归。
结果如表3.4所示,p<0.05,所以可以做主成分回归。
一线城市房地产价格的统计预测
(2)提取主成分
表3.5给出了累计贡献率的值,一般情况下累计贡献率大于85%即可。由表3.5结果所示,前三个主成分累计贡献率达到92.265%,因此选取主成分个数为3个。通过图3.1碎石图也可以得出此结论。
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
如表3.6所示,可以看出x1,x2,x4,x5,x6,即常住人口、人均可支配收入、房地产开发投资额、房屋竣工面积、地区生产总值在第一主成分中有较大载荷;x7在第二主成分中有较大载荷,x3在第三主成分中有较大载荷。
一线城市房地产价格的统计预测
表3.7给出了因子得分。通过表3.7可以看出,2008、2011、2012、2013、2016、2017这六年深圳市的房地产价格主要是由第一主成分常住人口、人均可支配收入、房地产开发投资额、房屋竣工面积、地区生产总值)影响的;1998、1999、2000、2001、2002、2007、2009、2010、2014这九年的房价主要是由第二主成分(政策)影响的;2003、2004、2005、2006、2015这五年深圳市的房价主要是由第三主成分(房屋销售面积)影响的。
一线城市房地产价格的统计预测
(3)因变量与主成分的回归
用y对前三个主成分做普通最小二乘回归,见表3.8拟合优度检验可知R的平方=0.954,说明模型拟合很好。由表3.9可知,p<0.05,说明回归方程显著。由表3.10可知第二个主成分(F2)的p值为0.367>0.05,故将其剔除。
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
将F2剔除后,再进行回归分析,回归分析的结果表明模型拟合优度很好,且回归方程显著。由表3.11,回归参数显著。
一线城市房地产价格的统计预测
由于此部分分析的是影响因素的重要程度,故不考虑常数项,只写出标准系数,所以,得到的回归方程为
一线城市房地产价格的统计预测
(4)主成分与七个自变量的回归
将F1与七个自变量做回归,得到结果如表3.12所示,可得:
一线城市房地产价格的统计预测
将F3与七个自变量做回归,得到结果如表3.13所示:
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
可得
一线城市房地产价格的统计预测
(5)主成分回归方程
还原后的主成分回归方程为:
一线城市房地产价格的统计预测
主成分回归方程七个自变量的系数与相关系数正负号相同。其中x5房屋竣工面积)为供给因素,当供给增加时,造成供大于求,所以带动房价下降。x7为政策因素,国家颁布相关政策主要是为了抑制房价,所以政策与房价反方向变动。从主成分回归方程中还可以看出,七个自变量中,对房价影响最大的因素为x2(人均可支配收入),当人均可支配收入增加一个单位,房价上涨0.244倍。

4.2 实证分析

上海是我国直辖市,首批沿海开放城市。上海由于独特的地理优势,是重要的经济中心,吸引了大批外来人才,根据统计年鉴显示,上海市的常住人口高达2418.33万人,已经超过北京的2170.7万人。因此上海的房地产价格一直以来是人们关注的问题。本章以上海市的房价为主要研究对象,收集2013年1月到2018年5月房价的月度数据,采用2013年1月到2017年12月的数据,预留了2018年1月到5月的数据用来检验模型的精度。北京、广州、深圳与上海方法相似。

4.2.1 以上海为例的房地产价格预测

(1)平稳性检验
在进行模型预测时,我们需要首先检验是否为平稳的时间序列,画出时序图,如图4.1所示,根据下图可以发现上海市的房价的时间序列图不是围绕着一条水平直线上下波动,具有趋势性,所以该序列不平稳:
一线城市房地产价格的统计预测
(2)ARIMA(1,3,2)模型
根据图4.1可以发现序列不平稳,所以将序列进行三阶差分,差分后发现序列平稳,且通过了白噪声检验(延迟6阶和12阶的p值都小于0.05)。差分后的时序图初步判定平稳、自相关图一阶截尾、偏自相关图拖尾,可以判定序列平稳。白噪声检验如图4.2所示,自相关图和偏自相关图如图4.3所示:
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
进行minic最优定阶,白噪声通过检验(p值均小于0.05)如图4.4所示,定阶结果如图4.5所示:
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
minic最优定阶结果显示,BIC(1,2)最小,为14.29408,接着进行p=1,q=2的参数估计。参数估计结果如图4.6所示,p值均小于0.05,参数通过检验。如图4.7所示,AIC=966.402,SBC=972.5312。如图4.8所示,残差自相关通过检验(p值均大于005)。图4.9所示为拟合模型具体形式,最终拟合模型为ARIMA(1,3,2)。将模型进行5期预测,预测结果如图4.10所示,拟合效果图如图4.11所示:
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
所以,上海市2018年1月到5月的房价预测值分别为49467.3165元/平方米、48720.9446元/平方米、47918.7202元/平方米、47113.9632元/平方米、46326.8603元/平方米。模型的预测误差在后面给出。
(3)因变量关于时间的回归模型
首先以变量t作为自变量,变量x作为因变量建立线性模型,进行自回归分析,x关于t的线性回归模型的最小二乘估计输出结果如图4.12所示:
DW统计量的值等于0.0884,输出概率显示残差序列显著正相关,所以考虑对残差序列拟合自相关模型。
一线城市房地产价格的统计预测
残差序列拟合自相关模型的自回归分析结果如图4.13所示:
一线城市房地产价格的统计预测
逐步回归报告显示除了延迟1阶和2阶的序列值显著自相关外,延迟其他阶数的序列值均不具有显著的自相关性,因此延迟3-5阶的自相关项被剔除。这意味着输出的自回归模型结果为:一线城市房地产价格的统计预测
图4.14给出了最终拟合模型的最大似然估计结果,图4.15给出了参数估计结果,结果显示各参数均显著(p值均小于0.05)。
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
得到最终拟合模型为
一线城市房地产价格的统计预测
得到的预测值如图4.16所示,图4.16中,第一列数字为预测值,第二列数字为线性趋势拟合值。拟合效果图如图4.17所示:
一线城市房地产价格的统计预测
从拟合效果图可以看出,此模型拟合度较好。根据图4.16,我们可以得出上海市2018年1月到5月的房价分别为(保留四位小数):50432.5954元/平方米、50994.3067元/平方米、51558.3225元/平方米、52180.2714元/平方米、52781.9009元/平方米。
(4)Holt两参数指数平滑模型
当序列中带有趋势时,可以使用两参数指数平滑模型。从图4.1画出的时序图可知,该序列有明显的趋势,所以使用两参数的指数平滑。根据MSE(均方误差)最小,且R的平方较大的原则,分别选取α=0.9,β=0.3的权重。预测结果如图4.18所示,拟合结果如图4.19所示,由图可以看出,R的平方=0.989,拟合效果很好。序列拟合预测图如图4.20所示:
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
一线城市房地产价格的统计预测
根据序列拟合预测图可以看出,在预测上海市房价时,前期拟合度很高,但是在预测时,随着预测的推移,置信区间也在一直增大。根据图4.18可知,该模型预测出的2018年1月到5月上海市的房价(保留四位小数,且单位为元/平方米)分别为:49658.4794、49340.3882、49022.2970、48704.2058、48386.1146。
(5)模型的比较
现将ARIMA(1,3,2)模型,因变量关于时间的回归模型、指数平滑模型的预测值汇总,并根据实际值与预测值的平均相对误差绝对值最小,判断哪个模型较好,如表4.2所示。由表可知,上海房地产价格预测的模型中,因变量关于时间的回归模型最好(平均相对误差绝对值为2.28%),指数平滑模型次之,ARIMA模型最差。但在这些模型中,均没有把影响房价的因素考虑在内,这是模型的一大缺点。
一线城市房地产价格的统计预测

4.2.2 北京、广州、深圳房地产价格预测

北京、广州、深圳这三个一线城市的房地产价格预测同上海一样都是采用月度数据,建模方法也相同,所以这里不再详细给出每一步的过程,而是将最后模型汇总,比较模型的优劣。
(1)北京
北京市的模型比较如表4.3所示,可以看出1月到4月的房地产价格的实际值是递减的,而模型中的预测值却逐月递增,随着预测时间的延长,相对误差的绝对值增大。但是三个模型相比较而言,因变量关于时间的回归模型预测模型最好,其次是指数平滑模型,和ARIMA模型。
一线城市房地产价格的统计预测
(2)广州
广州市的模型比较如表4.4所示,观察三个模型的预测值,都是随时间的延长而预测值减小的,但是对于实际观察值而言,却并非如此。比较三个模型,可以发现因变量关于时间的回归模型最好,指数平滑最差。广州虽然是一线城市,但是相对于其他三个而言,房价却显得更加“温和”。
一线城市房地产价格的统计预测
(3)深圳
深圳市的模型比较如表4.5所示:
一线城市房地产价格的统计预测
观察深圳市的两个模型,可以发现指数平滑模型平均相对误差绝对值最小(1.91%)。根据预测,深圳市的房价将在6月份再次突破5万元一平米。

4.2.3 一线城市均价预测

以四个一线城市的GDP为权重,计算出四个城市2013年1月到2017年12月总的平均房地产价格,并进行预测,北京、上海、广州、深圳四个城市权重分别为0.28、0.3、0.21、0.21。表4.6为一线城市房价的均价预测模型比较。根据前面的房价可知,广州的房价现在不到3万元每平米,而其他三个城市却甚至突破了5万元每平米,进而根据GDP进行计算,一线城市2018年1月到5月的房价为4万多元每平米。计算出来的数字看做一线城市房价的均价,则根据表5.6可知,指数平滑模型预测效果最好,平均相对误差绝对值为1.13%。
一线城市房地产价格的统计预测

5 结论、展望与建议

5.1 结论与展望

本文以房地产价格基本理论为基础,结合一线城市房地产发展现状,分析了影响四个城市房价的主要影响因素,在此基础上,对四个城市以及一线城市总的房价建立模型预测,并进行模型比较,研究结果如下:
(1)对影响一线城市房价的影响因素进行了定性分析和定量分析。影响房地产价格的主要因素包括:常住人口(万人)、人均可支配收入(元)、房屋销售面积(万平方米)、房地产开发投资额(亿元)、房屋竣工面积(万平方米)、地区生产总值(亿元)、政策等。其中GDP、常住人口、房地产开发投资额三个因素在一线城市呈增长趋势。
(2)从1998-2017年的房价年度数据中发现,四个一线城市的房价逐年升高。且房价收入比深圳最高,超过了合理区间,其次为上海。
(3)对四个一线城市的影响因素进行主成分分析,建立主成分回归方程。分析发现,影响北京和深圳房价的主要因素为人均可支配收入,影响上海主要的因素为政策,广州为房地产开发投资额。
(4)在预测方面,本文构建了ARIMA模型、因变量关于时间的回归模型、两参数指数平滑预测模型。根据平均相对误差绝对值,我们可以发现北京和上海的回归模型预测最好,深圳和一线城市平均房价预测中,指数平滑模型预测最好。且上海和广州的房价最近几个月会递减。
但是由于研究时间和作者水平限制,本文研究还有待深化。
(1)影响房价的因素错综复杂,本文选取的因素只是作者认为的强影响因素,
未必包括所有的影响因素。
(2)在对房价的预测中,本文选取了月度数据,虽然数据较多,建立模型并进行了比较,但是由于各个影响因素没有月度数据,没有将影响房价的因素考虑在内,结果缺乏一定的说服力。

5.2 建议

针对一线城市房价收入比过高,房价高涨的情况,对此提出以下建议:
(1)房地产市场是一个有灰度的市场,可能实际价格与上报价格之间存在误差,且由于此行业信息的不完全性,导致各地的房地产价格不能及时准确的传达到上级*,因此,为*的宏观调控带来了很大的难度。所以,建立双向调节的自反馈机构是非常有必要的。
(2)加强房价管理机制,严格审核房屋的成本费用,制定和完善房屋明码标价的有关管理办法。在确定房价时,首先必须考虑居民的承受能力,由供求关系确定均衡价格,使价格遵循市场经济规律。
(3)解决一线城市的高房价问题,应以发展城市群为基础,合理提高住宅用地比例和容积率,带动周边城市群协同发展,增加供给,疏解需求。购租结合,支持支付宝线上租房平台等租赁新模式。