爬取的天津二手房数据分析
首先是数据整理,先把带有汉字的数据字符串进行清洗,并转化为数据格式(float),这里主要采用了str.split、.apply、.find函数。
整理后的数据如图:
其次是数据分析,这里使用了BDP:
可以看出天津河东区二手房的大致情况。
可以看出对2室1厅的关注度最高,200万以内、150平米以内的房源关注度较高,大致可以判断,购房人群对价格还是比较敏感,而且大多为刚需人群。河东区新房、次新房单价高于其它房源,学区房高于其它房源如嘉华新苑。
最后再来看一下河东区的房屋卖点:
由于禁用字的限制,交通便利,采光视野等也就成了卖点。还有由于天津老校区众多,户型设计普遍不是很好,因此为数不多的好点的户型也就成为了卖点。