爬取的天津二手房数据分析

      首先是数据整理,先把带有汉字的数据字符串进行清洗,并转化为数据格式(float),这里主要采用了str.split、.apply、.find函数。

         整理后的数据如图:

        爬取的天津二手房数据分析

其次是数据分析,这里使用了BDP:

          爬取的天津二手房数据分析

        可以看出天津河东区二手房的大致情况。

爬取的天津二手房数据分析

爬取的天津二手房数据分析

爬取的天津二手房数据分析

爬取的天津二手房数据分析爬取的天津二手房数据分析

爬取的天津二手房数据分析

爬取的天津二手房数据分析

           可以看出对2室1厅的关注度最高,200万以内、150平米以内的房源关注度较高,大致可以判断,购房人群对价格还是比较敏感,而且大多为刚需人群。河东区新房、次新房单价高于其它房源,学区房高于其它房源如嘉华新苑。

            最后再来看一下河东区的房屋卖点:

         爬取的天津二手房数据分析


        由于禁用字的限制,交通便利,采光视野等也就成了卖点。还有由于天津老校区众多,户型设计普遍不是很好,因此为数不多的好点的户型也就成为了卖点。