無錫網路房源租賃市場數據分析報告

前言

無錫,地處長三角平原,是江蘇省內重要的經濟文化名城,「宜居」是許多人給這座城市打上的標籤,為了吸引各地人才來錫發展置業,很早便實行了大學生租房補貼政策,前不久更是取消了購房60平米落戶,實行租賃住宅落戶政策。

本文爬取了X居客100頁租房房源信息(數據信息截至2017-9-13日),涵蓋無錫5個市屬轄區,對無錫網路房源租賃市場進行一個簡要的數據分析和數據建模,紕漏不足之處感謝各位指出,另外謝謝各位的點贊關注支持。

正文

本文使用rvest包爬取相關數據,數據清洗、分析處理、可視化、建模工作主要使用工具為R下的data.table、dplyr、ggplot2、ggthemes、stringr、gridExtra、randomForest等包,加上Excel工具輔助,重點關注內容為房源各項基本情況及租金影響因素,一共分為房源數據信息展示、租金影響因素、隨機森林模型(嘗試性探索)、總結四個部分。

先看看獲取的欄位信息:小區名、租房類型、戶型、房源所在樓層、總樓層、裝修情況、所屬轄區、商圈、租金一共9個房源欄位信息。

第一部分 房源數據信息展示

房源所在區域的分布情況(小區、所屬轄區、商圈)

  • 房源小區分布情況

使用stringr、Excel進行數據清洗、去重等相關工作後,有效房源信息一共2470條,房源覆蓋712個小區,小區數量較多,截取房源數量最多的前30個小區進行觀測:

可以看到

  • 東風家園以36套可租房源排在首位,該小區位於梁溪區與新吳區交界地帶,人流密集,周邊配套設施完善,靠近地鐵二號線,故其房源數量排在首位不無道理
  • 萬科金域緹香樓盤較多,且位於新區哥倫布廣場、歐尚超市附近,附近商圈配套成熟,臨近快速內環高架,交通便利
  • 愛家金河灣臨近高鐵站、汽車站、地鐵一號線,交通條件優越
  • 天鵝湖B區、萬科魅力城二區臨近江南大學地鐵口,為大學生群體租房的熱門小區,且萬科魅力城二區小戶型較多,房齡較長,租房性價比高
  • 寶龍國際公寓位於新吳區中心地帶,生活便利,配套完善

總的來看,在這30個小區中,絕大部分為商品房小區,且主要集中在濱湖區、梁溪區、新吳區,可以推測一下是不是所有的房源都主要集中在這三個轄區?接下來觀測下所有房源的所屬轄區、商圈板塊的分布情況:

  • 五個轄區房源分布情況

  • 房源所在商圈數量分布情況

可以看到,和剛才的推測一致,濱湖區以931套房源數量(佔37%)排在第一位,接下來是梁溪區(723套,佔29%)和新吳區(514套,佔21%),而惠山區以及錫山區的房源數量則明顯少於其它地區。另外,一共37個商圈板塊,其中太湖新城板塊(594套)、長江路板塊(249套)、河埒口板塊(242套)、江溪(108套)、北大街(101套)的房源數量佔據前五,這五個板塊的房源數量佔總房源數量一半以上,其中太湖新城板塊的房源數量的領先幅度還是相當明顯的。

可以分析一下這種分布的一些原因:

  • 濱湖區、梁溪區、新吳區為相對的就業密集區,而惠山、錫山就業崗位相對較少,自然租房要求也會相應減少
  • 濱湖區中不僅有大量的政府舊改項目,還因良好的商業配套、居住環境受到各大龍頭地產商的青睞,因此釋放出大量的租賃房源
  • 濱湖區板塊大,即包含馬山、雪浪、南泉等較為偏遠的區域,也包含了太湖新城、蠡湖新城、河埒口等成熟板塊,且年輕人較多,各式各樣的房源都有覆蓋,轄區內覆蓋地鐵一、二號線,交通優勢明顯
  • 相對而言,太湖新城為濱湖區中最受投資客青睞的商圈板塊,因此大量的投資性住宅會成為租賃房源,教育資源相對其它板塊而言優勢明顯,也將吸引一部分父母家長租客群體前來租賃
  • 位於新吳區的長江路板塊延伸很長,且新吳區擁有大量的外資、製造型企業,外籍員工眾多,擁有大量的租賃需求
  • 河埒口板塊擁有濱湖萬達這一成熟商圈,臨近惠山隧道、快速內環高架、地鐵二號線,交通優勢明顯
  • 北大街為傳統老城區,臨近市中心,老舊小區房源數量眾多
  • 惠山新城位於地鐵一號線北面,且為惠山區行政中心所在地,人口集中,再加上擁有惠山萬達商圈和周邊眾多的小區樓盤,使其可供租賃的房源較多

房源特徵信息分布情況(租房類型、戶型、裝修情況、所在樓層、總樓層)

  • 租房類型分布情況

可以看到,整租的情況(2335套,佔94%)為主要的租房類型。

  • 戶型分布情況

可以看到

  • 在20種戶型中,2室2廳(778套) 、2室1廳(497套)、3室2廳(492套)、1室1廳(485套)為房源的主力戶型,這四種戶型佔比達到91%。
  • 2室2廳,2室1廳這兩種戶型不僅適合的群體廣,而且在眾多戶型中,性價比很高
  • 3室2廳對於家庭租客群體而言,舒適度較高,對於公司、企業群體而言,出於成本及管理角度考慮,3室2廳這一戶型最為合適
  • 裝修類型分布情況

可以看到,精裝修的房源類型(1915套)數量最多,佔比77%

  • 房源所在樓層與總樓層的數量分布

  • 對於房源所在樓層,由圖可以看出主要集中在中低層,3摟為房源數量最多的樓層,其次為12層、15層。
  • 對於總樓層而言,出現了三個明顯的峰值,分別位於6層、18層、32層
  • 無錫擁有大量位置好、配套全的老舊小區,而這些小區總樓層基本在6層左右,對於這些小區,3層為最佳的租房樓層;從住宅建築角度考慮,18層、33層(100米左右)分別為兩個重要的臨界點,超過這一臨界點,意味著不同的建築等級要求

第二部分 租金影響因素

在第二部分,先匯總整體的租金情況,再展示出房源的各種因素對應的租金信息,進而分析挖掘出相關的信息結論,從房源所在區域(小區、所屬轄區、商圈)以及房源自身特徵(租房類型、戶型、裝修情況、所在樓層、總樓層)兩個大的維度進行觀測分析。

  • 整體租金的價格分布情況

整體來看,在2470套房源中,每月租金範圍從138元到30000元不等,平均租金為2181元,中位數為1800元,從上圖中可以看出,租金分布在2000元左右的情況最為多見

房源所在區域對租金的影響(小區、所屬轄區、商圈)

  • 房源數量前30小區租金分布情況

  • 所屬轄區租金分布情況

  • 商圈租金分布情況

可以看到:

  • 長江國際雅園、萬科金域緹香、魅力萬科城二區、太湖國際社區拾壹峰、長江國際花園的租金價格中位數佔據前五位,房源數量最多的東風家園平均租金為1616元,租金方差218元,可謂是房源又多價格又穩定,長江國際雅園的平均租金價格為3804元,是房源數量在前30位中平均租金最高的小區,且租金的分布差異也是最大的,之所以租金差異大,是因為該小區地處長江路沿線,既包含普通的租客需求,又包含很多外資企業的外籍員工、高管的租房需求;甲殼蟲2933小區在這30個小區中平均租金為最低的1323元
  • 作為房源數量最多的濱湖區其平均租金價格為2474元,為五區之首,但其租金價格分布差異也最大,標準差為2360元,這與之前提到的該區域板塊面積大,房源類型多不無關係;新吳區、梁溪區以平均租金價格2092元、2054元位列二三位,而惠山區的平均租金價格只為1662元,和濱湖區差距還是非常顯著的,但其租金標準差為741元,相對濱湖區而言租金分布更為平均
  • 作為濱湖區中最主要的三個商圈板塊,蠡湖新城、太湖新城、河埒口板塊平均租金價格分別排在第1位、第5位和第12位;蠡湖新城板塊由於蠡湖香樟園這一定位高端的小區存在,不僅拉高了平均租金,也使得整個區位租金價格差異性特別大,同理,太湖新城板塊因為混雜了大量的安置房小區和高檔小區,使之的租金價格分布也呈現較大差異,出現不少離群點

房源特徵信息對租金的影響(租房類型、戶型、裝修情況、所在樓層、總樓層)

  • 租房類型租金分布

  • 各戶型租金分布

  • 各裝修情況的租金分布

  • 樓層租金分布情況

可以看到:

  • 無論在哪個轄區,整租情況下的租金價格明顯高於合租情況,符合日常判斷
  • 戶型從某種意義上代表了房屋面積,4室1廳以上的戶型,樣本量較少,除去這一部分,隨著戶型變大,租金價格整體呈現上升趨勢
  • 在各個轄區內,裝修情況越好,對應的租金價格越高,符合日常判斷
  • 房源所在樓層在33摟以上的房源數量很少,除去這一部分,其它樓層的租金分布較為平均
  • 總樓層為2-3層的房源很有可能是別墅房源,所以租金很高

第三部分 隨機森林建立租金模型(嘗試性探索)

這一部分主要通過隨機森林建立相關的租金模型,看看各個因素中哪幾個對租金影響最大,之所以是嘗試性探索,是因為剛進行機器演算法模型的內容學習,在此只是進行練習嘗試,也希望大家提出相關建議。

選入變數為商圈、租房類型、房源房型、裝修情況、所在樓層、總樓層,其中房源所在樓層、總樓層根據區間進行分類,小區名不選入,因為超出了隨機森林最大允許類別,所屬轄區不選入,因為商圈意味著更細化的轄區位置。

在此,僅列出模型輸出的重要性分布:

第四部分 總結

首先,從數據爬取、數據清洗、數據分析、可視化呈現到最後的模型建立,這是我第一份獨立完成且相對完整的數據分析報告,一定存在許多的不足和紕漏,在此,真心希望各路大神能給出你們寶貴的意見和建議。

其次,無錫是一座很棒的城市,它擁有良好的城市規劃、便利的交通、完善成熟的商圈配套,相對於熱鬧的北上廣深,它顯的特別安靜,但是根據相關數據匯總,從10年到16年,這座城市平均每年人口流入僅為2萬人。

我希望它更好,也希望它更包容

最後,祝大家早日買房,告別租房!感謝點贊關注,謝謝!

推薦閱讀:

無錫透平葉片的製造水平如何,如何拿下了羅羅公司高溫部件的訂單?
怎樣看待無錫2016的經濟復甦?
江陰人和無錫人為什麼互相看不順眼?
江蘇有哪些值得一去的人文景觀?
滬寧高速如何避開蘇州到無錫段?

TAG:数据分析 | R编程语言 | 无锡 |