標籤:

尋跡資本嗅覺

尋跡資本嗅覺

從上午九點到下午三點,連吃中午飯都在看猴子的live,到現在還是一知半解,感慨自己吃了沒文化的虧啊,幾十年來Excel的作用對我來說就是做個表格算算加減乘除什麼的,突然要用來做數據分析,感慨功能高大上之餘,更為自己的知識淺薄汗顏,從這一課開始明顯感覺有些力不從心,只能花更多時間來學習了。

本想從CEIC里下載數據來練手,無奈只能瀏覽,不能下載到Mac,所以說,企業不創新,哪怕你做的產業再前衛,也會被後來者趕超。經過比較,決定本關的分析數據從清科篩選,用后羿爬取了該網站收錄的2018年的952條融資數據,爬取數據的過程就不贅述了,簡單的智能模式能滿足目前的分析需求,更深層的操作方法目前還不會,暫時也不想深入研究。

接下來步入正題,一方面完成功課,更多是為了跟隨寫作過程,複習之前所學,根據分析步驟,循序漸進。

一、提出問題

爬取的數據中包含了融資方、行業、融資金額、投資方等信息,據此提出問題,2018年里,最受資本青睞的行業分別有哪些?各大投資機構是否有自己偏好的行業?

二、理解數據

帶著上述問題,把整個數據瀏覽了一遍,理解了每項數據的含義(要是這都不理解的話我也就沒飯吃了??),直接進入下一步。

三、數據清洗

(已標明圖片出處,不屬於侵犯版權和肖像權哈!)

弱弱坦白一下,這種空白格,是無法填充的,因為不知道具體是哪些機構投的,所以在篩選出來後直接隱藏了相關行。

先篩選,選中空白,出現了146條相關數據。

選中146條數據後,右鍵隱藏。反覆試過幾次後發現,只要取消篩選,隱藏的行還是會出現在數據集里,沒辦法,先刪了吧。

此時距上一段內容已經過了兩天了,數據清洗,想說愛你不容易。

在高手眼裡很簡單,對0基礎的我來說著實花了不少功夫,接下來的工作就是怎樣把這些不規律的內容轉換成數字了,單位萬元。首先查閱了行業資料,非公開的投資額基本在2000萬左右,就進行了相關替換,整理了相關數字後,現在剩下一個難題,比如"1.2億"怎樣轉換成以萬元為單位的數字呢?

百度了很多種方法,有的靈有的不靈,最後覺得最簡單的方法是把億替換成E+04,這樣就成了科學記數法,在設置單元格格式,搞定。

數據清洗後,表格變得清爽,一目了然。

接下來,開始構建模型,學習使用數據透視表。

首先分析融資項目行業分布情況,根據數據透視表顯示,2018年里,電商等互聯網行業融資項目較多,且整個服務業融資佔比高達66%,製造業融資佔比下降,跟經濟大環境下滑有明顯關係。融資數量排在最後的是化工、農藥及農業生產。此項分析表明生活服務業及生產性服務業將持續上漲。

其次分析行業融資金額情況。排在前三位的金融服務領域融資占整個融資金額約35%,表明科技金融的概念還在繼續火爆,同時提出疑問,互聯網金融今年爆倉嚴重,為何還有大量資本進入,返回數據集查看發現,螞蟻金服和京東金融兩個獨角獸融資金額帶動了數據上升,而不是傳統的P2P,恰好今年京東金融的底層技術在向區塊鏈轉型,看來受到了投資方認可。

最後分析不同投資方的投資數量分布。(此處略去不公開的投資方,因為有些項目處於保密期不便公開)分析顯示,深創投、經緯創投、達晨創投、紅杉資本等知名大機構投資項目較多,部分國有資本投資數量明顯下降(名字就不說了,怕喝茶)。印證了資本市場的現狀:資本市場頭部效應越來越明顯,大資本方越來越有錢,小投資機構從募資能力到項目爭奪能力都將下降。

總之,服務業佔比越來越大,小型投資機構生存空間越來越小,而政策一再呼籲的脫虛向實,期待實體經濟能有更好表現,完成自己的艱辛升級之路,借力資本的翅膀,實現騰飛。


免責聲明:以上為本人學習數據分析的課後演練案例,數據及圖片皆標明了出處,且分析結果不具任何參考價值。


推薦閱讀:

乾貨|海外上市:如何選擇適合自己的資本市場?
巴菲特最愛用的估值指標
吳曉求:資本市場做QE2「池子」應有前提
柴升稻: 7.25 切勿用你的生活資金作為交易的資本

TAG:資本市場 |