小破公司到底要不要搞大數據?
來自專欄 數據蟲巢
文·blogchong
本篇的話題如題,討論「關於小公司要不要涉及大數據的話題」。
其實這個話題的產生,在上一篇《大數據跨界,從這裡開始》文末也有稍微的提到過,源自於數據蟲巢的私密讀者群一個童鞋的疑問,當時的原文如下:
我經常聽一些產品這樣說,運用大數據的公司PV要達到100W。
這裡所說的小公司,我們來稍微定義一下,首先人數嘛怎麼也不能超過200百個吧,融資怎麼也不能超過C輪吧,這個PV、UV怎麼也不能動輒幾百上千萬吧。
咱們先不討論這位童鞋的疑問,單說兩個詞「小公司」和「大數據」,放在一起看起來就感覺有些悖論。
我們再來看一下,近些年來鼓吹的大數據4V特徵:大量化(Volume)、多樣化(Variety)、快速化(Velocity)以及價值化(Value)。
我們單把Volume拿出來說道說道,一說到大數據的大量化,動輒什麼海量數據,TB、PB的單位已經不夠用了,非得上EB不可。
一個Volume已經夠小公司完犢子了,PV能否上50W都難說,更不用說什麼TB、PB了,還做個毛大數據?
這樣看,不管從名詞解釋上,還是從數據量上看,一小破公司還搞大數據,簡直不知道把錢往哪燒了,做個毛大數據。
但是,我卻有點不同看法,我感覺小公司做大數據還是蠻有必要性的。
先上一個讓你們無法反駁的理由,不過在此之前先上一個問題:小公司當前最急迫的需求是什麼?
有人可能會說是流量,流量上去了才有發展的可能,聽起來好像是沒錯。
有人可能會說是商業模式,商業模式跑通了才能有變現賺錢的機會,好像也是這麼回事。
也有人可能會說是業務的進展...
不過我想說的是統統沒到點子上,小公司當前最急迫的事情就是:以良好的估值,順利拿到下一階段的融資,愉快的活下去。
那麼,融資與大數據有什麼關係呢?
關係可大發了,特別是在資本蕭條的2016年,以及貌似寒冬依然會繼續的2017年。
在 AlphaGo搖身一變Master,連斬50個圍棋大師的今天,智能化以及AI的話題已成了風口,風口上只差豬了。
而大數據應該算是人工智慧的基礎了,所以,人工智慧的盛行,必然也會帶動大數據的進一步發展。
此外,2016年,也算是國內大數據的政策元年,這個部那個委的,天天上紅頭文件,搞大數據已經成了一種官方行為,你們民間的小破公司還不跟上?
所以,在資本市場一頓不景氣的這兩年,大數據的話題已經成為了資本界少有的幾個溫暖投資點了。
也別不信,認真百度一下,16年資本市場傻逼成這樣,依然有N多專門搞大數據的公司愉快的拿到了融資,跟大數據沾點邊的很多其他公司也或多或少的活過了寒冬,最起碼省著點花,兩三年內是餓不死了。
OK,從這個層面去分析,或多或少有點取巧、投機的意思了,但不可否認,這是很殘酷的事實。
從資本市場的角度去解說這個事情,算是戰略層的考慮吧,那麼,我們從實際的優勢中也可以拆解一二。
2016年之所以會死這麼多公司,很大一個原因就是流量紅利的消失,導致砸錢燒流量的路子再也跑不通了,於是在紛紛把錢燒光之後宣告完蛋。
通過數據來解決流量獲取的話題,在過去的兩年中,我們也許或多或少的都聽過「增長黑客」這個詞,這其中一方面是策略的執行效果,另一方面也少不了大數據在其中起到的決策作用。
當然,所謂「增長黑客」也許有點懸,聽著,但也不能否認有人真的就是成功了,特別是矽谷那邊,確實有不少現成的案例存在的。
其次,如何更好的讓好不容易進來的流量留下來:
1 數據化運營策略,讓你的運營效果更加的符合用戶的預期,你的每個決策都是儘可能的正確。
2 提供個性化的服務,提升用戶體驗。
3 快速迭代產品,並且讓你的產品迭代朝著用戶預期的方向進行。
你需要收集所有用戶的操作行為軌跡,掌握用戶所有的動態,知道他喜歡什麼,知道他不喜歡什麼,投其所好,讓他用的更爽,讓他不願離開。
就算是僅僅只有10萬UV的應用,你要把所有的行為都收集下來,沒有個上百G哪存的下來,你是打算用MySQL來做統計分析嗎?還是把這100GB的數據丟進R裡頭去?
在過去,傳統的路子只做業務數據的分析,所以傳統的路子在小規模的企業中一點問題都沒有。
但是如今,單純的依靠業務數據分析結果已經不夠我們生存下去了,我們需要想盡一切辦法提升我們的轉化,提升我們的留存。
那麼,我們需要收集更多的可能數據,以此來輔助推動相關的決策、服務的效果提升、產品的迭代方向,隨隨便便一個小企業,都能產生數百G的數據,傳統的處理思路,單純的幾百G數據已經很難去做處理,實現想要的業務目的了。
這個時候,你上不上Hadoop,搞不搞大數據?
是的,現在的年代,人肉運營的時代、人海戰術的時代,以及拍腦袋決定的時代都已經過去了,效率這東西越來越受到重視,容不得你不玩大數據,你不玩其他人玩就跑你先一步,搞資本的當然喜歡跑在前頭的人了。
最後,我們再從技術的角度來說一說小公司要不要做大數據。
我曾經和一個朋友聊過類似的話題,他曾很明確的跟我討論說:我從來不認為大數據就是意味著上百個集群節點,什麼TB、PB級數據,七八個節點一樣是可以搞大數據的,大數據是處理數據的一種模式、思維以及方法論。
對此,我深以為然。
上百個節點是大數據,七八個節點的小集群一樣是大數據,大數據不能以數據量來劃分。
我認為大數據更重要的是一種處理數據,解決問題的思路、模式,並且是有別於傳統應用數據的方式,以及思考問題的方式。
不單純的業務數據,而是方方面面的數據,只要能用即用。
不單純是規整的數據,只要是數據,我們都可以把他進行處理。
不單純是自己的數據,可以是外界的數據,只要爬過來就可以了。
不單純是體現業務結果,可以將數據應用在方方面面,全面的數據化、自動化、智能化。
不再是抽樣的數據結果,用的全量的數據呈現結果。
...
所以,一旦說涉及大數據,我們就需要以大數據思維去思考問題,去量化問題,去優化問題,去解決問題。
擴展閱讀:
《大數據跨界,從這裡開始》
《閑話國內大數據發展簡史&產業化落地》
《閑話互聯網開放型數據價值挖掘》
《DT時代變革的反思》
我司招聘:
說到小公司做大數據,好巧,我司也是B輪小公司,但不是小破公司,坐標深圳南山,也做大數據,做了快一年了,真心不是炒概念的那種。
額,咱這需求數據挖掘工程師、大數據平台開發工程師、爬蟲工程師等,有興趣的可以私聊。
最後,廣告Time(不想看的盆友可以直接關閉啦):
那就是,我的個人乾貨私密群正式開啟招募啦(其實是年前幾天開始的,現在已經有群友三十幾號人了),群名「【數據蟲巢】乾貨私密群」。
啟動私密群招募的原因:
一直以來很多都有不少剛入行或者想跨界大數據的朋友通過各種渠道,包括公眾號、微信、簡書等找到我諮詢相關問題。人少時還能應付過來,但隨著人越來越多,我的個人精力有限,而且很多問題都是重複性的。
所以,趁著2017年伊始,正式招募私密群,共性問題一起分享,也有助於幫助大伙兒快速掌握自己要了解的信息。
先來個個人的正式介紹吧:
黃崇遠,花名博客蟲,「數據蟲巢」個人品牌所有者(官網數據蟲巢 - 提供專業的大數據解決方案、公眾號、簡書、博客),近6年的大數據行業經驗,線下組織過大數據技術沙龍,線上授過大數據課,目前於深圳任職於一B輪創業公司大數據主管。
這個群適合哪些朋友:
剛入門大數據領域,想跨界大數據領域;職場有疑問的童鞋;想要做企業大數據諮詢的朋友。
這個群你能收穫什麼:
更有深度的問題諮詢答案,各種行業建議觀點,工作經驗看法分享,第一手公眾號文章,以及不定期會邀請同行朋友來做技術分享(當然也包括我自己),以及線下的交流活動。
如何入群:
留言加我微信,給我發99元的紅包(我不會不好意思收你紅包的,因為我感覺你會覺得值得的),然後私密我備註,我拉你入群,有效期是2018年2月,到期後你可以選擇續費,也可以選擇離開,目前是這個價,保證不降價,但不保證不提價,中途不予退款(想清楚再入)。
所以,考慮清楚你是不是真的要加入,考慮清楚了再做決定!
2017年,我相信大數據領域會有更多機會,當然也會更有挑戰,加油!
推薦閱讀:
※鹿豹座平台當選網路文化協會理事單位
※誠邀「年輕人」加入本社,一起策馬奔騰,共享人世繁華
※重新回歸的谷歌翻譯,簡直要牛出天際!
※互聯網簡訊-20180427
※為你揭秘兩個最近發現的兩個互聯網騙局,一定要小心!
