標籤:

數據分析從0到1——入門篇

數據分析從0到1——入門篇

來自專欄 失核少年

越來越多的時候,我發現我自己在懷疑這一切是否值得我去戰鬥,為了一個沒有恐懼的未來?使得,這一切值得。

——CHRIS《生化危機5》

之前在聽完猴子老師的方法論之後,就開始了《R語言實戰》的學習,到今天已經完成了前五章。正如第一部分的標題——入門,涵蓋著全部的基礎知識,就像語言學習中的語法,只要按部就班的完成就好。

談談自己的心得:

  • 入門部分,我覺得最重要的部分就是第2章數據結構,因為作為最基礎的知識也是核心,而3,4,5章更多的介紹了一些方法,函數從而更好的管理數據。

《第2講:數據結構入門》中猴子老師用了絕大多數時間講解了向量,矩陣,數組,數據框,列表。其中用的最多的數據框,涉及到Excel導入R中數據存儲的問題,因為xlsx文件導入R中,會以數據框來存儲數據。

  • 關於R,RStudio軟體的安裝,因為資料里都有詳細的下載安裝過程,所以安裝很順利。

說一下我遇到的問題:

  1. 使用R來導入Excel:
  • 下載一個JDK(Java Development Kit)(需要的可以私信我)
  • 參考http://jingyan.b aidu.com/article/e75aca85b29c3b142edac6a8.html安裝,配置環境就行
  • 輸入代碼:install.packages("xlsx"),選擇China的一個任意鏡像站點下載安裝包,就能導入Excel文件了。

2. 使用RStudio導入Excel:

  • 在右上角的Environment ->Import Dataset -> From Excel就好,會自動安裝一些東西。
  • 注意:Excel文件的路徑一定不能太長,否則不能導入。

題外記:

看完TED凱文凱利:AI(人工智慧)將掀起第二次工業革命後,給我的感觸很深。隨著人工智慧技術日趨進步,對很多傳統行業衝擊很大,從最早的簡單的重複勞動開始。在十幾年前,珠江三角洲一帶,生產電子零件的工廠,廠房已經就實現了自動化,諾大的廠房裡空無一人,而生產效率確實人力萬萬不能比較的,全是機器人在生產。就像演講里說的,人工智慧可以做到很多人力可以做的,而且高效,已經不僅是簡單的勞動了。並且這種趨勢會像輻射一樣影響更多的行業。當然,就像最後提到的最厲害的不是AI,不是人,而是人與AI的結合,協同工作,才能做到「天下無敵」。

以後的路上,做個永遠的行動派!


推薦閱讀:

如何以數據有效驅動產品
大型商場銷售預測
簡單數據處理—實踐案例分析
【指南】7種不常見但非常有用的數據可視化圖表
下一部電影

TAG:數據分析 |