【乾貨】GitHub上最流行的28個開源機器學習項目

【乾貨】GitHub上最流行的28個開源機器學習項目

1. TensorFlow

GitHub項目地址:

github.com/tensorflow/t

TensorFlow是谷歌發布的第二代機器學習系統。

2. Scikit-Learn

GitHub項目地址:

github.com/scikit-earn/

Scikit-Learn是用於機器學習的Python模塊,它建立在SciPy之上。

3. Caffe

GitHub項目地址:

github.com/BVLC/caffe

Caffe是由神經網路中的表達式、速度、模塊化產生的深度學習框架。

4. PredictionIO

GitHub項目地址:

github.com/PredictionIO

PredictionIO是面向開發人員和數據科學家的開源機器學習伺服器。它支持事件採集、演算法調度、評估,以及經由REST APIs的預測結果查詢。

5. Brain

GitHub項目地址:

github.com/harthur/brai

Brain是JavaScript中的神經網路庫。

6. Keras

GitHub項目地址:

github.com/fchollet/ker

Keras是極其精簡併高度模塊化的神經網路庫,在TensorFlow或Theano上都能夠運行,是一個高度模塊化的神經網路庫,支持GPU和CPU運算。

7. CNTK

GitHub項目地址:

github.com/Microsoft/CN

CNTK(Computational Network Toolkit )是一個統一的深度學習工具包,該工具包通過一個有向圖將神經網路描述為一系列計算步驟。

8. Convnetjs

GitHub項目地址:

github.com/karpathy/con

ConvNetJS是利用Javascript實現的神經網路,同時還具有非常不錯的基於瀏覽器的Demo。

9. Pattern

GitHub項目地址:

github.com/clips/patter

Pattern是Python的一個Web挖掘模塊。

10. NuPIC

GitHub項目地址:

github.com/numenta/nupi

NuPIC是一個實現了HTM學習演算法的機器智能平台。

11. Theano

GitHub項目地址:

github.com/Theano/Thean

Theano是一個Python庫,它允許使用者有效地定義、優化和評估涉及多維數組的數學表達式,同時支持GPUs和高效符號分化操作。

12. MXNet

GitHub項目地址:

github.com/dmlc/mxnet

MXNet是一個兼具效率和靈活性的深度學習框架。它允許使用者將符號編程和命令式編程相結合,以追求效率和生產力的最大化。

13. Vowpal Wabbit

GitHub項目地址:

github.com/JohnLangford

Vowpal Wabbit是一個機器學習系統,該系統推動了如在線、散列、Allreduce、Learning2search、等方面機器學習前沿技術的發展。

14. Ruby Warrior

GitHub項目地址:

github.com/ryanb/ruby-w

Ruby Warrior通過設計了一個遊戲使得Ruby語言和人工智慧學習更加有樂趣和互動起來。

15. XGBoost

GitHub項目地址:

github.com/dmlc/xgboost

XGBoot是設計為高效、靈活、可移植的優化分散式梯度Boosting庫。它實現了Gradient Boosting框架下的機器學習演算法。

16. GoLearn

GitHub項目地址:

github.com/sjwhitworth/

GoLearn是Go語言中「功能齊全」的機器學習庫,簡單性及自定義性是其開發目標。

17. ML_for_Hackers

GitHub項目地址:

github.com/johnmyleswhi

ML_for_Hackers是針對黑客機器學習的代碼庫,該庫包含了所有針對黑客的機器學習的代碼示例(2012)。

18. H2O-2

GitHub項目地址:

github.com/h2oai/h2o-2

H2O使得Hadoop能夠做數學運算!它可以通過大數據衡量統計數據、機器學習和數學。

19. neon

GitHub項目地址:

github.com/NervanaSyste

neon是Nervana基於Python語言的深度學習框架,在諸多常見的深層神經網路中都能夠獲得較高的性能,比如AlexNet、VGG或者GoogLeNet。

20. Oryx 2

GitHub項目地址:

github.com/cloudera/ory

開源項目Oryx提供了簡單且實時的大規模機器學習、預測分析的基礎設施。它可實現一些常用於商業應用的演算法類:協作式過濾/推薦、分類/回歸、集群等。

21. Shogun

GitHub項目地址:

github.com/shogun-toolb

Shogun是一個機器學習工具箱,由Soeren Sonnenburg 和GunnarRaetsch(創建,其重點是大尺度上的內核學習方法,特別是支持向量機SVM(Support Vector Machines)的學習工具箱。

22. HLearn

GitHub項目地址:

github.com/mikeizbicki/

HLearn是由Haskell語言編寫的高性能機器學習庫,目前它對任意維度空間有著最快最近鄰的實現演算法。

23. MLPNeuralNet

GitHub項目地址:

github.com/nikolaypavlo

MLPNeuralNet是一個針對iOS和Mac OS系統的快速多層感知神經網路庫,可通過已訓練的神經網路預測新實例。

24. Apache Mahout

GitHub項目地址:

github.com/apache/mahou

Mahout是Apache Software Foundation(ASF)旗下的一個開源項目,提供一些可擴展的機器學習領域經典演算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。

25. Seldon Server

GitHub項目地址:

github.com/SeldonIO/sel

Seldon是一個開放式的預測平台,提供內容建議和一般的功能性預測。

26. Datumbox – Framework

GitHub項目地址:

github.com/datumbox/dat

Datumbox機器學習框架是用Java編寫的一個開源框架,該框架的涵蓋大量的機器學習演算法和統計方法,並能夠處理大尺寸的數據集。

27. Jubatus

GitHub項目地址:

github.com/jubatus/juba

Jubatus庫是一個運行在分散式環境中的在線機器學習框架,即面向大數據數據流的開源框架。

28. Decider

GitHub項目地址:

github.com/danielsdeleo

Decider是另一個Ruby機器學習庫,兼具靈活性和可擴展性。


推薦閱讀:

從下往上看--新皮層資料的讀後感 第十四部分 Restricted Boltzmann Machine-層層疊疊的開始
Paper Reading | 多角度講解自動駕駛中的激光雷達感知系統
Machine Learning 機器學習筆記
2-1 Model Representation
機器學習面試題精講(一)

TAG:人工智慧 | 機器學習 | TensorFlow |