推薦一套開源BI工具?

如題,想在部門內部建一套小的BI,包括數據ETL,數據建模、還有出報表,發郵件之類的功能。我聽到過的有pentaho(+mysql+R+?), 還有birt,想聽聽牛人給點意見和觀點,多謝了!


為什麼一定要自建呢,現成的工具,微軟的Power BI可以了解一下,無論是功能,還是成本,都會比自建要划算的多。

PowerBI從數據清洗、數據建模、數據可視化到協同分享,都有成熟的方案。

[圖片]

數據清洗有強大的PowerQuery模塊,支持從各種數據源導入數據;

[圖片]

數據建模有強大的DAX,敏捷開發、數據動態化;

[圖片]

數據可視化更是擁有數百個可視化圖表庫,應有盡有。

[圖片][圖片][圖片][圖片][圖片][圖片][圖片][圖片][圖片]

更關鍵的是,PowerBI個人學習使用完全免費,企業級使用,Pro服務也是極低的價格,怎麼也比自己花費大量人力、物力,建一個肯定不如專業團隊的產品,划算的多。

所以,專註於自己的業務就好,至於為完成業務目標而需要用到的工具,還是讓專業的人去做,直接拿來使用就夠了。

.


開源的都是國外的,BI 能對付,報表搞不定。能全搞的定都是國產貨,目前只有潤乾是半開源,BI 部分都開源了

可以參考這個

簡易 BI 的實現過程 - 乾學院 簡易 BI 的實現過程 - 乾學院

幾個常見開源BI的對比在下面!!!!!!!!!!!!!!!!!!!

現在市場上開源 BI 產品比較多,各個產品的側重點不同,有的以報表為主、有的以可視化為主、有的以查詢分析為主。這裡我們選取了一些主流的開源 BI 產品,從產品功能、可視化能力、數據源支持以及使用文檔等方面進行對比,希望對你有幫助。

Superset

由Airbnb貢獻的輕量級BI產品,目前在GitHub上有3萬多顆星,其受歡迎程度可見一斑。Superset提供了Dashboard和多維分析兩大類功能,後者可以將製作的結果發布到Dashboard上也可以單獨使用。

&-->

數據源方面,Superset支持CSV、MySQL、Oracle、Redshift、Drill、Hive、Impala、Elasticsearch等27種數據源,並深度支持Druid。

Superset語義層建模(被稱為Table)時只能基於單表,多表關聯要事先邏輯化成視圖再使用,這點有點彆扭。在Table里要顯示地將欄位標記成可分組、可過濾,指定聚合方式(計數、求和等),頁面在使用時需要選擇Group by(並沒有叫做維度)、Metrics和Filter進行查詢。

&-->

Superset可以在多個時間維度上觀察,商業分析中的很多問題都是與時間密切相關的。Superset 有 4 種專門針對時間序列的圖表,使用這些圖表時,你需要指定一個欄位為時間維度,之後就可以對時間維度做豐富的操作。

? 從不同時間粒度去查看你關心的指標(小時/日/周/月/季度/年)

? 對時間序列做移動平均,比如看一個指標的 7 日平均線

? 可以對時間序列做偏移,再做對比,比如把本周的銷售業績與上周同期放在一張圖表中對比

? 不在圖表上顯示指標的絕對值,而是顯示它隨著時間變化的增長速度

Superset還提供了直接使用SQL查詢生成圖表的方式(SQL Lab)來強化臨時分析,方便數據分析師編寫SQL查詢數據。

Superset的可視化效果非常好,直接支持了幾十種圖形,從前面的截圖中可以看到可視化效果很棒。重要的是,它還提供了圖形擴展支持,通過開發插件還可以對接任意可視化庫,如ECharts、AntV、HighCharts、VX和D3,這點對用戶非常實用。

文檔方面,Superset表現比較糟糕,寫的過於簡單,雖然在安裝與快速入門方面提供了很完整的文檔,但在具體功能的介紹方面文檔嚴重缺失。就算有些功能有文檔,文檔的結構也很混亂,所以大部分功能只能自己去嘗試。

Superset作為一個完整的BI系統,除了Dashboard和多維分析還包括調度和郵件報表,以及系統管理和許可權控制等平台管理功能。綜合來看,Superset作為大廠開源的BI產品還是非常值得一用。

Grafana

GitHub 上的星星數比 Superset 還多,之所以把它放在第二個來說是因為它的適用範圍跟大多數 BI 產品不太一樣,Grafana 主要用於對接時序資料庫,分析展示監控數據。目前支持的數據源包括 InfluxDB、Elasticsearch、Graphite、Prometheus 等,同時也支持 MySQL、MSSQL、PG 等關係資料庫。

每種數據源的查詢語言和功能明顯不同,Grafana 可以將來自多個數據源的數據組合到一個儀錶板上,但每個面板都要綁定到屬於特定組織的特定數據源。

話不多說,上張效果圖感受一下可視化效果。

&-->

Grafana 為不同數據源提供了不同的編輯器,這樣可以方便使用特定數據源的查詢語法,很牛叉。有時經常拿 Grafana 跟 Kibana 對比,在數據源種類和查詢支持上 Grafana 要豐富得多。

在可視化構建過程中,面板(Panel)是可視化基本模塊。每個面板都提供一個查詢編輯器(取決於面板中選擇的數據源),通過使用查詢編輯器,可以提取顯示在面板上的完美可視化效果。有各種各樣的樣式和格式選項,面板可以在儀錶板上拖放和重新排列,也可以調整大小。

Dashboard 是 Grafana 可視化最終展現形式,Dashboard(或特定面板)可以通過多種方式輕鬆共享。可以向登錄的 Grafana 的人發送鏈接。可以使用快照功能將當前查看的所有數據編碼為靜態和互動式 JSON 文檔。這比通過電子郵件發送屏幕截圖要好得多。

值得一提的是,Grafana 的文檔寫的很棒,除了很詳細外很多操作步驟都錄成 GIF 放到文檔中讓人一目了然。

在實際業務中,什麼情況下選擇 Superset,什麼情況下選擇 Grafana 呢?

時間序列,日誌與設備運行數據分析選 Grafana;企業生產經營數據分析則可以選 Superset。

Metabase

Metabase 目前在 GitHub 上受歡迎程度僅次於 Superset,Metabase 也是一個完整的 BI 平台,但在設計理念上與 Superset 大不相同。Metabase 非常注重非技術人員(如產品經理、市場運營人員)在使用這個工具時的體驗,讓他們能自由地探索數據,回答自己的問題。而在 Superset 里,非技術人員基本上只能看預先建好的 Dashboard,不懂 SQL 或是資料庫結構的他們,很難自己去摸索。

Metabase 採用「問問題」的方式實現一步步數據探索,探索的結果可以保存並發布為 Dashboard。對於複雜問題還提供了 Native query 允許用戶編寫 SQL 或 native query。

&-->

數據源方面,Metabase 支持 Redshift、Druid、Google BigQuery、MongoDB、MySQL、PG 等 15 種數據源。

Metabase 社區版的文檔寫的簡單到讓你不知所措的地步,表現十分糟糕。好在這個產品使用起來不難(本身定位就是給業務用戶使用的)。

Redash

如果說 Superset 和 Metabase 是構建一個 BI 平台,那 Redash 目標就是更純粹地做好數據查詢結果的可視化。Redash 支持很多種數據源,除了最常用的 SQL 資料庫,也支持 MongoDB, Elasticsearch, Google Spreadsheet 甚至是一個 JSON 文件。目前 Redash 支持超過 35 種 SQL 和 NoSQL 數據源。

&-->

它不需要像 Superset 那樣在創建圖表前先定義表和指標,而是可以非常直觀地將一個 SQL 查詢的結果可視化,這使得它上手很簡易。或者說 Redash 僅僅實現了 Superset 中 SQL Lab 的功能,但卻把這個功能做到了極致。

Redash 有兩個非常實用的功能,Query Snippet 與 Query Parameters。

Query Snippet 很好地解決了查詢片段的復用問題。做數據報表時經常要用到十分複雜的 SQL 語句,這些語句中肯定有一些片段是可以在多個查詢中復用的。在 Redash 中我們可以將這些片段定義成 Snippet,之後方便地復用。

Query Parameters 可以為查詢添加可定製參數,讓這個圖表變得更靈活。比如一個移動應用的日活指標,我可能有時要按 iOS/Android 切分,有時要按地域切分,或是按新老用戶切分。在 Superset 的 Dashboard 上要做三個表圖。Redash 里我可以把查詢的 groupby 做為一個參數,這樣就可以在一張圖上搞定。用的時候,運營人員可以在圖表上方的一個下拉框里選擇切分的方式,非常直觀好用。

Redash 的 Dashboard 可以通過命名來進行分組,Dashboard 的名字可以有一個前綴並以冒號結尾,前綴相同的 Dashboard 就會自動被分為一組。例如「 Growth: Daily 」,「 Growth: Weekly 」這兩個 Dashboard 都會被分到「 Growth 」組下。

Redash 在文檔方面做得很好,除了快速入門教程以外,每一個功能模塊都有文檔且條理清晰。

當然 Redash 也有自己的不足之處,它的可視化種類比 Superset 遜色不少(不過其實也夠用了)。另外,由於它只是純粹地把數據查詢結果可視化,所以也沒有 Superset 里那些對時間維度上的聚合與對比的操作。

CBoard

國內由楚果主導的開源 BI 產品,分社區版和商業版。CBoard 提供了一個 BI 系統,包括 Dashboard、多維分析、任務調度等方面。

&-->

數據源方面支持 JDBC 數據源、ElasticSearch、文本文件(文本需要存放於 CBoard 應用伺服器上面,讀取本地文件)、Saiku2.x 等。

圖形方面直接使用了 ECharts,多維分析和 Dashboard 功能中規中矩,可以滿足大部分 BI 需求。

文檔方面由於是國內開源的產品,中文文檔對國內用戶友好,但文檔質量一般在使用過程中還需要不斷摸索。

值得注意的是,CBoard 社區版和商業版功能差異較大,社區版有很多功能都不支持,使用前要認真評估。

BIRT

與前面提到的幾個 BI 產品注重數據探索和可視化不同,BIRT 主要用於報表的開發與呈現,在可視化效果方面表現並不出彩,也不包含多維分析。

BIRT 是一個 Eclipse-based 開放源代碼報表工具。BIRT 主要由兩部分組成,一個是基於 Eclipse 的報表設計器和一個可以加到你應用服務的運行期組件。

&-->

BIRT 報表引擎以 JAR 文件方式打包,可以方便的添加到 J2EE 應用中。採用 Taglib 方式很容易在 JSP 頁面上集成報表。

BIRT 的文檔寫的很差,可能跟產品誕生年代久遠有關,目前社區也不太活躍,好在網上還可以查到很多資料。

如果你的需求是開發常規報表,那麼 BIRT 絕對是一款可以嘗試的工具。與 BIRT 類似的還有一款 JasperReports 工具,功能方面大同小異。

潤乾報表

潤乾報表是國內為數不多開源 BI 產品,雖然產品名稱以報表命名,但實際已包含所有 BI 功能。從功能上來看,潤乾報表可以約等於 Superset+BIRT,也就是提供了多維分析、Dashboard 和報表以及平台管理功能。

數據源方面,潤乾報表除支持 MySQL、Oracle 等傳統 RDBMS 外,還支持 MongoDB、Elasticsearch、Redis、Spark 以及 HDFS 等數據源。同時還可以直接使用 Excel、CSV、JSON 進行報表開發和數據分析。

在可視化方面,潤乾報表表現並不十分顯著,產品內置的 30 多種圖形中規中矩。如果想使用效果更好的可視化圖庫可以通過潤乾報表提供的第三方圖形介面實現,引入圖庫文件後修改 JS 用於接收數據集數據即可完成。這跟 Superset 等擴展可視化圖庫的方式不太一樣,沒有繁瑣的插件開發過程,簡單方便。

&-->

潤乾報表提供的多維分析功能與 Superset 類似,通過在頁面上拖拽維度和指標進行數據查詢,同時可以進行切片和旋轉等操作。潤乾報表允許用戶直接基於文件分析,也可以編寫 SQL 進行數據查詢生成圖表,同時為了保證性能還可以使用自有的私有存儲格式。

在語義層建模中,潤乾報表支持多表關聯(JOIN)。特別地,在潤乾報表中需要將維度顯示制定成一個表,如果沒有對應的表則需要建立虛擬表,這樣做的好處是前端查詢分析界面可以很方便地實現多表實時關聯查詢,而不必每次都必須基於一個(物理或邏輯)寬表。

&-->

可以通過多維分析拖拽圖表來組織 Dashboard,根據指定(或自定義)布局生成,同時可以使用全局參數進行數據過濾分析。

&-->

潤乾報表的另外一個優勢是複雜報表的處理能力

我們知道,國內的報表具備很強的本土特徵,潤乾報表最初是為實現複雜報表而設計的報表工具,是目前主流產品(含商業)中做的最早也是實現得最好的一個。

&-->

在這方面,無論使用上面提到的任意一款工具都無法很好滿足。

潤乾報表的定位跟 Redash 很像,都希望提供便捷的方式讓用戶迅速得到分析結果。同時也提供了一個輕量級的管理平台(報表中心)包括資源管理、許可權控制以及郵件訂閱等功能。

潤乾報表提供了 BI 平台的同時也支持按模塊集成,可以將產品中各個模塊根據需要單獨集成到已有的項目中,這對已有平台系統的用戶非常方便。

需要注意的是,潤乾報表並非所有功能都開源,目前開源的部分包括:多維分析前端界面、報表中心和 Dashboard。如果需要使用基礎報表、多維分析伺服器等部分則需要付費,不過價格並不高。

總結

最後做一下總結,拉個表格方便對比。

&-->

國內 BI 項目以企業級應用解決方案為主,其需求重點落在多維分析式的自助報表、Dashboard 以及一些相關平台管理功能,對於多步驟探索式分析需求相對較少(這部分功能一般由桌面 BI 解決)。從這個角度上看,作為國內產品的潤乾報表,對這些需求的適應性要更好,除了具備常規 BI 該有功能外,還可以處理本土的複雜報表,在選擇開源 BI 的時候不妨一試。


開源的BI產品確實少,能查到的也都是國外的產品,文檔少學起來是真費勁,有問題只能發帖子,有沒有人回、啥時候回就更不知道了,所以也不太建議用這類產品,我們公司也調研過BI產品,國外開源的都放棄了,國內的是沒發現有開源產品, 並且本身BI給人感覺高大上,都死貴死貴,性價比較低。

另外國內BI幾乎都是以平台形式提供,BI工具的核心是自助報表(也叫多維分析啥的),自助報表本身屬於 web 應用層面的功能,大部分廠商提供對應的功能也是在自己平台里,屬於產品里的一個模塊,基本不會提供單獨的模塊集成,用起來不靈活;而且封裝好的模塊也基本不會讓用戶自己去進行個性化(BI比較追求個性化)修改(花錢讓廠商定製化也是可以的,但是費用就相當高了,甚至比產品本身價格都高了)。

國內BI產品有提供部分開源的,潤乾報表,也是後期我們主要測試的產品。不論是報表還是BI方面功能都很完善,提供模塊化集成方式。除了可以通過報表中心使用完整系統外,提供更人性化的BI集成模塊,所以也能作為模塊和我們的系統嵌入式集成(我們公司就是這麼用的,許可權啥的都有開放的介面,用自己系統的控制就ok了) 。

實際上我們更關心的還是開源的問題,潤乾是提供報表中心及BI模塊前端完全開源,可隨系統風格、用戶操作習慣等隨意改動,BI底層核心模型閉源不可動。這些已完全夠用了,開源實際上最大的目的是前端的操作習慣或外觀樣式上的改動。

通過我們的測試,感覺還是比較不錯的,畢竟是為數不多可模塊集成、還部分開源的國產產品。感興趣的可以去他們官網(http://raqsoft.com.cn)了解,或者找他們的商務人員(官網就有入口,很方便)。


參見:2018年5大可視化BI工具選型對比分析

如今,有大量功能強大的可視化工具和BI工具能快速的實現數據可視化,幫助業務分析推動決策。

在本文中,筆者將比較近兩年國內外市場份額較高,也是相對成熟的BI分析平台,對比其主要功能,為個人使用或企業IT工具選型提供一個參考。

&-->

在百度搜索商業智能(BI)工具時,可能每個BI供應商都將其產品稱為唯一的「最佳」解決方案進行宣傳,暈乎轉向。筆者身邊有很多在數據中心工作的朋友,也有各種IT信息部的大佬,也見慣了各家上門兜售產品的廠商。所以對BI產品的好壞,各中優劣有所了解。也恰逢前陣子在整理一些產品資料,便有了下文。如果你想了解功能性產品的真實價值,避免被大肆宣傳的廣告和評論誤導,那你來對地方了。

這邊主要列出了5類BI可視化工具(QlikView、Tableau、Power BI、帆軟FineBI和Google Data Studio)的特性、優點和缺點。主要比較它們的關鍵參數,包括可用性、設置、價格、支持、維護、自助服務功能、不同數據類型的支持等。

&-->

QlikView

QlikView是一種將用戶作為數據接收者的解決方案。它允許用戶在工作流程中探索和發現數據,這與開發人員在處理數據時的工作方式類似。為了保持數據探索和可視化方法的靈活性,該軟體致力於維護數據之間的關聯。這可以幫助最終用戶發現您的數據,即使這些搜索項目的來源是令人難以置信的,這些數據也會提醒您檢索相關項目。

QlikView比較靈活,展示樣式多樣。它允許設置和調整每個對象的每個小方面,並自定義可視化和儀錶板的外觀。QlikView數據文件(QVD文件)概念的引入,一定程度上取代了ETL工具的功能,擁有可集成的ETL(提取,轉換,載入)引擎,能夠執行普通的數據清理操作,但是這可能會很昂貴。

產品差異化

Qlikview的設計是在avant-garde預構建的儀錶板應用程序和聯想儀錶板的基礎上開發的,這些應用程序既創新又直觀易用。由於具有先進的搜索功能,它還提供了避免使用數據倉庫和使用關聯儀錶板在內存中提取數據的功能。

特徵

Qlikview的獨特性和靈活性的完美結合使其在其他BI供應商中佔有一席之地,並為各行各業處理了大量不同規模的業務提供各種有用的應用程序。

其中一個特點是QlikView能夠自動關聯數據:識別集合中各種數據項之間的關係,無需手動建模。

另一個特性,Qlikview處理數據輸入,是將其保存在多個用戶的內存中,即保存在伺服器的RAM中。這樣可以加快查詢速度,從而加快數據探索速度,並改善用戶在運行中計算的聚合體驗,而不是基於存儲的計算。由於Qlikview保留了內存中的數據,因此根據需要計算聚合要快得多,而不是查詢預先計算的聚合值。又有點也有缺點,內存型的BI工具,數據處理速度很大程度上依賴內存大小,對硬體要求較高,一般企業的配置,數據處理起來較慢,而且Qlikview對於複雜業務需求,必須寫qlikview的腳本。

可用性

QlikView的儀錶板和報告很容易瀏覽,但是對於構建報表可能有點挑戰,因為它需要高水平的開發人員技能,熟悉默認SQL以及使用Qlikview的專有查詢語言(qlikview腳本)進行訓練以構建資料庫交互。

定價

QlikView的價格政策可在官網上找到,定價方案比較複雜。許多新用戶通過其「文檔許可證」陷入了代價高昂的陷阱,該文檔許可證以某種模糊的方式表達了工作條件。最初的定價計劃實際上可能會讓費用增加一倍,因為速率僅適用於一個「文檔」。許多客戶後來發現這是令人不愉快的驚喜,並且它還可以刺激用戶的價格近兩倍。與Qlikview相比,其他競爭對手的定價政策更直接。

&-->

總是QlikView更像是是一個BI可視化展現的工具,相比其他可視化工具(非BI類)圖形展現方便,性能也還可以。但如果是探索性的數據分析,比如你想拖一些數據看看結論與猜想是否正確,有時候可能要做20多個儀錶盤才能驗證自己的猜想,qlikview可能就不太合適了,它比較適合一開始就知道怎麼分析展現。

總而言之,如果您有正確的思維方式來應用程序化界面,並且能夠從一開始就整合正確的問題,以便您的數據以不同形式派生,那麼Qlikview可能是適合您的解決方案。當然,您還需要準備投入額外的努力來維護正確的報告。

Tableau

&-->

可視化BI神器Tableau。與大多數其他商務智能工具一樣,它通過可視化方式進行數據分析。它旨在輕鬆創建和分發互動式數據儀錶板,通過簡單而有效的視覺效果提供對動態,變化趨勢和數據密度分布的深入描述。

與許多其他服務一樣,Tableau提供了連接多種系統類型的數據源的工具,如以文件格式(CSV,JSON,XML,MS Excel等)組織的數據系統,關係數據系統和非關係數據系統(PostgreSQL ,MySQL,SQL Server,MongoDB等),雲系統(AWS,Oracle Cloud,Google BigQuery,Microsoft Azure)。

比較特別的是Tableau有幾種方法可以共享數據報告,具有一定的協作性。將它們發布到Tableau伺服器;通過電子郵件Tableau Reader功能;通過公開發布Tableau工作簿並授予訪問任何有鏈接的人員的許可權。這種選擇的大小可以帶來很大的靈活性並消除許多限制。缺點就是,這種方式起碼對於筆者坐在公司的辦公習慣不太適應,反而更習慣登錄門戶去查看下載或者郵件推送(有點老掉渣),本土化有些水土不服。

產品差異化

Tableau提供了多種具有鮮明特徵的可視化功能,實現了數據發現和深入洞察的智能方式。豐富的可視化類型庫包括「文字雲」和「氣泡圖」,可為Tableau提供獨特的高級別理解。樹圖和樹形圖為視覺效果提供上下文信息。後者通常用於描述零件分類數據,重點關注最相關的信息。

Tableau儀錶板非常靈活。它的中心特徵允許以期望的方式用任何「重疊」來布置儀錶板,這在屏幕空間人體工程學中非常方便。

Tableau很容易理解為工作工具,其學習曲線非常溫和,因為它努力為任何類型的用戶提供其所有權力,甚至是那些以前從未接觸過可視化工作流技術細節的用戶。

從開發人員的角度來看,Tableau不僅簡單易用,而且在目的地方面也非常整潔,因為它提供了通過附加自定義參數的附加過濾來控制結果的能力。所有的數據都以清晰、有吸引力和互動的方式進行交流。Tableau提供了對數據的深刻見解,並允許有效地壓縮複雜的決策過程。

特性

  • 免費共享能力(有一定的限制)
  • 支持連接到30多個數據源類型
  • 混合數據源
  • 支持多維數據集
  • 與R的集成,為許多資料庫映射現成的驅動程序
  • 領導社區建設工作(各種培訓視頻、博客、論壇、社交網路參與)

功能上Tableau和Qlikview產品的功能重合度非常高。不過Tableau相比qlikview可視化更美觀,分析也更方便,可以做探索性的分析,數據量少時非常快。兩個工具都有強悍的分析功能,但是數據抓取功能都非常弱。比如增量很麻煩,假如數據源刪數據,兩種工具都要重新導數據。這兩種工具的側重點都是在獲取一堆歷史數據,然後進行分析,想分析實時數據還很欠缺。尤其像Tableau,ETL功能並沒有集成,得有個非常好的數據倉庫作為基礎。

&-->

可用性

非常容易使用,從這個列表看,它被認為是最好的易於使用的工具。考慮到這些廣泛的Tableau特性,它最方便的用例是通過圖表、圖形和其他可視化類型發現結構化數據。對於一個普通的業務用戶來說,這很容易,而且與開發工具一樣強大。導入數據、構建有吸引力的可視化,共享並以簡單明了的形式發布它們。

定價

Tableau有不同的許可計劃,類似於其他BI解決方案。Tableau提供了三種截然不同的產品,價格截然不同。

這三種產品分別是Tableau桌面、Tableau和Tableau伺服器,它們的價格不同。詳細的價格信息可以在官方網站上找到。

Tableau桌面是為大多數的個人用戶設計的,每年為個人用戶提供$999,企業使用$1,999,覆蓋支持。個人使用意味著它是針對單個開發人員的,並且支持6個數據源。企業使用意味著它是為業務需求而設計的,並允許多達44個數據源。

Tableau是一個基於雲的BI平台,由Tableau供應商提供web界面。Tableau可以免費使用它的公共選項,但重要的是要記住,這個解決方案是託管在公共伺服器上的,所有的報告都是公開共享的,這個私人在線版本的售價為500用戶/年。

Tableau伺服器對於運營自己伺服器的公司來說是一個成熟的業務工具,它希望對數據流進行完全控制,並保證後台主機的安全性。然而,它的價格是每10個用戶$10000。客戶的支持還提供額外的25%的年成本。

FineBI

FineBI是列表中唯一上榜的國產BI工具,帆軟公司的。

FineBI是一套企業數據化管理和可視化BI的方案,意思是在具備可視化BI功能的同時,又側重於幫助企業打造數據化管理的一個應用。從其使用流程中可以看出:分別為管理員創建業務包(準備數據),業務人員新建儀錶板(可視化和探索性分析),業務人員新建螺旋分析(前端再處理數據),領導查看分析(對外分享報告)。

創建業務包就是準備數據,這個工作一般讓信息部去做,把數據轉化成業務分析人員可理解的數據(一般會準備大而全的明細數據)。然後,業務人員拿著業務包里的明細數據,根據需求做分析,比如做一個銷售dashboard,分析每個產品、每個地區、每個銷售員的銷售情況綜合判斷。在沒有分析目標的情況下,可以嘗試探索性分析,甚至數據挖掘:聚合、預測等,都有現成的模型。

產品差異化

FineBI連接數據的方式,包括直接對接資料庫的實時數據引擎,和抽取數據的引擎,統稱為Spider計算引擎。用戶可以根據數據量、實時性要求、使用頻次等,自由選擇實時或抽取的方式。實時數據與抽取數據方式的無縫切換,將更加靈活高效支撐前端的高性能分析。

Spider數據引擎可靈活支撐不同數據量級的分析,在數據量激增之後,可橫向擴展機器節點,利用Spider引擎專為支撐海量大數據分析而生的分散式方案。

Spider引擎分散式方式,結合Hadoop大數據處理思路,以最輕量級的架構實現大數據量高性能分析。此分散式方案集成了Alluxio 、Spark、 HDFS、zookeerer等大數據組件,結合自研高性能演算法,列式存儲、並行內存計算、計算本地化加上高性能演算法,解決大數據量分析問題與在FineBI中快速展示的問題。同時從架構上保證了計算引擎系統全年可正常使用。

優勢

(1)引擎支撐前端快速地展示分析,真正實現億級數據,秒級展示。

(2)用戶可以根據數據量、實時性要求、使用頻次等,自由選擇實時或抽取的方式,靈活滿足實時數據分析與大數據量歷史數據分析的需求。

(3)抽取數據的高性能增量更新功能,可滿足多種數據更新場景,減少數據更新時間,減少資料庫伺服器壓力。

(4)合理的引擎系統架構設計可保證全年無故障,全年可正常使用。

特性

FineBI可以自動關聯數據表之間的關係,通過鍵自動建模。

再者與其他不同BI工具不同的是,FineBI有移動端、PAD端、以及大屏。

&-->

FineBI還有類似辦公協同軟體OA的一套數據協同管理,主要出於數據安全考慮。可以設置部門只能看部門內的數據,個人只能看個人許可權範圍內的數據,dashboard製作完分享給別人時,也可以指定分享給誰,被分享者收到通知後登錄門戶時,可以看到報表出現在桌面中,然後修改、批註。筆者覺得這一點好太多,尤其是出於數據安全的考慮,更能適應本土化的需求。

&-->

可用性

FineBI屬於自助式BI,使用簡單,具有豐富的可視化和前端分析操作,能可視化地進行數據鑽取,數據切片和數據旋轉等多維分析操作。前端探索性分析操作類似Tableau。配合幫助文檔和教學視頻能輕鬆上手,無需付額外培訓費用駐場培訓。

定價

FineBI的定價不同於其他產品按年按人數付費,FineBI是按照功能模塊買斷,多維資料庫引擎、決策門戶、OLAP分析組件、管理駕駛艙等功能組件,類似於移動電信的自選套餐,一般企業的產品整體打包價格幾十萬。

Power BI

&-->

Power BI是由微軟開發和支持的軟體解決方案,用於商業智能和分析需求。 Power BI的核心是一個提供多種交互選項的在線服務,還提供了多個連接第三方軟體和服務提供的數據的網點。

Power BI提供了一個簡單的基於Web的界面,具有豐富的實用功能,從定製的可視化到對數據源的有限控制。桌面應用程序通過添加數據清理和規範化工具,將可用功能擴展到更大程度。

在旅途中工作和制定數據驅動決策的另一種方式是通過移動應用程序,該應用程序可用於多個平台。通過將您的工作發布到Power BI服務,並通過組合報告形成生動的儀錶板,使數據通信集中化並易於跟蹤所有參與者,分享見解也非常簡單。

Power BI簡潔,但功能強大。但是,像其他軟體一樣,它也有其起伏,目前並不是非常成熟,商業選型必須仔細考慮。

產品差異化

Power BI與其他解決方案有何不同?

首先,由於它是微軟產品,它遵循與其他主要微軟產品相似的理念、原則和體系結構。它也為Windows用戶提供了一個熟悉的界面。

Power BI的創建和設計旨在構建MS Excel的功能,將其升級到下一個級別,進一步擴展其可操作性以解鎖新的用例,覆蓋更多的平台並接觸到雲。

作為微軟的產品,Power BI與微軟工具帶中的其他軟體有聯繫,但遠比利用一整套全新的業務分析工具更有效。因此,Power BI不僅與其他產品有關,它與微軟的主要工具(包括MS Excel,Azure Cloud Service和SQL Server)緊密集成。

特徵

  • Power BI有一個免費的基本版本,讓用戶有機會首先探索它
  • 它支持多種方式來整合或導入數據(流數據、雲服務、Excel電子表格和第三方連接)
  • 它具有實時饋送數據的互動式儀錶盤
  • 用於將Power BI與應用程序集成的簡單API
  • 分享報告和儀錶板的不同方式
  • 多平台支持(Web,桌面,移動)

可用性

所有熟悉Windows的用戶(即幾乎所有人)都可以直接使用該界面,因此使用Power BI通常非常直觀。

許多控制項和描述對MS Excel和其他MS Office產品都有類似的看法,這些產品在處理報表時可深刻理解您的進度。

可視化是使用良好的舊式拖放創建的。您只需要將一個可視類型拖放到報表的空白區域,即可構建新圖表或可視化數據。這將以默認外觀的空白視覺形式創建未來可視化的佔位符。通過簡單地將數據欄位拖放到佔位符本身或其屬性中(這些數據在高亮顯示時它們將可用),您選擇要在此視覺中呈現的數據(確切欄位或數據片段) )。

定價

微軟Power BI被認為是一個體面的分析工具,其定價政策非常民主。

定價結構非常簡單,提供了兩種選擇:功能有限的免費版Power BI,以及具有全套服務的Power BI Pro企業版。

免費選項適用於任何單個用戶,並具有1 GB的數據容量限制,儀錶盤和報告總共有10K行/小時的數據流數據,以及有限的數據刷新和協作功能。

Power BI Pro每月為一位用戶提供9.99美元的費用,並將每個用戶的容量限制擴展到10GB數據,每小時流量數據高達每小時1M行,這是其API的最大速率)。它還支持直接連接到數據源,並使用Data Connectivity Gateway訪問您的本地數據,以及高級協作工具,如Office 365組、內容包、Active Directory組、行級安全措施以及數據目錄。

&-->

Google Data Studio

&-->

今天列表中最年輕的工具是Google分析解決方案的一部分。在這個領域相對較新,它力求通過易用性,簡單而漂亮的設計,創新的解決問題以及簡單,習慣的方式來共享儀錶板(就像您通常共享文檔一樣),從而在眾多競爭對手中站穩腳跟。在測試版中,Google Data Studio提供了一個關於如何處理數據的有趣視角。這是一個完全基於Web的解決方案,沒有桌面版本(不像其他BI解決方案)。這個工具開始時相當不錯,但時間會顯示它是否會長期運行良好。

產品差異化

谷歌希望在市場上找到正確的位置,不僅僅是單一的商務智能工具,還可以通過將他們方便地結合到谷歌分析解決方案數據工具包(一種用於分析數據和促進數據驅動的解決方案。

Google通常會努力在所有產品中實現最大的簡單性和直觀性。你會驚喜地發現一個簡單的儀錶板可以放在一起。但是,有些部分可能仍然頗具挑戰性,特別是在數據處理方面。請注意,該工具仍處於測試階段,所以很多事情可能不被支持,並且不清楚這是否僅僅是早期版本的限制或工具的永久性缺陷。

Google Data Studio允許將原始數據轉換為互動式可視化,並將其編譯到儀錶板中。此外,該工具完美適用於Google特定的數據源。它通過數據連接器的便利設施提供了對數據的輕鬆訪問。

最後,最好的部分之一涉及Google Data Studio中使用的協作技術,使開發團隊能夠共同處理單個問題。藉助Data Studio,您可以讓其他人按照Google文檔中的相同方式查看和編輯您正在處理的信息中心。

特徵

  • Google數據源的連接器
  • 用於處理原始數據的轉換工具
  • 內置視覺類型的體面庫
  • 強大的團隊合作能力。

可用性

正如我們已經討論過的那樣,該工具非常易於使用。快速連接數據並找出界面的工作方式。您會喜歡創建報告和儀錶板,因為它非常簡單而有趣。它通過三個簡單的步驟完成:選擇視覺類型,將其拖放到將其放置在所需位置的報告區域中,然後設置可視化度量。

儘管如此,某些零件並不是很容易完成。弄清楚如何個性化和調整視覺效果和圖表的格式可能是相當令人費解的。不過,雖然這可能不是第一次,但你可能會在練習幾次之後才能掌握它。

共享很簡單,功能類似於Google Drive,因此您不必再次習慣它,因為您可能擁有相同的體驗。訪問級別的控制也類似:您可以通過電子郵件或可共享鏈接發送邀請來訪問報告或報告文件夾,並選擇授予僅查看或允許編輯的許可權。

但是,請注意,整體功能仍然有限。尤其是,您不會發現任何支持豐富的報告交互功能,例如讓用戶鑽取數據的某些部分,或者點擊並聚焦視覺效果突出顯示他們想要查看的部分。此外,自定義視覺效果的能力很窄,因為您只能捏住一些設置。最後,計算僅提供大約50個函數,與其他BI工具相比,這是一個很小的選擇。

定價

Google Data Studio是免費發布的。 最初,在推出Data Studio時,每個用戶只有5個報告的限制,但從2017年2月起,此欄已被解除,現在用戶可以無限制地使用該工具。

&-->

總結

所有可視化BI平台都有自己的優點和缺點,適合業務的才是最好的,希望這樣的選型對大家有幫助!


不建議使用開源工具,開發慢,後期還需要專人維護,穩定性得不到保障,關鍵以後需求多了簡直是給自己埋坑。

部門內部使用完全可以上自助式BI。像FineBI、Tableau、PowerBI都是不錯的推薦。

比如FineBI(www.finebi.com),上手簡單,學習成本比較低。從數據連接——數據源選擇——數據處理/可視化ETL——前端OLAP分析——可視化Dashboard——報表分發,郵件推送。

&-->

&-->


推薦閱讀:

TAG:數據挖掘 | 數據分析 | 商業智能BI |