海闊憑魚躍：記一場工業場景下的AI技術實踐

01-30

本文由【AI前線】原創，原文鏈接：http://t.cn/RHoI2Rc

作者｜朱武

編輯｜Emily

AI 前線導讀：「相比如火如荼的消費級人工智慧，AI 技術在工業和製造業的發展與落地卻顯得不溫不火。工業智能雖隸屬於弱人工智慧，但在某種程度上，其高度的「自治性」與「獨立性」應被施以更多關注。例如，工業機器人通常被設計用來執行特定的細分任務，而現代機器人則被授予了新的使命：做出實時決策。

在採訪今天的主角——天澤智雲首席架構師朱武 前，工業智能、虛擬智能體、工業互聯網等概念彷佛如盤根錯節般難以被釋清，這同時也反映了工業智能背後的技術發展成為我們關注的空白區之一。於是，帶著對工業場景的機理、工業智能背後的數據提取、建模、訓練等技術挑戰、智能決策系統技術架構的疑問，我們開啟了這次好奇心之旅。」

開篇：為工業智能正義

還記得在《機器之心》中，作者雷?庫茲韋爾闡述了一幕大膽的預測：未來的世界，人類和機器將難分彼此，人類將不再是萬物之靈。

如果將人工智慧應用看作最終呈現的產品，那麼決定「產品質量」各項要素的五個方面則形成工業智能的五要素模型——「人機料法環」。在舊有理解中，人作為活動第一驅動力而存在，與其他四要素並不同屬一個範疇內。但在工業智能實施的情況下，生產組織方式發生了變化：

朱武解釋說：「在這個模型中，活動作為一個虛擬的智能體，人在活動中的重要性弱化，活動的第一驅動力來自於反應活動的數據（知識）。這是智能在工業上應用所帶來的最大變化和意義所在。」雖然從目前技術發展角度來說，絕大多數工業場景應用還達不到這種完全虛擬、完全智能的程度，但朱武強調，生產組織方式變化對應著智能應用方向的革新，從而直接影響了分析、創建系統的方法和流程。

而說到這裡，我們並非想強調假大空的概念。定義工業場景的機理對於構建活動虛擬智能實體具有非常重要的基礎作用。

可以看到，國內目前並不乏為工業領域提供 AI 解決方案的企業，林林總總包含了大數據公司、雲計算廠商等同胞，但可能多半並不能清晰地定義工業場景的問題域，或很難從特定知識和數據維度進行工業場景分析。

比如用戶需要對生產線進行優化，那就需要對具體產線進行分析，影響產線的主要是設備問題、工藝問題、還是人員問題？這是界定問題域的過程；再比如確定了問題是預測齒輪箱的故障，那就需要知道齒輪箱的構造、運轉方式及工況，故障模式和相應的故障現象，這是為分析問題所涉及的實體對象的領域知識。

總結來說，工業場景的機理定義需要依賴於合理層次和顆粒度的問題定義，獲得相關性的數據集，最終形成問題到數據集再到特徵的映射。

但同時，目前的工業智能還處在初級階段，大部分場景下還做不到完全智能化，但只要具備活動優化、自適應等特點的系統，都可以屬於工業智能應用的範疇。

黃沙百戰穿金甲——工業智能實現背後的技術挑戰

問題域的確定和分析方法等眾多環節的聯結，會導致工業智能實現上所面臨的技術挑戰或遠高於消費級人工智慧所對應的難題。

例如，在 2015 年通用電氣（General Electric）推出 GE Digital 時，GE Digital 的 CTO Harel Kodesh 就提出過：工業數據不準確、工業智能對風險控制和響應能力的高要求、終端處理能力的限制、複雜模型必須被解釋等顯示了工業智能與消費人工智慧的重要區別，這也導致了在數據、演算法和模型訓練上工業智能所要開闢的一些「新領域」。

在採訪中，朱武為我們解釋了數據特徵提取、建模等層面的技術挑戰：

工業數據的多源性、複雜性和動態性強，比如柴油機氣缸排氣溫度，取決於燃油、燃燒、進氣溫度、封閉性等等，因此，特徵提取要求在高背景雜訊下必須實現準確且快速的降維。另外，在數據建模及訓練層面，工業應用的碎片化、個性化以及結果的專業性，需要建模及訓練在整體和個體、通用性和個性化之間取得均衡。

那麼，實現人工智慧所依賴的關鍵技術多如牛毛，數據感知、大數據、機器學習、自動控制、模擬等該怎樣地更好應用在工業智能中呢？朱武認為，從工程實現的角度，工業智能實現的關鍵有如下幾步：

定義工業場景：正如上文所提及，問題域所涉及工業場景定義的準確性和完備性決定了該問題在多大程度上被解決的可能性；
數據的完備性和質量：工業現場數據一般帶有很多雜訊，而數據範圍和質量決定了後續處理的難易程度和最終結果的準確性；
智能應用支撐環境：工業智能應用本身就具備碎片化、個性化、專業化的特點，如何提供快速有效的應用實施環境，包括數據環境、模型研發實驗環境、應用部署環境等，決定了工業智能應用的推廣和客戶接受速度。

美國早在 2006 年提出了 Cyber-Physical System（CPS）, 也就是「信息 - 物理系統」的概念，並將此項技術體系作為新一代技術革命的突破點。

依照美國 NSF 智能維護系統中心創始主任李傑教授、天澤智雲 CTO 劉宗長共同發表的《工業大數據：挖掘「不可見世界」中的價值》一文中的闡述，CPS 是一個具有清晰架構和使用流程的技術體系，針對工業大數據的特點和分析要求所構擬的技術體系，其能夠實現對數據進行收集、匯總、解析、排序、分析等全套處理流程，實現對工業數據進行流水線式的實時分析能力，並在分析過程中充分考慮機理邏輯、流程關係、活動目標、商業活動等特徵和要求。因此可作為工業大數據分析中的智能化體系的核心。

CPS 的 5C 架構

於是，智能決策系統孕育了

在朱武看來，雖然 CPS 帶有模擬環境的屬性，但其很大程度上具備了智能性，「在工業場景下，很多細節需要機器或系統具備自動學習與調整的能力」。此外，CPS 內含協作概念，是實體虛擬空間的映射，並且使得實體設備與虛擬設備之間形成關聯性和相互影響——朱武稱之為自協作。

而工業智能機理的特定性、工業智能應用實施速度的提升（避免演算法選型、數據診斷處理的大量耗時）以及標準化其實施和方法的需求，使得智能決策系統的研發和上線成為必要，天澤智雲工業智能決策系統的誕生也是基於這樣的背景：

為將工業領域知識模板化：朱武強調，工業智能的決策分析比較依賴於工業相關的領域知識、計算機科學和智能建模技術，但同時具備這三個方向知識的人員較少，於是將工業領域知識模板化將成為必然，從而降低實施工業智能的難度；
縮短工業智能應用研發和部署的周期：工業智能應用講究快速反應的能力，實施速度的提升，如果在一套系統中像演算法、軟體實施、系統實施這類的技術層可以公用，那麼可以大大縮減開發時長。
因而天澤智雲就讓智能決策系統提供數據接入、數據存儲、模型發布和應用發布的功能支持，基本分離計算機科學和數據科學，從而數據科學家可以專註模型開發；
支持構建標準化的解決方案：朱武分析說，目前對於不同行業有定製化需求的不同企業，由於數據環境、數據質量及業務應用的複雜程度不同，從定義模型到應用的部署實施是需要 2-3 個月的周期，遇到新的應用場景則會耗費 3-4 個月。工業場景的不確定性太多，因而在智能決策系統中設定支持相關方法如特徵提取、數據處理、場景定義等實施顯得十分必要，一個標準化的實施方法和解決方案可以推動整個行業的發展，從而擺脫工業智能初級階段「獨樂樂」的窘境。

目前，CPS 的 5C（智能感知層、信息挖掘層、網路層、認知層和配置執行層）在智能決策系統中有這些對應實現：

對於智能感知層：智能決策系統通過邊緣計算端點支持現場數據的接入；
對於信息挖掘層：支持任務化的數據遷移，支持各種數據源的動態接入和掛載；
對於網路層：提供基於實體語義的數據訪問；
對於認知層：支持演算法和模型的測試、試運行和發布；
對於配置層：支持各種業務服務的集成。

但同時，朱武也坦言，受制於現階段國內工業智能發展的局限性及各場景間的零碎性，再加上 CPS 體系的複雜性，目前的智能決策系統都不能稱之為 CPS 的全部實現。

智能決策系統如何用技術實現智能決策？

由於受工業環境不同種使用場景的約束，天澤智雲會根據部署環境和業務場景的不同採用差異化的技術實施手段，因而，智能決策系統的技術架構也需要根據特定情境來調整。下圖是天澤智雲智能決策系統頂層功能架構圖的全貌：

天澤智雲智能決策系統功能架構

從功能架構圖中可以看到，智能決策系統分成了數據分析與設計、計算環境、CPS 協作集成引擎、服務環境、數據接入、數據持久化及業務應用 APP 等多個模塊。

朱武補充道，拋開功能架構不談，智能決策系統的技術架構設計需重點考量三點：

關注技術的可替代性。因為新技術的不斷迭代、專為工業場景定製的 IT 通用解決方案的缺失以及各家使用技術棧的不同，決定了架構設計上不應做到高技術耦合性。
實現 CPS 概念的映射。從數據組織、服務組織層面上看，朱武認為應使整體的決策系統體現出動態協同或自組織概念。
將計算環境與服務拆開。朱武解釋，拆開的原因是想體現兩種不同性質服務的概念。一般的服務環境並發性是橫向擴展的，但計算環境中的服務執行在擴展性和並發性上體現的策略不同，另外再加上演算法間的強依賴性，因而導致必須將計算環境與服務環境區隔開來。以實現風場風功率預測功能為例，其實現如下圖所示：

整個結構分為對外的基於功能切面的服務與內部基於虛擬實體資源組織實現。在外部請求時，首先通過 API 網關，基於服務註冊與發現，查詢與定位服務，當風功率預測服務未啟動時，服務註冊與發現通知服務調度，服務調度創建並啟動風功率預測服務。風功率預測將具體功能，如風場總輸出功率預測、單風機輸出功率預測等，請求各自的虛擬實體資源。虛擬實體資源，可以視為具備對外提供數據能力的虛擬化設備，該虛擬設備從邏輯上組織相應的數據接入、基於數據持久化的數據集、相應的計算任務，同時，可按照用戶定義的策略，結合數據接入的實時狀態數據，自動執行、管理其行為。

智能決策系統中的高並發和高可用問題

工業場景中，數據質量、數據全面性和數據精準性問題是很多企業的「燙手山芋」，「利用數據建模的手段解決某一問題時，需要獲取與被分析對象相關的全面參數」，這也使得智能決策系統的計算環境一環需要面臨高並發和高可用的挑戰。

當然，需要澄清的一點是，這裡指的高並發和高可用與傳統意義上的意思有所區分。按照朱武的解釋，工業智能的運行場景一旦場景明確化之後，並發量的大小是可以提前預知且明確的，所以高並發的嚴格指代是——考慮在不同業務場景下不同的負載該如何設置，如何優化調度策略和服務組織，使得單個應用實例跑的更好，從而解決資源的高效利用。
同樣，高可用通常指通過設計減少系統不能提供服務的時間。但工業智能計算環境中由於演算法裝載等問題，導致無法全然斷定服務出錯的時間，或實現對服務有效性的精準判斷。

工業場景，解決高並發問題實質是提升效率，而提高效率的關鍵點之一即實現數據的內聚性。 智能決策系統除了常見的設計策略外，根據工業場景的特點，朱武團隊採用了數據區塊化的設計方式：

工業智能應用一般是按照實體對象去採集、存儲和訪問數據，因此數據具備局部化特性。

朱武解釋說，對於採集數據，通常情況下是在用分散式緩存 Redis 前用哈希映射到某一數據節點，並且最好使可執行節點和數據在同一個本機上，實現同樣的機制映射，同時再設置相對合適時間閾值，這樣就可以做到更好的分配。

另外，還可通過資源抽象的方式解決高可用問題，即讓運行資源和運行實體分離來，動態按照需求調配運行資源。

該環節實際上可理解為計算節點重複利用問題，盡量讓計算節點按照實際需求而分布。例如，請求接入後可從資源管理中獲得資源空閑結果，採用調度策略找到相對應的節點，從而直接與計算節點建立關聯。執行過程中，還可通過服務監控和靈活調度及時發現問題。

因此，在智能決策系統中，計算環境作為提供演算法、模型的管理、運行和調度平台，（從業務場景來看）需要具備如下特性：

演算法、模型依賴於不同的運行環境和組件包，集成時的形式存在多種形式，因此 計算環境需具備不同編程語言與框架的演算法、模型集成能力；
計算環境應採用特定的演算法、模型狀態管理機制，用於服務治理。 對一部分演算法、模型的執行，不太適用時間閾值的方式；
演算法、模型執行效率，涉及演算法、模型間的數據共享和協作，以及演算法、模型內部中間結果的傳遞策略；
計算環境需要部署在不同的運行環境中，要求 計算環境能夠根據實際需求伸縮和選擇性部署的能力。

數據接入實現了現場數據、系統邊界外數據接入系統的能力，根據工業數據應用的特點，數據接入需要具備如下特性：

多種協議集成和採集策略的實施：IoT 在接入數據層會有各種各樣的協議，因此需要將不同的協議進行集成。另外就是採集策略也是千變萬化，但要想推進標準化和品牌化就會使得很多採集策略失效，因而目前的解決方案也只能靠人工解決。
多種時效性數據的雙向傳輸： 在天澤智雲目前的業務場景中，有上傳和下傳兩種時效性傳輸。上傳涉及到狀態數據、振動產生的文件或數據集等，下傳數據包括指令數據和更新。
錯峰控制： 在上傳和下傳實時數據時，可能會遇到數據積累和堵塞情況。底層傳輸機制的實現在部分 IoT 組件上並未最大程度上優化實時性。因此，業界有用到組態軟體來解決該類問題的方案。但組態本身來講是組織態勢，組態軟體是指可配置、可調整的軟體系統，並不指實時性。所以數據接入的時候，很容易會面臨 物理上同一個鏈路的競爭，所以需要適當控制。

此外，數據接入還面臨到不穩定狀態下的數據可靠傳輸、數據預處理（包括質量過濾）、實體信息和背景信息融合等多維度的技術挑戰。

以智能風場的能量管理系統為例，其需要的數據接入如下圖：

從上圖可以看出，其數據來源、數據鏈路、數據通信協議及時效性、安全性約束的多樣性。目前，天澤智雲是軟硬結合來解決和完成數據接入的問題。通過邊緣計算、工業物聯網網關、PLC/SCADA 這些硬體設施解決部分接入，在軟體層面通過通信代理、匯流排技術解決另一部分數據接入。總的來說，還是亟需行業和政策的共同推動，從根源上統一技術棧，實現智能接入的真正落地。

如何將人才真正「適配」到工業智能中

在採訪過程中，朱武與我們多次談到了工業場景機理的特殊性和差異性，二者決定著工業智能的推動不僅需要從業人才具備數據、演算法等技術技能，同時還要面對著各種工業領域新知識的「侵襲」。這就對挑選合適人才、使新晉成員更快獲得成長等方面提出了更多挑戰。

朱武重點闡述了他們的三點培養方法：

一是給予成員清晰的定位，規劃、設定其所處的技術維度，在技術上為其劃分精確的方向和專業，與其共同謀劃好職業成長路線；朱武團隊內部目前沒有採用一帶一的傳統成長計劃，而是通常分三人小組，分配任務時以團隊為單位進行，從而促進其小組內部的技術交流氛圍，讓每個人獲得更快的成長速度。

二是強調技術分享和輪崗制。朱武團隊很鼓勵在某一個技術領域有了一定積澱後，為獲得更充分的應用和解決方法而參與到另一個技術領域的構建中，從而實現技術上的自由轉換。

三是充分信任，做到合理的任務分配。工業智能沒有更多的捷徑和投機取巧的方式實現落地，無論在技術層的突圍還是人才層的吸納，腳踏實地是關鍵。這也是採訪中朱武不斷強調懂工業機理重要性的原因。

採訪嘉賓介紹

朱武，天澤智雲首席架構師，承擔過多項國家重點型號科研項目，擅長工業領域的軟體系統開發、測試和架構設計。曾就職於中國船舶系統工程研究院，主導並實施海軍後勤裝備保障體系信息化建設；作為總架構師與 IMS 共同合作，參與船舶智能運行與維護（SOMS）系統等多個智能化系統的架構設計和實施。

關注後回復「AI」你懂的