如何確保數據與工業AI系統之間的契合? 二維碼
20
這是麥肯錫最近一份報告的呼吁,該報告提出了控制大數據的建議,以確保他們的人工智能系統在正確的時間提供正確的見解。 “重工業領域的許多公司花了數年時間構建和存儲大數據,但尚未釋放其全部價值,”由Jay Agarwal領導的麥肯錫分析師團隊報道。 麥肯錫估計,超過75%的工業企業已經試行了某種形式的人工智能,但只有不到15%的公司實現了有意義的、可擴展的影響。這是因為對于被引導到這些人工智能系統的數據沒有足夠的運營洞察力或監督。 工廠AI成功的關鍵是可靠的歷史數據的可用性,或者被稱之為“智能數據”。這些數據需要“將他們的大數據調整成一種適合人工智能的形式,通常具有更少的變量,并且具有智能的,基于**原理的特征工程”。 他們估計,通過重新設計智能數據,并引入適當的培訓,企業可以將回報提高5%至15%。 ![]() 麥肯錫團隊建議采取以下6個步驟來確保數據與工業AI系統之間的契合: 界定過程。 與專家和工廠工程師一起概述工藝步驟,勾勒出物理變化(如研磨和加熱)和化學變化(如氧化和聚合)。識別關鍵傳感器和儀器,以及它們的維護日期、限制、測量單位以及它們是否可以被控制。 豐富數據。原始過程數據幾乎總是包含缺陷。因此,創建高質量的數據集應該是重點,而不是爭取**數量的可觀察量進行訓練。團隊應積極刪除非穩態信息,例如設備的升和降,以及來自不相關工廠配置或操作制度的數據。 降低維度。AI算法通過將輸出(稱為可觀察量)與一組輸入(稱為特征)匹配來構建模型,這些輸入由原始傳感器數據或其派生組成。當與現代工廠中可用的大量傳感器相結合時,這就會產生大量的觀測數據。 團隊應該削減特征列表,僅包括那些描述物理過程的輸入,然后應用確定性方程來創建智能組合傳感器信息的特征,例如結合質量和流量以產生密度。 將機器學習集中在手頭的流程上。總體而言,重點應放在創建推動工廠改進的模型上,而不是調整模型以實現最高的預測準確性。團隊應該記住,過程數據自然會表現出高度的相關性。 在某些情況下,模型性能可能看起來非常出色,但隔離因果成分和可控變量比僅依靠相關性更重要。 實施和驗證模型。 團隊應通過檢查重要特征,與專家一起不斷審查模型結果,以確保它們與物理過程相匹配。 組件一個高效團隊。 沒有足夠的過程專家,以發起和驗證將填充AI系統的適當數據,這是一個亟待解決的領域。在重工業中部署人工智能需要由操作員、數據科學家、自動化工程師和流程專家組成的跨職能團隊。 我們經常發現企業希望在數據科學方面有所部署,但他們往往面臨著關于過程專家的三個主要挑戰: · 在特定設施或整個企業缺乏過程專業知識; · 有足夠的過程專家,但他們對現代數字化或分析工具感到不適應; · 或者過程專家不知道如何在數字化團隊中有效地工作。 |