下世代連網系統的人工智慧
下世代網路將能針對商業意圖以近乎自主性地偵測、計算、學習、推理並採取行動,並且管理因不斷增加的連網智慧裝置所產生的巨量資料。人工智慧 (AI) 在實現自動化、管理複雜性和可擴充性,以及即時利用分散式系統中的數據上扮演關鍵角色。本白皮書反映了研發人員社群亟需解決的技術挑戰,以便協助電信營運商(Communication service provider, CSP)和其他業者充分發揮 AI 的潛力。
簡介
結合數十億台連網裝置、千兆級(Petascale)計算、以及能提供即時互動的先進通訊功能,創造了一種規模和複雜程度遠超出人類理解和控制能力的系統。這些系統的管理和運作需要極高程度的智慧自動化。
規模的成長及大量的互動雖然造成系統複雜度增加,但其優勢是能從系統各部分蒐集大量數據。這些數據可輸入至模型並應用於方法中,藉以獲取深入洞察及優化並量身打造系統的行為。最後,系統能夠從這些行為的結果中學習。
我們深信機器學習、機器推理和 AI 領域的其他科技能為管理複雜的、和優化系統效能所需的高度自動化提供最佳機會。而誠如我們所見,有些工作像是第三代合作夥伴計畫(3GPP)和開放式無線接取網(O-RAN)聯盟等標準開發組織已經開始支持 AI 計畫。不過,若要充分利用 AI 的潛力,我們必須先克服本篇白皮書中提到的五大技術挑戰。
產業智慧網路
雖然AI勢必將在各產業的下世代系統自動化中扮演關鍵角色,但在提高電信網路自主性的層級上又特別重要,而這也會帶動其他產業,像是製造業和運輸業的轉型。
零接觸認知網路
全球電信營運商都正在建設第五代 3GPP 行動網路(亦即 5G ),並且為下世代網路做好準備,也就是能近乎自主地針對商業意圖(intent)進行偵測、計算、學習、推理並採取行動,邁向零接觸的認知網路。在未來,網路將能管理因日益增加的連網智慧裝置、網路邊緣運算、雲端應用的新興使用案例所產生的巨量資料,以及複雜的網路拓樸。但這也會對網路運作、設計和推出的複雜性、可擴充性、可靠性等領域帶來新的挑戰1。以過往而言,行動網路由電信專家設計與管理,非常仰賴專家於網路拓樸、用戶的移動性和使用模式,以及無線傳播模型等的廣泛知識來設計和配置編排網路的政策。而 5G 由於基地台較小且無線電技術較先進的關係,拓樸亦更加複雜。使用模式已較難以靠人類來預測,且無線電傳播模型也因為新的無線電頻段和更縝密的拓樸結構而較難運算。因此,AI 對於協助電信營運商佈局與營運 5G 網路至關重要。為實現認知網路的零接觸典範,並在複雜的相依性和廣泛網域中以自動化的方式推理並決策,AI 勢必成為網路中更加不可或缺的一環。
行動網路是高度分散和去中心化的系統。如圖 1 所示,在網路架構中增加 AI 功能以支援各種目的下的數據處理,包括局部(接近數據建立的地方)和集中處理(可整合數據的地方 )。局部學習和決策於分散式站點進行,而數據和知識則跨站點混合,藉此全盤了解全域性的網路、服務及功能。
每個局部站點都是豐富的數據來源,包含不同的元件狀態、事件的時間序以及相關脈絡資訊等等。這些資訊可用於建立局部行為模型,但也需要透過推理來處理跨站點所蒐集到的知識,以獲得全系統的洞察。理想上,一個站點獲得的知識和洞察可用於其他站點以優化預測能力。隨著網路基礎建設不斷發展,透過可程式化的數據可滿足對即時反應能力日益增長的需求,這些數據可用於處理大量、快速和各式各樣的即時數據,和可以做出即時決策的演算法。
有越來越多的智慧功能被導入網路和服務以及業務流程,將會實現更高程度的自動化、性能和效率。隨著自動化的程度提升,電信營運商管理網路的角色也將變成透過意圖及監督自動化去引導網路,讓一切在控制之中。各項服務都可以客製智慧功能,使其能以更有韌性、更可靠且更安全的方式運作,並將行動網路提升至嶄新的創新標準,造福產業和社會2。
連網自動化產業
工業 4.0 轉型正在全面進行中。由連網生產單元和項目所產生的資料帶來前所未及的效率和彈性,異常檢測和根本原因分析可用來解決瓶頸並提高產量,演算法帶來的洞見則有助於計畫性維護並提高自動化程度。
5G 行動系統也正在根據產業的不同要求進行設計,並將支援具高可靠性的限制延遲,進一步帶動轉型3。舉例來說,過去在工廠廠區使用的耐用裝置中的個別生產單元控制邏輯,可透過 5G 連線從本地 IT 基礎設施中卸載,成為工廠營運上不可或缺的一部分。
從裝置卸載軟體將會提升無線連網的彈性及效率,並減少軟體裝置管理的需求。無人搬運車(AGV)、以及協作機器人等由邊緣雲端基礎設施所控制的行動連網單元,可在雲端 AI 的協助下,即時帶動複雜的自動化生產。另一個例子是無線 AR/VR 裝置的引進,專家可遠端協助當地維護作業,更可以透過觸覺回饋來控制精密操作。此外,軟體自裝置卸載後,電池除了續航力增加之外,使用者也可以享受更強大的 AR/VR 應用。
雖然 AI有助於產業的連結與自動化 ,為破壞性創新帶來機會,但同時也面臨諸多挑戰:數據多為異質且分散的,且對即時自動化決策的要求也非常嚴苛。此外,很多案例中對於安全關鍵性(大多出現在人機協作階段)有非常高標準的要求,這也大幅增加了其複雜性。
汽車和運輸業
汽車和運輸業的進步帶動車輛自動化程度的提升,並且涉及不同的目的,像是人員和貨物的運輸,或是公共設施和基礎設施的管理;以及不同的操作範圍,包括從限制的控制環境(例如:港口、礦場、城市)到公共道路的廣泛區域不等。
連線能力可根據時間和地理範圍扮演不同的角色。從個別車輛的角度來看,即時資料分享可提升情境察覺能力,且能與其他車輛互動、達成共識。此外,基於(邊緣 )雲端的 AI 實例則能處理來自道路基礎設施和車外感測器的即時資料,藉此監督和擴充透過車載感測器所達成的車輛功能。此外,車輛產生的大量感測器數據亦可集中利用(也許透過離線方式 ),以持續改善操作安全和效率。
連線能力和數據分析對於系統層級的流量優化亦至關重要,而根據優化類型需要不同地理和時間範圍,包含從局部流量調整以適應當地突發事件,到長期流量優化。所有優化皆受惠於物聯網生態系統中持續增加的即時資料可用性,以及有關連結性、移動性和基礎設施狀態的跨領域洞見。
安全顯然是汽車和運輸業的首要疑慮。雖然車載感測器在確保公路安全上仍至關重要,但中央分析和連線能力也開始在受限區域的車輛安全操作、公共道路上的車輛和系統效能上扮演關鍵角色。基於 AI 的網路、車外感應器和系統效能的可預測性將成為自駕車操作的重要元素,而自動化在即時辨識和排除系統各級錯誤上更是不可或缺。本質上而言,車輛安全設計將考慮網路和基於雲端的功能,而以數據為基礎的方法將成為解決方案的一部分,讓系統實現設計保障安全(safe-by-design )。
我們都知道 AI 可應用於許多產業的大部分營運上,且透過智慧和適性自動化(adaptive automation)可協助提高效率。上述介紹的應用說明大型產業中連線能力和 AI 的幾個面向。
解決挑戰
我們必須解決五大挑戰,才能確保 AI 可作為即時或近乎同步的複雜系統自動化運作的智慧方案,而這更需要紮實的領域知識並深度了解底層連結性和通訊面向。
能自主決策的系統
零接觸運作代表降低人為參與、提升網路自主程度,以應對系統持續提升的規模和複雜性,及縮短決策時間。零接觸運作其中一項關鍵因素在於適性自動化,也就是在沒有人為干涉的情況下,即可解決意外情況、意圖和要求。
無論是由人類做出決策再由機器執行,或是僅由機器做出決策的網路操作轉型,都代表這些機器必須理解感知的情況,也就是與現有的背景知識相關聯。我們需要賦予機器更多自主性,從命令式(做什麼)轉變為陳述式(要達成什麼)的客觀規格,並提供機器產生相關領域知識的方法。我們稱這種陳述式客觀規格為意圖。意圖可以表達功能性、非功能性和操作性目標、限制和要求4。
知識密集型系統利用形式模型詮釋感知到的情況,並根據自主決策執行動作。這種模型可透過不同方法取得,包括透過機器學習方法從資料中學習、由領域專家提供、或在邏輯推理時透過搜尋自動發現。
只依據所有可用資料訓練而得的傳統資料科學方法有幾個缺點。首先,傳統方法可能無法擴充,但是狀態向量可包含大量特徵,且推理期間訓練的潛在情況組合可能是無數的,因此不可行。其次,此方法無法處理意外情況,因為沒有提供訓練資料。相反地,我們需要將問題劃分為子問題,並使用所謂基於代理人 (agent-based) 的方式來編排各種更具體的方法。代理人可以是傳統的機器學習元件、分析模型、專家規則等,而代理人的編排則由持續性的優化迴圈驅動,此迴圈會試圖根據系統對網路狀態的理解排除目前和期望(由意圖指定)狀態間的差距。
我們認為混合方法有助於下世代智慧系統,複雜模型的穩健學習將與提供知識表徵、推理和說明機制的符號邏輯結合。知識可以是像是普世物理定律或是特定領域最知名的方法。
智慧系統必須具備自主決策、達成既定目標的能力,且能穩定地以多種方式解決問題,以及利用各種預填和習得的知識作決策的彈性。
分散式與去中心化智慧
在大型分散式系統中,決策會由不同位置和層級做出。有些決策取自局部資料,並由低延遲和緊密的控制迴圈管理;其他更具策略性質的決策則會奠基在多種來源所蒐集到的資料,並全域性地影響整個系統。較高層級的全域決策也可能需要在電網故障、連鎖節點故障等關鍵情形做出即時回應。要讓如此大型且複雜的系統自動化的智慧,必須反映其分散式特性並能幫助管理拓樸。
在邊緣、裝置內或網路邊緣節點內產生的數據有時需要當場處理。將數據傳輸至雲端中心的作法有時並不可行,這可能是受到有法律規定數據可以儲存的位置,以及資料傳輸的隱私或安全的影響。在這些情況下,決策的規模便限制在小範圍內,因此需要快速且輕巧的演算法和運算能力。不過,局部模型可能因為不完整和偏差的統計數據而受到影響,進而導致效能損失。這部分需要善用分散式的規模,適當抽象化局部模型,並將獲得的洞見轉移至其他局部模型。
透過多個連網裝置或節點也能在不存取實際資料的狀況下了解全域數據模式。聯盟式學習(federated learning)亦發展出垂直聯盟式學習或分割式學習(split learning)等多種分散式訓練模式。這些新架構讓機器學習模型得以調整其部署,藉以滿足數據傳輸或運算、記憶體和網路資源消耗等要求,同時維持出色的效能。不過在滿足不同類型模型和模型組合,以及更強大的隱私保護方面仍需要更多研究。
為了充分利用局部和全域數據及模型,需要通用的分散式和去中心化典範,並決定如何透過跨節點分散學習和推理以滿足對延遲性的極度要求。這種典範可透過機器學習和其他 AI 技術建立,並結合自我管理、自我優化和自我演化的特徵。
可信賴的人工智慧
AI 的自治系統包括複雜的模型和演算法,這些模型會在無人為干涉的情況下隨時間發展出新的數據和知識。對於數據的相依性、演算法的複雜性,以及 AI 系統出現意外緊急行為的可能性,則需要新方法來保障其透明度、可解釋性、技術穩健性和安全性、隱私和數據治理、反歧視和公平性、人類自主性和監控 ,以及對社會和環境福祉和問責等等。這些要素對於確保人類能夠理解並信任AI 系統的校準至關重要 5。
可解釋人工智慧(Explainable AI, XAI)是 以AI 的系統透明度為基準,為利益關係人解釋 AI 演算法為何以及如何做出特定決策的系統。這些方法適用於多種 AI 技術,如監督學習、強化學習(RL )、機器推理等5。XAI 被認為是可協助系統實際建置 AI 模型、滿足 AI 使用者與 AI 決策相關基本權利的關鍵功能,包括ETSI 和 IEEE 等標準化機構皆強調需將 XAI 應用至智慧通訊系統的可信賴性中。
AI 模型演進的本質需要不斷更新或擴充既有方法,才能確保 AI 模型在現實世界訓練和部署期間的穩定性和安全性。除了以抗欺強韌性(adversarial robustness)提供的統計保證外,形式驗證技術還能客製化以確保AI 系統的安全關鍵性。安全性有助於穩健性的建立,讓數據和模型都受到保護,免於惡意攻擊。數據的隱私,即來源和預期用途,都必須受到保護,模型本身也不得洩露隱私資訊。此外,數據在公平性和網域期望方面應先經過驗證,因為這可能會使 AI 作出帶有偏見的決策。
由於 AI 系統的利益關係人終究是人類,因此需要開發像是基於因果推理和資料溯源方法的決策問責制。系統應設計為能持續學習和完善其設置,以達到利益關係人的要求,並在對特定決策沒有足夠信心時能升級至更高層級的自動化決策,最終到達人類標準。
人機協作
從虛擬助理到協作機器人(cobot ),越來越多類型的連網智慧機器開始出現在我們的生活中6。要達成協作的目的,機器必須準確了解人類的需求和意圖。此外,與這些機器相關的所有數據都應可用於情境察覺。AI 在整個流程中是強化人機協作能力的根本。
自然語言處理和電腦視覺的進步讓機器能更準確地詮釋人類的輸入,像是透過非語言溝通,例如肢體語言和語氣等來準確檢測情緒的能力正在發展中,且能支援辨識像是疲勞和分心等更複雜的行為。此外,進一步發展場景理解和語意資訊擷取等能力對於具備完整的環境知識表徵而言非常重要(詳見圖 3 )。機器應使用所有感知資訊來判定能最佳化協作效果的行動。根據目前狀態和對環境的觀察來訓練政策以採取最佳行動的強化學習,也開始獲得越來越多的關注6。為避免不安全的情況發生,目前像安全 AI 等策略也持續研究中,藉以確保強化學習模型生命週期的安全性。強化學習的詳細資訊將在下一部份介紹。
在數位分身的協助下,AI 可更全面地了解機器的運作方式,人類亦可更加認識機器的運作,並有助於人類預測AI的行為。有越來越多的延展實境(XR)裝置藉由將機器的詳細數據視覺化,應用於混合實境場景中。藉由結合XR 介面,XAI可用於解釋機器做出特定決定的理由。
為了達到人機協作的可能,機器能即時回應並與人類互動也十分重要。由於協作設置中涉及的 AI 方法可能需要非常複雜的運算,且機器硬體資源可能有限,因此需要分散式智慧解決方案來實現即時回應。這代表通訊基礎設施將透過支援可靠的低延遲通訊網路,在整個過程中扮演關鍵角色。
具產業規模的遊戲和仿真
強化學習是一種機器學習技術,利用數據驅動方法中的經驗訓練決策模型來達成。強化學習代理人會透過在環境中採取行動來學習,既善用其目前的知識,又能透過隨機行動來探索環境並獲得新知識。使用由此類行動所得到的結果,例如獎勵,將使強化學習機器代理人會更新其策略,目標是盡可能地將累積獎勵最大化
在虛擬環境中應用強化學習機器的一項關鍵成功因素是訓練機器代理人相互競爭、並探索能替代行動的範圍。這方面需要更多研究,才能釐清如何充分利用強化學習和其他先進演算法的優勢,並根據工業環境和限制以客製化其需求。有一種途徑是發展安全的探索策略,並在受到控制且安全的方式下探索環境:例如,透過辨識資料模型階段(state-action regions)或切片(temporal slices ),並將探索限制於該範圍內。另一個選項是在虛擬環境(像是模擬器或仿真器 7)中預先訓練代理人,代理人便可無限制地探索。這需要建立一種叫Sim2Real的原則方法,以將數據轉移至真實環境中。Sim2Real 近期兩種作法分別為領域隨機化(domain randomization)和領域自適應(domain adaptation)。領域隨機化為隨機化模擬參數以進行廣義訓練,而領域自適應的模擬訓練的模型則較接近真實的領域。第三個選擇是離線強化學習,代理人會從靜態資料集中學習。資料集應包括每日策略所產生的狀態、行動和獎勵軌跡。由於代理人無法與靜態資料集互動,因此訓練的一大挑戰便是避免強化學習導向涵蓋有限和偏頗知識的資料集。
不過對包括電信網路在內的工業系統來說,在系統運作時探索所有行動有時並不可行,因為不理想的的行動和狀態的組合可能會導致效能下降。隨著更多研究聚焦在這些並非互斥而是互補的技術上,我們相信AI探索面臨的挑戰將可獲得解決,且強化學習的潛在力量將能成功應用於工業系統中。
結論
根據我們對未來智慧行動網路和產業自動化持續發展的看法,本篇白皮書重點介紹了我們認為必須解決的五大技術挑戰,以充分利用 AI 科技的潛力。這些挑戰包括:
- 能自主決策的系統
- 分散式與去中心化智慧
- 可信賴的人工智慧
- 人機協作
- 具產業規模的遊戲和仿真
我們相信要解決這些挑戰最好透過奠基於強大領域知識的方法,包括對基礎連結或通訊面向的深度認識等。我們正在努力解決這些挑戰,也鼓勵整個研發社群一起加入,共同尋找解答。