了解生成式AI的影響
生成式 AI可能會顯著影響未來的行動網路流量,尤其是透過刺激影片消費和改變上行鏈路需求。
重要洞察
生成式 AI可實現大規模、高度個性化的內容創造,這將推動行動網路流量成長,可能超出目前的基本預測。
隨著生成式AI驅動的影片助手和沉浸式互動應用日益流行,上行和下行流量將顯著成長。
生成式AI的數據壓縮能力可能會被應用於封閉式生態系統,但短期內不太可能影響普通消費者流量。
生成式AI指先進的機器學習模型,它能夠基於從大量數據集中學習到的模型來理解文本、音訊和影片內容。這使它能夠生成出與人類創造的內容幾乎難以區分的新資訊。對上下文的理解還使它能夠對所提供的內容進行分類,進而透過更高效的編碼來展示給使用者。
對電信商來說,了解相較於之前的行動寬頻和擴增實境 (XR)預測,生成式AI 將如何改變流量的規模或特性是尤其重要的。
瞭解生成式 AI
如今,使用者與不同形式的內容進行互動,包括透過耳機聽音訊,通過智慧手機閱讀文本和觀看影片,通過沉浸式XR裝置體驗3D物件和立體環境等。每種形式的內容都受到生成式AI能力的影響,以下是這一領域出現的一些基本模型:生成式對抗網路(Generative Adversarial Networks, GANs)、擴散模型(Diffusion models)、轉換器模型(Transformers)及混合模型。
轉換器模型為推動大型語言模型(LLM)的神經網路架構,如目前的生成式AI聊天機器人。最初設計用於序列數據(如文本),採用一種稱為自注意力 (self-attention) 的機制來捕捉數據中的依賴關係。它們正逐漸被廣泛應用於多媒體任務,包括音訊、圖像和影片生成。而且,它們擅長捕捉「長距離依賴關係」(long-range dependencies),尤其「多模態任務」,如文本到圖像生成展現出強大的效能。
這些技術共同構成了生成式AI的骨幹,逐步增強機器創作圖像、影片、3D物件等方面的能力。對於行動網路來說,重要的一點是要瞭解如圖16所總結的,這些模型可能在哪裡執行。
語義壓縮簡介
生成式 AI 模型還能夠更高效地展示內容,因為它們可以理解上下文。想像一下,你安裝了一個高解析度的安全攝影機,記錄數百萬像素的詳細資訊,捕捉一個人操作機器的畫面。與其嘗試理解每個像素,不如採用另一種方法來描述照片中的特徵,例如頭髮的顏色或操作機器的方式。
這種方法被稱為潛在空間 (latent space),它捨棄確切的像素細節,但透過壓縮數據的方式保存定義物體外觀的基本特徵。生成式模型具有極為強大的推理能力,能夠根據這些壓縮數據,透過合成方式渲染重建,從而降低頻寬需求。
這樣就可以提供更高的解析度或減少每個數據流程所需的頻寬量,在條件有限的情況下啟用新的應用,進而改善用戶體驗。
要大規模為消費者提供此類應用需要一定的處理能力和標準化,可能還需要至少十年才能實現。然而,我們可以在封閉的生態系統中,將語義壓縮應用於3D創建內容、虛擬替身 (avatar)或合成重建(synthetic regeneration)。然而,語義壓縮技術的普及和大規模應用仍充滿不確定性。預計,該技術將成為影片壓縮技術演進的重要一環。
圖16:生成式 AI 模型的複雜性和執行位置
模型類型 | 簡介 | 訓練複雜性 | 推理複雜性 |
---|---|---|---|
生成式對抗網路(GANs) | 生成式對抗網路(Generative Adversarial Networks)是通過兩個神經網路相互博弈的方式進行學習,由一個生成網路與一個判別網路組成。判別網路的輸入為真實樣本或生成網路的輸出,其目的是將生成網路的輸出從真實樣本中盡可能分辨出來。而生成網路則要盡可能地欺騙判別網路。兩個網路相互對抗、不斷調整參數,最終目的是使判別網路無法判斷生成網路的輸出結果是否真實。 | 複雜: 不穩定且不收斂,需要仔細調整;可能在雲端執行。 | 中等: 訓練完成後,推理相對較快;可以在雲端和智慧手機上執行。 |
擴散模型(Diffusion models) | 擴散模型的目標是通過對數據點在潛空間中的擴散方式進行建模,來學習數據集的潛結構。通過學習逆擴散過程訓練神經網絡,使其能對疊加了高斯噪聲的圖像進行去噪,隨著時間的推移產生高品質的樣本。 | 複雜: 計算量大且耗時;可能只能在雲端執行。 | 複雜:推理需要多個步驟;除不太複雜的Gaussian Splatting外,可能在雲端執行。 |
變換器模型(Transformers) | 變換器模型是一種採用注意力機制的深度學習模型來理解資料序列中的關係,從而實現從語言到影像和影片的多種生成任務。 | 複雜: 需要大量數據整合和强大的計算能力;可能只能在雲端執行。 | 低/中等: 需要計算和啟動記憶體;大模型在雲端執行,小模型在裝置上執行。 |
混合模型(Hybrid) | 混合模型結合了多種生成技術(例如結合變換器的生成式對抗網路)的元素,以利用互補的優勢,通常可以提高靈活性、樣本品質或訓練效率。 | 複雜: 雖然可以優化,但訓練通常較複雜,僅在雲端執行。 | 低/中等: 可有效地平衡速度和品質;在雲端和智慧手機上執行。 |
消費者與生成式AI互動的發展趨勢
使用者將越來越多地消費和創造生成式AI內容,並使用智慧手機或XR裝置,來與多模態生成式AI模型互動。最初,這些互動大多由消費者發起;然而4、5年後,也就是2029年前後,預計將會看到愈來愈多 AI 助手代表消費者處理各種事務的場景。
AI助手使用AI代理(AI agents),即使用生成式AI來自主實現特定目標的系統。它們可以協助醫療和教育等產業的客戶,理解和回應使用者的環境。雖然智慧語音助手目前已經很普遍,但生成式AI技術的進步,使影片助手正逐步實現。
大部分流量的增加應歸因於基於影片的生成式AI互動,這主要涉及三個新興領域:
- 首先,傳統的智慧型手機螢幕使用方式將被超個人化內容所取代,用戶將花更多時間在這些內容上。例如,針對特定個體的教育或娛樂內容可以顯著提高參與度和維繫率。
- 其次,使用智慧手機的鏡頭拍攝周圍環境,並向影片大語言模型(LLM)詢問有關沉浸式環境的問題。例如,將鏡頭對準出現故障的汽車引擎並接收逐步維修指示。
- 第三,使用智慧眼鏡或XR裝置與環境進行互動,無論是由用戶發起的按需求互動,還是透過隨時開啟的AI代理監控沉浸式環境。例如,AI助手可以透過智慧眼鏡,使用影片LLM識別盤中的食物並計算其營養價值。此類助手的廣泛使用可能意味著上行流量與目前相比將有所成長。
對於消費者與生成式AI模型之間的互動,市場上將出現許多其他方式,類似於今天與生成式AI聊天機器人的文本互動。然而,這些互動方式預計不會顯著增加流量,因此這裡不做進一步討論。在消費者領域之外,我們預計AI代理與無人機及機器人之間的互動會增加流量。
對行動網路流量的影響
透過評估這些因素,我們可以獲得寶貴的資訊,深入瞭解潛在的流量模式。實際效果將取決於多個因素,如消費者的興趣和產業採納情況,這些因素將在未來幾年變得逐漸明朗。因此,這是一項質性分析,旨在幫助瞭解未來的潛在流量變化趨勢。
就生成式AI工作負載的位置而言,它們大多將在雲端即時執行或進行預渲染,以生成超個人化內容,供使用者在需要時隨時使用。借助複雜程度較低的大型語言模型(LLM),目前在雲端執行、中等複雜程度的一些生成式AI工作負載可能會轉移到智慧手機上。然而,複雜的即時互動可能會以多種方式進行:簡單的子任務在智慧手機上完成、更複雜且有隱私保護需求的任務在私有(邊緣)雲中完成,而高度複雜的任務則在雲端由大型LLM處理。
因此,上行和下行兩個鏈路方向上的流量需求將在4、5年後發生變化。由於超個人化內容的出現,下行流量可能會出現高於預期基準的成長。如果具有生成式AI功能的裝置在大眾市場上得到普及,那麼消費者或AI助手發起的影片串流可能會為上行流量帶來顯著增加。例如,每天僅使用帶有AI影片助手的智慧眼鏡僅一小時,就會顯著增加流量。
如前面所述,新的生成式AI能力可能會抵消預計的流量成長率,例如語義壓縮、裝置內AI驅動的超解析度技術或透過最新的LLM實現的設備本地端搜尋。然而,要在智慧手機中提供如此複雜的生成式AI功能,將需要非常出色的運算能力、記憶體和電池性能。因此,這些技術的普及率將取決於業界開發設備硬體和嵌入式生成式AI模型軟體的產業藍圖。
然而,這些生成式AI功能和更多其他功能可能會催生全新的應用程式,擴展現有的應用程式並改善使用者體驗。因此,生成式可能會由於超個人化內容的使用以及新應用程式的出現,導致整體流量增加。如圖17所示,將來可能出現三個流量變化趨勢:
- 未來趨勢1:儘管成熟市場上的總體流量成長近期有放緩跡象,但由於生成式AI的大規模採用,我們可能會看到流量的持續增加。
- 未來趨勢2:隨著消費者使用生成式AI的加速普及將導致流量穩步增加,超出基線成長速度。
- 未來趨勢3:消費者對生成式AI的採用將出現爆炸式增長,可能與AR眼鏡同步推出,迫使產業考慮更高效的影片壓縮技術,包括引入語義壓縮,作為解決這一問題的可行替代方案(至少適用於部分生成式AI流量)。此外,隨著流量達到飽和,總體流量可能趨於穩定。