人工智能和智能自动化如何助力网络性能提升
Head of Research & Innovation, Cognitive Network Solutions, Business Area Cloud Software & Services
Head of Research & Innovation, Cognitive Network Solutions, Business Area Cloud Software & Services
Head of Research & Innovation, Cognitive Network Solutions, Business Area Cloud Software & Services
信观察
想象一下,网络能够根据时间和地点的需求,自动调整覆盖范围和容量。如果出现故障,网络能够自我诊断和修复,并持续优化性能和服务交付,而不需要人工介入。这并不是遥不可及的梦想——实际上,我们已经在利用我们的人工智能(AI)技术和认知解决方案(如性能优化器(Performance Optimizer))朝着这个目标迈进。我们早在十多年前就开启了人工智能驱动的零接触运维之旅。从那时起,人工智能技术和电信行业都取得了巨大的进步。
随着5G在全球的大规模部署,新的应用场景不断涌现,如物联网(IoT)和扩展现实等,它们对网络基础设施的要求更高,需要低延迟和大数据量。与此同时,运营商(CSP)面临着巨大的挑战,需要在不增加能耗或运营成本的前提下,提供无缝覆盖和优质的客户体验。显而易见,网络自动化对于运营商的未来成功非常重要。然而,要实现全面的移动网络基础设施自动化和优化,需要强大的能力,这就使得人工智能和机器学习(ML)比以往任何时候都更加重要。
我们现在处于哪个阶段?
一般来说,自动化是运营商目前关注的焦点,而人工智能被视为一个重要的工具。大多数电信网络自动化功能仍然使用传统的基于规则的方法来提高性能。但我们看到,传统的无线接入网(RAN)算法正逐渐被人工智能算法强化或取代,人工智能算法能够适应不同的无线条件和环境,并在整个网络中复用。
有三种方式可以将人工智能集成到网络组件中:
- 用人工智能驱动的算法或组件取代现有的基于规则的算法或组件。
- 在现有的基础组件上添加具有新功能的新的人工智能组件。
- 向现有的传统组件添加基于人工智能的控制。
我们已经利用这些方法在网络性能方面取得了显著的成效。我们一直专注于最有可能提高网络性能的RAN。人工智能算法的设计应该始终确保它们能够在最合适的地方执行,并且能够带来真正的价值。
例如,可以设计多个独立和编排的AI算法,让它们协同学习和管理协议层中最相关的RAN操作。传统的RAN协议分层结构仍然可以用来保证根据每个RAN操作所需的时间进行正确的分离。时间尺度是非常关键的指标,因为它们决定了算法需要在多长时间内做出决策——从几毫秒到几周不等。
在合适的地方执行。确保卓越的效率和性能
在某个特定的时间尺度上,我们有快速控制环路,如调度和链路自适应,在这个时间范围内决策可以在本地、自主和非常迅速地做出,而不需要了解整个网络的情况。由于智能化水平的提高,人工智能和机器学习可以提高网络性能,并在快速控制环路中实现零接触自动化或优化任务,同时也让它们能够适应和稳健地部署在不同环境中。这样做还可以大幅减少较慢控制环路中的工作量。
慢控制环路主要包括传统的网络规划、设计、定位和优化等环节。这些方面使用基于规则的解决方案(如集中式自组织网络(SON)解决方案)已有十多年的历史。但是即使在今天,自动化工作大部分依然依赖于人工和人为干预,并且进行更改时,通常需要花费很长的时间才能完成。考虑到慢控制环路中的手动工作量很大,使用基于人工智能和机器学习的集中式RAN自动化就显得非常有价值,因为它可以替代人工,实现更快速、更高效的规划和设计。
我们也希望人工智能和机器学习驱动的解决方案,能够在一些用例或应用中,超越基于规则的解决方案,提供更精确、更高效的结果,同时(通过数据驱动的方法)开辟新的可能性,使我们能够实现以前无法实现的目标。
了解智能——谁在发号施令?
当谈到使用人工智能优化和提升网络性能时,就需要了解自动化和智能之间的区别。虽然所有的智能网络都具有自动化的特征,但自动化网络并不一定具有智能的能力。最关键的区别在于,决策是由谁或者什么来控制的,以及控制的方式是什么。
在从“标准”软件自动化向意图驱动智能的演变过程中,存在四种不同的“状态”,这四种状态通常随着人工智能的发展而并存。
意图驱动的人工智能
-利用机器学习的演进
1.基于规则的“标准”功能
网络优化的传统方法依赖于基于规则的功能,这些功能需要高技能的专家手动制定自动化框架遵循的规则。例如,他们可能会制定一条规则,指定当某个KPI达到某个阈值时,就执行某个操作。这种形式的网络自动化并不具有智能性。这些规则是由人设计的,通常是固定的,并且在整个网络中通用——这意味着针对特定情况或功能进行调整是非常困难和受限的。
2. 利用人工智能增强功能,以提高性能
人工智能作为一个辅助角色被引入,通过基于ML算法的预测为(人工)决策流程提供信息。这可能涉及增加一个AI组件来处理人工智能擅长的问题,如模式识别或预测,或者用动态参数代替静态参数。这主要是通过监督学习(SL)和/或无监督学习(UL),对基于规则的功能进行微调,使其能够接收AI组件的输入。
例如,在链路自适应中,可以用基于ML算法的预测来动态调整误块率(BLER)目标(原来是静态参数),使得控制环路能够更好地适应无线信道的变化。在能效方面,可以根据流量模式的预测来调整运行多输入多输出(MIMO)的小区中的活跃天线分支的数量。在这两个例子中,预测不会影响结果。例如,即使减少了可用的天线分支,调整后的MIMO小区中的流量(活跃用户)也不会受到影响。
3. 基于AI的功能和选择
AI引入流程中,就可以根据预设的参数执行整个选择流程,包括基于ML决策做出重要决策。这对人工智能的稳健性、可靠性和恢复能力提出了更高的要求。这在很大程度上需要强化学习(RL)。
例如,在链接自适应中,可以用AI代理来替代链接自适应控制环路(它已经在步骤2中接受了动态BLER预测)。这个AI代理所做的决策将影响用户设备(UE)的反馈——这是未来决策的一个重要参数。在能效方面,可以用AI来做一些对网络有主动变化的决策,如小区睡眠,这反过来又会影响其他小区的流量。在这两种情况下,AI都会影响结果和环境,因此任何对AI的表现的反馈都需要考虑到这些因素。
4. 认知、意图驱动的AI功能
在这个阶段,AI能够处理一些涉及多个(通常)相互冲突的目标的复杂问题,例如网络性能或能效之间的平衡。该系统完全由人工智能控制,只需要给出概要性的操作意图,如服务水平协议(SLA),其中包括与业务相关的要求,如成本或优先级。
AI意图管理器可分析意图并监测网络,检查意图是否得到满足。通过预测,它可以提前发现意图可能无法达成的情况,并采取预先措施,根据需要编排执行,基于意图优化网络。与此同时,整个系统中的AI自动化代理可以管理和协调任何冲突的解决方案。AI原生(即系统中的所有组件都使用AI,无论是在内部还是在彼此之间以及在整个系统中)也将是实现零接触运维的关键因素。
我们利用人工智能实现了哪些性能优势?
频谱效率:利用人工智能功能提高频谱效率是一个非常有趣的例子。频谱是运营商的重要资产,也是成本较高的投入,因此,提高其利用效率是一个非常有价值的用例。我们初步演示了使用人工智能来调整调制和编码方案的方法,结果显示在不同的场景下,频谱效率可以提高大约10%。虽然消费者可能不太在意运营商的频谱,但他们肯定关心用户体验——而更有效地利用频谱也会提升用户体验。
下行链路用户吞吐量和发射功率: 利用强化学习(RL)和数字孪生来模拟网络环境,我们已经在两个现网中验证了网络性能的提升,这是爱立信关于人工智能增强客户体验的移动市场报告中的一个案例。
在西班牙马拉加,MásMóvil利用强化学习来优化远程电调天线(RET,Remote Electrical Tilt),在繁忙时段成功地将下行链路用户吞吐量提高了12%,同时保持了相似的流量,并实现了几乎没有拥塞的网络状态。瑞士电信(Swisscom)还专注于优化RET,并降低下行发射功率,平均降低了20%,同时仍然实现了5.5%的吞吐量增长。输出功率的降低还使得基本静态功耗降低了3.4%。
这些功能与您的业务目标相符,可以作为提升AI网络的性能的一个良好开端。但需要记住,网络系统是由很多部分组成的,它们都需要在一个背景和环境中协同工作,如果想用人工智能(AI)来优化或自动化网络系统,就不能只关注某些单个的用例或问题,或只自动化孤立的功能,而要考虑到整个网络系统的情况。否则,您可能会错过一些机会,或者造成一些麻烦,不仅对您自己的项目,也对别人的项目。在规划项目时,要确保采用端到端的方法,而且每一步改进都能有利于构建更智能、更高效的AI原生网络。
为您的人工智能之旅提供策略见解
毫无疑问,人工智能技术的热度和潜力已经吸引了众多运营商,并促使他们积极地以各种形式实施人工智能。虽然现在是时候采取行动了,但我们强烈建议您在人工智能之旅中采取策略性方法。根据我们的经验,有3个关键问题需要您仔细考虑,以避免走上错误的道路。
1. 您知道从哪里开始最合适吗?
在开始人工智能之旅之前,您需要明确您的业务目标,以及您想要自动化的领域会涉及的数据和端到端系统和流程。您可以从一个小规模的项目开始,然后逐步扩展,同时要有长远的眼光,避免走入死胡同。例如,您可以从一个符合您的情况和需求的项目入手,把第一个用例或功能当作一个起点。这需要一些初始投资,但一旦您有了第一个设计良好的功能,后续的工作就会变得更加顺畅。一些元素可以在未来的项目中重复利用,例如数据提取的方法,或者系统中自动反馈的机制。您将更具有灵活性,并积累关于如何训练模型、再训练、更新、构建新版本等方面的端到端经验。因此,拥有合适的系统(例如MLOps和数据策略)是非常必要的。这可能是构建AI能力的关键第一步。
2. 您是否正在为面向未来的网络构建坚实的人工智能基础?
如前所述,人工智能原生将是未来实现零接触运维的关键。如果您过于关注为特定问题定制的算法或模型,而忽略算法在更大范围内的应用和影响,可能会陷入死胡同。您需要把这些组件视为整个智能系统架构的有机元素,或者是网络自主运行周期中不可或缺的角色。您需要在设计阶段就做好充分的规划,避免在几年后再次更换组件。
3. 您有成功的资源和专业知识吗?
人工智能在网络中有着广阔的应用前景,但电信行业的许多人都不了解它在网络中可以做些什么、如何有效地利用它,甚至对它缺乏信心。造成这种情况的一个原因是行业内缺乏统一的规范和标准。即使有经验丰富的数据科学家提供支持,运营商也容易陷入只关注潜在用例而忽略整体策略的误区。要想真正掌握人工智能,不仅需要了解其原理和技术,还需要具备相关领域和系统的专业知识。这听起来可能很难,但您并不是孤军奋战。
爱立信在人工智能领域已经走过了漫长而精彩的历程,我们曾遇到过许多运营商在未来几个月和几年将面临的挑战,并从中汲取了宝贵的教训。我们将是您值得信赖的合作伙伴,陪伴您在人工智能之旅中稳健前行。
Benefits of AI in Networks blog series
We hope you enjoyed this episode on performance boosting with AI – you can read more of our ‘Benefits of AI in Networks’ blog series here, or sign up below to be notified of future posts.
Learn more
Read more about our ‘Benefits of AI in Networks’ blog series.
Discover technical, industry and market insights in our intelligent RAN automation guide series.
Explore Ericsson’s AI-powered Performance Optimizers architecture.
Learn more about intent-based networks.
相关内容
Like what you’re reading? Please sign up for email updates on your favorite topics.
Subscribe nowAt the Ericsson Blog, we provide insight to make complex ideas on technology, innovation and business simple.