Intelligent Software Defined Networking

Breeze Shane大约 40 分钟ArtificialIntelligenceArtificial Intelligence

温馨提示

阅读本文之前需要先了解SDN,如果你还没有读过SDN入门基础open in new window,请先读这篇。

本文参考论文:李可欣, 王兴伟, 易波, 等. 智能软件定义网络[J]. 软件学报, 2020, 32(1): 118-136.

链接:http://www.jos.org.cn/jos/article/abstract/6120open in new window

论文结论

本文对人工智能技术应用于软件定义网络进行了综述性分析与研究.首先对人工智能技术与软件定义网络的背景进行讨论,分别对以上两个方向的研究现状进行详细的论述,分层次地描述人工智能应用于软件定义网络数据平面、控制平面以及应用平面的相关研究.然后从应用背景及标准化的角度,详细讨论了目前人工智能应用于 SDN 智能路由优化方法、网络安全智能方法以及基于人工智能流量工程的相关研究,比较以上研究领域内现有方法的优缺点,并给出目前较为权威的国际标准化组织对基于人工智能的 SDN 标准化定义.最后总结基于人工智能的 SDN 在高质量数据、跨域通信、可扩展性以及网络安全预测方面所面临的挑战,并在此基础上讨论基于人工智能的 SDN 与一些新兴领域,包括 5G、网络功能虚拟化、物联网、边缘计算、信息中心网络以及无线网络领域结合的发展趋势.综上所述,人工智能的相关算法在 SDN 网络中的应用研究非常广泛,同时面临着许多挑战,然而这些挑战却推动着 SDN 向着更好的方向发展.希望通过本文的讨论和探索,为基于人工智能的 SDN 网络的发展和更加智能化的网络的实现开辟一条新的途径.

基于人工智能的SDN各平面动机研究

数据平面

数据平面相关技术研究包括两个方面:交换机设计研究和转发规则研究.交换机设计研究包括设计可扩展的快速转发设备,实现设备在灵活匹配规则的基础上能够快速转发数据流;其次是转发规则的相关研究,包括考虑解决突发情况的转发规则,例如规则失效后的一致性更新问题等.

着重发展软件交换机,将一些在软件上实现的服务从硬件交换机转移到软件上,不仅可以降低成本,而且使网络配置更加灵活,从而打开了硬件厂商垄断市场的壁垒.

相关信息

国际软件交换机论坛给出如下定义:软件交换机是基于分组网利用程控软件提供呼叫控制功能的设备和系统,能够提供更多的数据包处理方式.

基于数据平面转发规则的研究方向主要包括两方面:开发新的南向接口协议或提出智能协议.

SDN 控制平面与数据平面分离,给网络管理提供统一的编程接口,并使网络更加灵活.但是上述控制平面与数据平面分离的方式需要借助 OpenFlow 交换机和控制器之间频繁交互各种控制器南向接口消息,过于频繁的信息交互,给控制器的处理能力、数据通路处理时延、南向接口的信道带宽等性能提出很高的要求.

于此Zheng 等人提出一种基于流量特征的南向接口技术,针对网络流量分布不均衡的特征,重点关注仅占据少量网络带宽但却种类繁多的小流,消除了冗余路径,降低了传输时延,优化了控制器南向接口交互开销.Baopen in new window 等人研究发现,具有树状拓扑的数据中心网络存在类似的问题,他们提出一个网络范围的电源管理器和若干相关启发式算法,动态打开/关闭网络元素,以满足不同的流量负载.

提示

上述对于协议的研究仅限于启发式算法,启发式算法虽然在一定程度上可以对路由或流量起到智能控制的作用,但却增加了数据平面的计算负担,因此,基于数据平面的各种算法仍须考虑日益增长的数据规模,通过降低计算复杂度来节约能耗.

控制平面

目前,对于控制器的研究大致分为如下几个方面:

  1. 分布控制器研究

    单一集中控制存在单点失效问题,限制网络的可伸缩性;另一方面,在大规模网络中,单一集中控制在其他域与交换机之间存在的延迟处理问题略显乏力,因此,大多采用分布式控制器解决上述问题;

  2. 控制器安全研究

    控制器是 SDN 网络的核心,从安全角度来看,SDN 网络架构的集中性和开放性在提高整个网络灵活性的同时,也为 SDN 网络安全带来巨大的隐患.传统 SDN 控制器安全防护的方法大多采用基于 OpenFlow 流进行流量监控和入侵检测,利用 SDN 的优势实现算法的改善和性能的优化.但是,以上方法都忽略了历史数据蕴含的安全信息,也无法预防未来安全攻击.通过引入人工智能算法,可以构建 SDN 网络安全模型,实现控制平面的智能优化.

由于网络状态与人类的行为规律密切相关,因此可以通过人工智能技术对网络覆盖、用户分布、业务等人类行为特点进行综合分析,预测流量负载,提高带宽利用率,降低网络损耗,实现全网负载均衡.例如:

  1. Tang 等人提出一种新的基于深度学习的流量负载预测算法,用于预测未来网络中的流量负载和堵塞,并在此基础上,结合深度学习的信道分配算法(deep learning based partially channel assignment algorithm,简称 DLPOCA)解决信道智能分配到 SDN-IoT 网络中的各个链路问题,智能地避免潜在的拥塞,快速地在 SDN-IoT 中分配合适的信道.
  2. Leguay 等人通过探究 SDN 与机器学习的一些算法,发掘 SDN 运行计算密集型机器学习工具,并以集中方式解决复杂优化问题的潜力.另一方面,通过在控制平面引入人工智能技术,可以根据历史数据对攻击者和合法用户进行分类,并根据其特点有效识别攻击者,有效保障 SDN 控制平面安全.
  3. Nanda 等人提出在 SDN 控制器定义安全规则,使用机器学习算法根据历史网络攻击范例,预测将要被攻击的主机,通过阻塞整个子网来限制潜在攻击者的访问.

提示

目前,应用于控制平面基于人工智能网络安全方法中仍缺少实时反馈对攻击评估的考虑,仅针对历史数据不能准确识别新的攻击进行分析.

应用平面

SDN 的应用平面包含若干个应用,这些应用可以通过可编程方式,通过北向接口把需要请求的网络行为提交给控制器.

基于应用平面的研究大体分为开发北向接口和开发 SDN 应用.

Google B4 架构无法有效地处理动态流量问题.而人工智能的相关技术结合 SDN,可以很好地解决上述问题.例如:

  1. Shi 等人提出一种基于深度学习的流量鲁棒最优的新特性优化方法和特征选择算法,该方法利用删除网络流量数据集中无关的特性来保证对称性,然后,基于深度学习生成应用于该特征的相应模型.但是互联网流量具有复杂非线性特征,现有的特征选择(featureselection,简称 FS)技术对流量分类不具有很强的鲁棒性,不能可靠地为机器学习(machine learning,简称 ML)算法提供最优、最稳定的特征保证.为了解决上述问题,Shi 等人在现有算法的基础上提出一种新的特征提取和选择方法:首先,利用小波前导多重分形形式化,从流量流中提取多重分形特征来描述流量流;然后,将基于主成分分析的 FS 方法应用于这些多重分形特征,去除不相关和冗余特征后,得到需要的特征.
  2. 其他研究包括通过比较贝叶斯网络、决策树和多层感知器等方法不同类型的互联网流量和内容交付流量进行基于流的分类,调查不同的流量分类性能所依赖的训练数据量,得出贝叶斯网络和决策树等适合互联网高速流量分类的结果.

关键技术及研究方法

智能路由优化方法

问题焦点

路由是网络的一项基本功能,在 SDN 网络中,控制器通过修改交换机的流表来控制流量的路由,引导交换机丢弃一个流量或将其路由到指定路径.低效率的路由策略会导致数据丢失、负载不均衡以及资源浪费等情况,因此,优秀的路由策略对于网络数据传输具有重要意义.目前,路由策略大部分基于最短路径优先策略或启发式算法做出优化或改进.

对于智能软件定义网络下的路由研究包括路由策略优化和软件定义路由研究两个方面:

策略优化

SDN 是为了解决由于集中管理困难、供应商依赖以及进程改变导致网络复杂增加等问题而提出的.在目前的 SDN 网络中,路由算法多为基于 Dijkstra 算法,选择最短的流路径来传递数据包.但仅考虑路径的长短而不考虑带宽开销等其他参数,会在大量的流量进入网络时导致网络拥塞.为了解决上述问题,研究人员考虑结合人工智能方法规划路由算法.

  1. Mhdawi 等人在中型混合软件定义的网络数据中心环境中开发智能功率降低决策路由协议(intelligent power reduction decision routing protocol,简称 IPRDR),该算法根据计算的公制值,以最优功率路径将大流量路由到高索引设备,并对其进行聚合和隔离.

    存在的问题

    该算法并不适用于更大功率情况的优化,无法管理和控制多个传统数据中心站点位置.

  2. Kim 等人提出一种基于 Q-learning 的 SDN 高效路由以防止网络拥塞的机制,该方法通过使用预定义的阈值和 Q-learning 路由算法重新选择路径和改变流表,可以极大地改善网络拥塞.

    存在的问题

    该方法仅适用于固定流量生成模式和带宽大小的情况,为了满足更复杂的网络状况,需要考虑更多的复杂、可扩展的因素.

  3. Pasca 等人从流量优先级的角度优化路由策略,认为流量应有优先级,率先完成优先级高的流量调度可以有效地避免多个流争抢有限资源的状况.在此基础上,提出一种应用程序感知的多路径包转发框架,该框架集成了机器学习和 SDN,使用机器学习算法对每个流进行优先级排序,并使用 SDN 根据流优先级和网络状态将其路由.

    存在的问题

    该算法在执行多路径分配时,未将用户的使用经验和一些 QoS 需求考虑在应用的分类步骤中.

  4. 针对传统的路由协议没有从历史经验中学习网络异常此类问题,Mao 等人提出一种新的基于实时深度学习的智能网络流量控制方法,利用具有独特输入和输出特性的深度卷积神经网络(deep convolutional neural networks,简称 DCNNs)来表示所考虑的无线网状网络(wireless mesh network,简称 WMN)主干网,以降低平均延迟和丢包率.

软件定义路由

软件定义路由器(software defined routing,简称 SDR)也称为可编程路由器,它提供了一个具有易扩展性和可编程性的具有成本效益的包处理平台.目前有许多学者致力于 SDR 的研究,例如:

  1. Mao 等人采用监督的 DBA 计算后续节点与边缘路由器的流量模式作为输入、基于深度学习的路由表构造方法.仿真实验结果显示,基于深度学习方法的路由方法的确能够极大地改善主干路由的控制.

    注意

    该方法并未考虑网络层的安全问题.

  2. Geyer 等人提出了基于图的深度学习生成分布路由协议方法,与 Mao 等人的方法相比,该方法独立于拓扑的底层结构,因此应用于更广泛的网络拓扑.

SDR 为网络设备编程实现不同目标提供了灵活性,并消除了对第三方供应商特定硬件的需求.

网络安全智能方法

问题焦点

SDN 以中央控制器来管理整个网络,以简化网络管理工作.这种管理机制在为用户提供良好的网络可编程性的同时,也使整个网络的核心暴露在攻击者面前,攻击者仅通过编码的形式就可以访问网络的中心,使 SDN网络时刻面临攻击的危险,降低了整个网络的安全性.

Wang 等人对 SDN 网络安全机制进行了综述,分析归纳了 SDN 中存在的典型的安全威胁问题.他们分别从 SDN 安全控制器的开发、控制器可组合安全模块库的开发和部署、控制器 DoS/DDoS 攻击防御方法、流规则的合法性和一致性检测、北向接口和应用安全性等多个方面详尽地探讨了 SDN 安全.SDN 控制器的全局网络视图简化了网络流量的收集和分析,此外,SDN 的可编程性使网络在检测到攻击时拥有立即做出反应的能力.

在 SDN 网络中,基于人工智能的入侵检测已有很多研究,如入侵检测和 DDoS 攻击检测:

入侵检测

入侵检测的目的是识别访问是否正常,通过将流量分类为正常流和攻击流,拦截异常访问,保证网络安全.人工智能方法用一组属性和关联标签来说明每个流,基于属性的类型,确定用于异常检测的相关技术.例如:

Sanda 等人利用机器学习算法的预测输出,定义 SDN 控制器的安全规则,以防止恶意用户访问网络.他们分别使用 C4.5、决策表、贝叶斯网络和朴素贝叶斯算法这 4 种机器学习方法,根据历史数据预测攻击的主机.

存在的问题

在利用人工智能方法分类访问流的方法中,仅可以解决特定的攻击或提出具体的防御方法,并没有解决检测和控制恶意或可疑流量等基本需求.

此外,SDN 控制器中仍存在许多尚未发现的漏洞,攻击者可以利用这些漏洞继续威胁 SDN.因此,创建一个全面的安全设计,可以抵御 SDN 中的各种漏洞,以防御各种潜在的攻击.为了解决上述问题:

  1. Song 等人提出一种基于 SDN 和机器学习技术的感知实时威胁的网络入侵检测系统,引入入侵响应系统,该系统使用反应式路由进行 SDN 中的影响分析,在 SDN 中的一个开源项目中实现原型,并使用网络公开归档数据和实时数据评估所提出的系统.
  2. Anderson 等人提出了基于 SDN 网络的异常检测、分类和缓解框架ATLANTIC,该框架包括一个负责监控流量的轻量级阶段和一个负责异常分类和缓解的重量级阶段:轻量级阶段利用信息论计算流表熵的偏差,重量级阶段利用 SVM 算法对异常流量进行分类.根据不同量级,使用不同方法对流量异常进行分类,通过使用所收集的信息,以特定方式处理每个流量配置文件,阻止恶意流量.

DDoS 攻击

问题焦点

DDoS 攻击是 SDN 网络安全的一大威胁.DDoS 攻击的目标是:通过使用许多傀儡机同时发送大量假请求来耗尽系统资源,从而无力满足合法用户的请求.在 SDN 网络中,DDoS 攻击会耗尽数据平面和控制平面的网络、存储和计算资源,使 SDN 网络不可用.因此,DDoS 攻击检测对于 SDN 网络的正常运行至关重要.应用人工智能技术,根据与流量特征相关的某些功能区分网络流量,并将其分类为恶意或良性,以减轻对 SDN 控制器或交换机的入侵和 DDoS 攻击.

Niyaz 等人将系统构建为 SDN 控制器上的网络应用程序,使用深度学习算法减少从网络数据包头部导出的大量特征的情况,在 SDN 环境中,提出了一种基于深度学习的多向量 DDoS 检测系统.

存在的问题

上述算法均不具备从原始字节中直接提取特征的能力,而是从派生的特征中降低特征维度.


Chen 等人从 SDN 控制器角度入手,结合分类器 XGBoost 改进决策树方法,利用收集的流数据包数据集进行 DDoS 检测.

存在的问题

截止到目前,基于 SDN 的 DDoS 流量检测仍然无法满足 DDoS 攻击检测的应用特定要求.其中,DDoS 攻击检测的流量阈值可能因应用而异,然而现有的解决方案没有实现任何机制来满足这一重要需求并设定相应的约束条件.此外,利用 SDN 进行 DDoS 流量检测通常采用单个控制器作为解决方案,这不仅会造成网络流量的瓶颈,还会导致 SDN 网络出现单点故障.虽然 SDN 可以整合分布式平台,集中控制整个网络,但现有的解决方案还没有充分发挥它的潜力.

基于人工智能的流量工程

流量工程(traffic engineering,简称 TE)是通过动态分析,预测和调节传输数据的行为来优化数据网络性能的重要机制.迄今为止,结合 SDN 研究的大部分工作都集中在开发 SDN 架构上,而不是为 SDN 开发 TE 工具.SDN大幅度地简化网络管理,降低运营成本,促进了当前和未来网络的创新和发展.SDN 的这些独特功能为新的 TE 技术提供了巨大的动力,利用相应技术,可以更好地进行流量控制和管理全局网络视图、状态和流模式特征.

基于 SDN 的流量工程的优势在于:

  1. 互联网应用程序要求底层网络架构能够实时地做出反应,并且可以针对大量流量进行扩展.该架构应该能够对来自不同应用的各种流量类型进行分类,并在非常短的时间内,为每种流量类型提供合适的特定服务;
  2. 其次,面对云计算的快速增长以及大规模数据中心的需求,合适的网络管理应该能够提高资源利用率以获得更好的系统性能.

意义

因此,迫切需要新的网络架构和更智能和高效的 TE 工具.结合人工智能技术识别不同的流量类型,为 SDN 网络提供一种细粒度的网络管理方法,网络运营商可以更有效地处理不同的业务和分配网络资源,通过预测流量动态变化情况,设计相应的应对策略,实现高效、准确的网络优化.

基于人工智能的流量工程大致分为流量的分类识别以及动态流量调度优化,下面将对基于人工智能流量工程方法的相关研究进行简要概述.

流量分类

基于 SDN 的数据流在不同的情境下具有不同的特征,目前有两种分类方式:

  1. 将流量分为大象流和老鼠流,大象流是大量持续的流,而老鼠流是小量且短时间的流;

    在数据中心,80%的流量是老鼠流,但是 20%的大象流却占据了 80%的带宽,因此,识别大象流和老鼠流对于准确识别数据中心流量、实现适宜的网络流量调度具有重要的意义.

    出现的问题

    SDN 通过流量控制为数据中心网络提供灵活的管理,然而这种细粒度管理在数据和控制平面之间消耗了大量带宽,造成基于 SDN 的数据中心的可扩展性的瓶颈.“大象和老鼠现象”表明:只有非常少的大象流量承载了数据中心的大部分字节,因此它可以通过检测和重新路由大象流以提高管理水平.但是,用于大象流检测的现有机制面临着高带宽消耗和检测时间过长的挑战.

    为了解决上述问题,Tang 等人提出一种有效的采样和分类方法(efficient sampling and classification approach,简称 ESCA)应用于大象流的检测.在第 1 阶段,ESCA 通过估计大象流的到达时间间隔,并使用过滤流表过滤掉冗余样本来提高采样效率;在第 2 阶段,ESCA 基于数据流之间的相关性,使用新的监督分类算法对样本进行分类.通过这两个阶段来实现大象流的检测.因为过滤了冗余部分数据,因此降低了整个系统的带宽消耗与计算时间.

    存在的问题

    一方面无法满足 SDN 数据中心和校园网的粒度需求;

    另一方面,巨大的计算开销降低了测量框架的可扩展性.

  2. 根据 QoS 将流量分类.

    QoS 感知的流量分类旨在识别流量的 QoS 类.

    随着 Internet 上应用程序的指数级增长,要识别所有的应用程序是困难和不切实际的.但是,应用程序可以根据其 QoS 需求(如延迟、抖动和丢失率)划分为不同的 QoS 类.许多不同的应用程序可能属于一个 QoS 类,因此,根据流量的 QoS 要求对流量进行分类是一种更为有效的方法.

    应用人工智能算法可以实现:

    1. 多维关键绩效指标(key performance indicators,简称 KPI)分析,并发现新的相关性,执行根本原因分析并预测 QoS 违规行为;
    2. 实施数据清理技术,以处理不完整、丢失或损坏的数据;
    3. 支持强大且可扩展的架构,可从虚拟和现实世界中收集数据.因此,人工智能算法能够满足大数据情境下的 QoS 预测,发现规则间更多的相关性.

流量调度

出现的问题

现代网络中,高时空流量的可变性需要网络不断改变处理策略,以保持接近最佳网络性能.Geyer 等人提出,当前的电信网络在许多不同的平面和时间尺度上表现出内在的可变性,例如光纤意外失效、无线信道质量因多径衰落而快速波动等.同时,智能手机和平板电脑作为用户的主要互联网接入设备的使用也越来越多,使得流量需求随着内容受欢迎的程度而发生改变,这些因素及其他因素导致了流量需求在时间和空间上的频繁且较大的波动.由此可知,流量具有变异和波动的属性.

任务目标:为了保证网络的稳定,需要在不同输入(即网络和流量)状况保持系统的良好性能.此外,考虑到出现流量涌流的状况,系统的实际性能并不总是遵循优化模型预测的性能.因此,在线网络优化(online networking optimize,简称 ONO)必须满足在实际流量情况与预测情况产生偏差时,大多数预测的流量状况的性能处于最优或至少稳定的状态.

当前的解决方案:在 SDN 网络中的流表匹配策略能够体现网络流量的动态处理情况,基于分类方法,Su 等人对包的结构进行分析,提出一种基于字段的数据包的匹配模型 F-OpenFlow.该方法提出通过分组匹配字段提高表项匹配概率的方法,利用元空间搜索分析现有网络中流表的结构,找到同类型的匹配规则,并利用元空间方法将分析模型与字典树集成,处理动态网络中的字段,得到相应的规则并匹配对应的策略,实现了高效、准确的网络优化.但是上述方法并没有利用以往的历史数据进行匹配,导致分析消息位置和流表之间的关系不够准确,不能保证能够提高流表的命中率和匹配速度.

流量预测

前置条件「保证可行性」:网络流量具有自相似性、多尺度性、长程依赖性和高度非线性的特性(如泊松模型和高斯模型建模的不足),这些统计特性决定了流量的可预测性.

准备条件「需要的依赖」:对于大多数网络操作管理任务,如流量计算、短时流量调度或重路由、长期容量规划、网络设计和网络异常检测,拥有准确和及时的流量数据是必不可少的.例如:当网络发生拥塞时,传统的路由协议不能立即响应以调整流量分布,导致高延迟、丢包和抖动等情况发生.尤其在高容量流量检测和 DDoS 预测方面,由于早期预警,基于主动预测的方法将更快.同样,在网络被显著影响后,预测网络拥塞比通过测量来检测拥塞的被动方法更有效.

  1. Azzouni 等人提出了一种称为 NeuRoute 的动态路由框架.在 NeuRoute 中,长短时记忆模块(long short term memory,简称 LSTM)被用来估计未来的网络流量.该方法通过输入网络状态和估计的网络流量,以启发式算法计算得到的相应路由解为输出,对神经网络模型进行训练.

  2. Polson 等人开发出深度学习模型来预测流量,其主要贡献是开发出结合使用 l 正则化和一系列双曲面正切层的线性模型,解决预测流量中自由流量、故障、恢复和拥堵之间急剧的非线性过渡的问题,并证明了深度学习架构可以捕捉到这些非线性的时空效应.

设想道路:通过深度学习的方法预测流量,在获取网络流量数据的同时进行流量预测,从而实现智能路由.

提示

尽管人工智能方法可以解决流量预测问题,但是很难说在任何情况下,一种方法明显优于其他方法.其中一个原因是:所提出的模型是利用少量单独的特定流量数据开发的,并且流量预测方法的准确性取决于嵌入在所收集的流量数据中的流量特征.此外,一般而言,将神经网络相关算法应用于流量预测,该模型的预测能力和鲁棒性都会优于一般模型.总体来说,现有的流量预测方法主要使用浅层流量预测模型,并且依旧不能满足许多实际应用.

未来挑战

高质量数据

背景

尽管拥有成熟的大数据处理技术以及基于人工智能的数据分析技术,但是人工智能算法是由图像处理领域而不是网络领域提出的,大多数算法不能直接迁移和使用于网络场景.网络数据并不完全符合人工智能算法的数据格式要求,为了将人工智能应用于网络,需要事先将网络数据翻译成矩阵或向量的形式.

因此,将人工智能应用于 SDN 进行准确分类预测的前提是,训练准确、高质量的数据以弥补分析数据格式、数据编制等方面的不足.

目前存在的问题

一方面,关于 SDN 网络数据集大小、SDN 网络特征以及基于人工智能 SDN 网络模型还未成型;

另一方面,高质量的数据只能靠人工清洗,没有公开的数据集便于研究人员实验,因此需要各方力量整合出高质量的公开网络数据集.

跨域通信

出现的问题

多控制器的出现,是为了解决网络规模扩大而产生的交换机和控制器之间复杂度增高的弊端.有研究证明,跨域信息共享有利于提高网络性能.但跨域数据流的传输需要多个控制器,这样的跨域设计打破了原有的 SDN模块化.为了兼顾多控制器以及网络复杂度的增加,传统的优化方法已不足以对网络进行优化.

尽管人工智能算法可以用于跨层网络优化,分析收集到的域间信息,包括数据链路层信息、应用平面信息等信息优化网络,例如路由机制、拥塞控制和负载均衡等等,但是基于多层递归网络的跨层优化方法一方面由于跨域通信没有成熟的模型以便于下一步研究,另一方面,跨域通信涉及的参数太多,往往牵一发而动全身,缺少真正适用于域间通信的优化算法.

尽管多目标优化算法能够在较少参数的情况下解决上述问题,但在真实情况中,多目标优化算法就会因为参数太多而导致 Pareto 非支配问题失效,从而致使整个优化方法失效.

因此,尽早建立域间通信问题模型以及优化方法,是目前研究的重点.

可扩展性

出现的问题

SDN 带来的优势为网络开发带来更多的机遇,但在实践过程中却遇到了很多屏障,例如:随着网络规模的扩大,为了扩展平面需要增加控制器的数量分担任务以提升集中控制器的性能,但是随着控制器数量的增加,又会带来控制器的放置以及动态调控的问题.

当下解决方案

考虑采用多级强化学习方案,其中,根控制器为高级学习代理,局部控制器为低级学习代理.每个低层学习代理根据其本地网络状态信息学习如何对域内的流量进行路由,从而做出最优决策;而高层学习代理则基于整个网络的全局视图来处理域间的流量.为了缩短系统响应时间,根控制器可以周期性地将训练好的强化学习模型部署到本地控制器上.训练后的强化模型将指导本地控制器直接处理域间的流量.

意义:多级强化学习方案不仅降低了业务流的处理延迟,而且提高了 SDN 网络的可扩展性.

面临的问题

基于强化学习方案尽管考虑将控制器分级来提高 SDN 可扩展性,但是目前,研究仍仅限于理论,并没有实际的场景验证算法的实用性,因此应考虑实际情况以保证整个系统的鲁棒性.

安全预测

出现的问题

尽管通过历史数据可以构建一个成熟的模型来预测下一次攻击,但是恶意攻击者很少以相同的方式来完成,他们会不断尝试创建新的攻击以逃避控制器检测.在这种情况下,使用历史数据来训练人工智能模型不是检测攻击的有效方法,因为要为此创建新的攻击.

为了解决上述问题,可以采用两种解决方式:

  1. 一种是生成式对抗网络(generative adversarial network,简称 GAN)GAN 可以根据历史数据生成可能的新攻击数据.利用生成的新数据和历史数据对机器学习模型进行训练,训练后的机器学习(machine learning,简称 ML)模型可以检测已知的攻击和可能的新攻击.基于攻击检测,控制器能够提前修改交换机中的流表,防止网络攻击,限制控制平面与数据平面之间的通信;
  2. 另一种方法采用先验-后验经验模型,先验经验和后验经验可以在模型中分别代表网络历史数据信息和检测过程中实时反馈的信息.这种方法保留了历史信息对控制器检测的影响,同时在模型中考虑了实时反馈信息以更正模型.这种方法能够准确、实时地分析网络攻击,以确保网络不会因为陷入新的攻击而造成严重的后果.

不同网络场景应用

5G

5G 除了具有特定的性能要求外,还需要支持异构服务、设备和接入网.SDN 减少了网络节点之间的控制信令,增强了网络的负载均衡和移动 性管理以及提高网络控制的灵活性.

Nayak A, Jha P, Karandikar K. A centralized SDN architecture for the 5G cellular network. arXiv Preprint arXiv: 1801.03824, 2018.open in new window提出了一种基于 SDN 的集中式无线网络控制器,用于控制核心网络中的多节点和网关.

基于 SDN 的 5G 网络可塑架构旨在满足新一代服务和设备的功能和性能要求,关键特性是灵活性,需要有效地支持异构服务集,包括机器类型通信和物联网通信.这些应用程序在端到端延迟、可靠性和可伸缩性方面增加了具有挑战性的目标.

为了应对 5G 移动网络中异构的无线环境、网络管理的复杂性、不断增长的移动通信需求和多样化的服务需求带来的挑战,人工智能技术应被用于在移动中部署更多的智能网络中.

网络功能虚拟化

网络功能虚拟化 (network function virtualization, 简 称 NFV) 允许在网络中部署虚拟网络功能 (virtualnetwork functions,简称 VNFs),以增强性能、安全性和管理.通过 VNF 将网络功能与底层专用硬件解耦,使网络体系结构更加灵活.VNFs 是在商业现实设备上运行的软件中实现的,可由 ISDN 控制器集中控制.

意义

与传统的由专用硬件设备实现的网络功能相比,VNFs 具有显著降低运营和资本支出、提高服务敏捷性的潜力.随着 VNF 的应用,有许多相关性的研究成为促进网络灵活性和成本效率的重要服务.例如:

强化学习用于根据资源使用情况动态创建服务功能链(service function chain,简称 SFC)以支持高效的服务提供.

结合人工智能思想,可以将 SDNFV 的在线路由问题描述为线性规划模型,并基于该架构,根据网络中的资源条件获得需要的延迟、负载、带资源利用率等数据,促进动态服务提供和网络资源利用优化.例如,将网络功能分配问题描述为一个两阶段的 Stackelberg 博弈,其中,服务器作为网络功能的卖家,用户作为网络功能的买家,应用强化学习算法得到了最优的网络函数分配策略.

物联网

背景

物联网(Internet of things,简称 IoT)已成为一种全球网络基础设施,通过使用异构(有线/无线)通信技术连接大量不同的异构设备.由于这些设备的高移动性和广泛覆盖,不同类型的无线电接入技术已广泛用于 IoT.

异构通信技术和设备基础结构的复杂性涉及到许多关键问题

  1. 随着设备数量的增加,交换机的流量负载可能变得非常繁重,并且需要将多个信道适当地分配给链路.此外,异构设备在数据感知和收集方面具有不同的策略,这导致会发生突发流量到达交换机不均匀的情况.
  2. 异构设备在数据感知和收集方面具有不同的策略,这导致会发生突发流量到达交换机不均匀的情况.

为了更好地适应异构大规模 IoT,智能软件定义网络成为将分布式异构设备连接到集中共享工作系统的新颖的解决方案,我们称这样的方案为智能 SDN-IoT.

在智能 SDN-IoT 中,各种设备广泛部署在传感平面中,由传感平面收集的所有传感数据通过数据平面中的交换机转发传送到网关,利用人工智能技术结合部分重叠信道分配解决自适应的分配信道问题,以确保无线网络中的通信服务质量.

边缘计算

背景

边缘计算(edge computing,简称 EC)将计算和存储推至网络边缘.在边缘计算中,“边缘”定义为沿着数据源和云数据中心之间路径的任何计算和网络资源.

智能 SDN 与边缘计算结合,可以使如下领域受益:

  1. 高分辨率和有效控制
  2. 灵活性和创新的低障碍
  3. 以服务为中心的实施
  4. 虚拟机流动性
  5. 适应性
  6. 互操作性
  7. 低成本解决方案
  8. 范围的多样性

存在的问题

智能 SDN 及其当前事实上的 OpenFlow 标准化都不够成熟,无法处理所指出的所有可能的用例和管理操作.由于需求正在快速变化,即使是基于基础架构即服务的相对更为标准的域也在不断发展.面对越来越复杂的需求,仅部署支持 SDN 的网络设备将无法轻松实现将 SDN 集成到现有网络中.另一方面,硬件投资成本非常昂贵,因此,支持智能 SDN 的硬件无法在功能和部署方面达到所需水平.

而利用人工智能技术提供更精细的控制粒度与抽象粒度,在用例和管理上提供了更多的可能性.

信息中心网络

信息中心网络(information-centric networking,简称 ICN)是一种通过名称向用户提供对内容的访问,而不是在主机之间提供通信信道的架构.

意义

ICN 集成 SDN 特征将网络的控制平面和数据平面分开,使网络能够从全局视图进行编程和集中控制.结合 ICN 和 SDN 的集成框架 SDN-ICN 有利于利用 ICN 中数据平面的数据独立性和 SDN 中控制平面的集中控制,更好地控制全局网络.

首先,ICN 中不受地址限制的内容在网络层作为独立实体进行路由和转发,SDN 中的集中调度可以优化网络资源的分配.在 SDN-ICN 中存在大量计算节点,利用人工智能能够与 ICN 同时学习,降低了 ICN 因处理数据而造成的时延.因此,由于使用分散在各种 SDN 节点上的丰富计算资源,可以解决人工智能模型训练过程中由于计算时间产生的挑战.

其次,基于全局视图中数据的收集和分析的统一,可以实现具有更高精度导向的流特征的多尺度流量预测.分布式 SDN 中的多个交换机收集所请求的目标内容的特征,其包含固有的时空和社交相关性,深度学习网络可以在全局视图中理解这些功能.

然后,由于其深度学习网络的无监督学习能力,可以找到内容流行度的分布模式,并且不会错过该模式的微小变化以提高预测的准确性.

最重要的是,SDN-ICN 可以重新配置深度学习网络的结构.由于 SDN 的可编程性和 SDN 控制器在全局视图中控制网络的能力,每层中的隐藏层和神经元都可以轻松调整.

受益于这种可编程网络,我们可以通过网络轻松部署各种网络模型,以解决 SDN-ICN 模型中遇到的计算问题.

无线网络

无线网络(wireless network,简称 WN)由许多节点组成,通过无线信道进行传输.与有线网络不同,无线网络的信道总是随着用户的移动性、信道衰落和干扰而发生改变.

出现的问题

在移动用户密集的无线网络中,由于小区规模小,信道容量变化更加难以处理.基于 SDN 的集成解决方案能够支持密集无线网络中的用户移动性,因此,传统和新兴无线环境中的无线软件定义网络(wireless software defined networking,简称 WSDN)引发了对 WSDN 架构中固有安全性的担忧.WSDN 范例遇到与有线 SDN 框架非常相似的安全问题,无线介质带来了额外的攻击手段,并为攻击者提供了瞄准控制平面、数据转发元件以及各个无线应用的机会.

优势

控制器功能仍然是一个中心故障点,可以动态地移动到网络中的不同服务器,使得潜在的攻击者难以破坏控制平面.

全局网络可见性为安全管理员提供了一个中心优势,可以根据需要观察实时流量统计信息并更改安全策略.

此外,WSDN 环境可以利用各个节点的能力,在网络的不同部分之间实现安全链,以实现分层安全模型,而不会使单个网络实体负担过重.

解决思路

如果适当使用现有的集中式 WSDN 设计,可将框架本身转变为可编程安全屏障,其包括可以改变功能的可编程数据平面设备.

将人工智能的相关技术与 WSDN 结合,以解决 WSDN 的安全问题,整合历史数据分析预测恶意攻击,能够准确、有效地提升 WSDN 的安全可靠性.

在 WSDN 中,机器学习算法对于管理大量异构传感器节点、优化每个节点的资源利用率、灵活且高效地调度通信链路起着至关重要的作用.

目前,无线传感器网络中的路由优化、节点聚类与数据聚合、事件检测与查询处理、定位、入侵检测、故障检测等问题都采用了机器学习技术.