中国移动网络云零接触自配置技术实践

中国移动网络云零接触自配置技术实践
2022年04月24日 15:11 C114通信网

导读

中国移动自2019年正式启动了核心网系统的NFV云化转型,已建成全球规模最大的网络云,目前核心网云化比例超80%。与传统由厂商提供软硬一体化的网络设备不同,NFV云化转型通过软硬解耦提高网络灵活性和开放度的同时,也带来大规模、多厂商产品集成与互操作难的问题,成为运营商推进网络云化所必须突破的巨大挑战。

为了应对这一挑战,中国移动在实施网络云化转型的过程中,充分认识到必须以更加自动化、智能化的手段破解NFV带来的复杂度,以工具能力的提升破解人工所无法应对的网络从建设到运维的挑战。按照公司自智网络的总体发展要求,通过提供大规模资源池内服务器及交换机等设备的自动化配置能力,在网络云落地中的硬件集成建设环节实现了“零接触自配置”,使得大规模资源池建设交付效率大幅提升。

什么是零接触自配置

传统大规模资源池集成硬件配置阶段,多采取运营商提供标准、厂商提供技术的方式,这种传统方案主要有以下问题:

1、虽然厂商可以提供部分自动化配置工具,但是由于现场设备数量及型号种类多,涉及到多个厂家之间对接适配,导致现场仍然需要大量人工操作,配置进度整体较慢,且人工配置出错率也比较高。

2、当多个资源池同时建设时,配置信息和设备信息需双方确认好具体资源池后,才能执行相关硬件设备配置,其中涉及的人工沟通成本较高,无法保证信息的实时性及准确性。配置阶段各资源池系统独立运行,相关硬件配置结果数据无法自动化进行汇总、统计及分析。

3、当硬件设备的配置项有改动时,需要现场人工触发再次配置,当硬件资源池规模较大、数量较多时,引入的工作量较大且容易出现错误。

网络云资源池硬件集成零接触自配置的技术方案,就是针对集成过程中运营商自身需求和跨厂商集成痛点进行设计,在设备上架上电后,即可自动确认资源池信息、设备信息及配置内容,自动下发配置到待配设备。整个过程无需人工参与(零接触)、全自动化持续进行(自配置),实现现场随建随配、“即插即用”的效果。

解决方案介绍

中国移动网络云零接触自配置技术架构由中央服务器和分布于各个硬件资源池的本地服务器组成。中央服务器集成了各硬件资源池的数据,控制资源池信息的统一下发,并汇总分析配置结果,进行全局信息的可视化展示;各资源池本地服务器则完成硬件设备配置、上传单资源池测试结果至中央服务器的功能。

本地配置服务器采用模块化设计,其中包括资源池自动化识别模块、DHCP服务模块、PXE镜像模块、交换机配置模块、服务器配置模块,相关配置功能基于SSH、Redfish、IPMI等业界标准技术接口实现。

以中国移动网络云三期资源池网络架构为例,整个技术应用流程包括:

(1)本地服务器接入到硬件资源池后,各功能模块开始自动运行,通过DHCP模块为当前连接的交换机设备分配临时IP地址。

(2)资源池自动化识别模块通过临时IP地址登录设备,获取设备SN等相关信息,并以此为依据向中央服务器请求,获取当前资源池的设备信息和预先定义、需要配置的各类参数数据。

(3)交换机配置模块根据预先定义的配置参数,通过相关命令对可访问的设备进行配置。根据不同的交换机类别和型号,可能需要执行多轮不同的参数配置和状态检查,并将配置结果上传至中央服务器。

(4)在交换机逐步完成配置、放通网络的过程中,PXE镜像模块会陆续收到服务器的PXE启动请求,并根据预定义配置信息完成BMC IP地址、网关等初始化配置。

(5)服务器BMC IP配置成功后,服务器配置模块将通过带外方式登录服务器,对服务器状态进行检查,并对不满足预定义要求的BMC、BIOS等相关参数进行配置更新。如果发现有新版本的BMC固件,也会自动进行更新。

(6)以上所有模块循环持续执行,如果设备存在当前未到货、未开机、未连线等情况,或者更改了资源池设计信息,所有配置参数都会自动更新,直至所有交换机和服务器配置验收完成。

方案亮点总结

中国移动零接触自配置方案结合自身大规模云资源池建设方式、组网方案和验收要求等进行了定制优化,具有以下亮点:

1、与现场施工低耦合:硬件设备配置模块处于持续运行模式,会持续对被发现设备进行自动配置及检查,对现场施工方式和进度没有特殊要求,实现了一种契合现场硬件设备施工的“随建随验”模式。配置整改报告会通过邮件自动发送给现场施工负责人,可第一时间对施工及设备问题进行整改,减少现场人工沟通和操作,大大提升效率。

2、多厂商设备适配:基于前期与相关设备厂商的合作,自动化配置功能能够支持中国移动集采的各个厂商和型号的服务器、交换机设备。针对不同交换机设备出厂预配置、ZTP实现细节的少量差别,也提前设计了不同的流程,结合设备命令进行适配,确保现场能够配置成功。

3、配置流程和内容精准控制。网络云硬集单资源池包含带内、带外两张网络,最多包括上百台交换机设备,上千台服务器设备,各类网络设备的配置相互关联,配置时序不当会导致干扰和异常,需要精准控制配置逻辑。例如交换机配置模块按照不同功能的交换机进行分层配置,对配置内容和顺序进行编排,采取多种措施防环、防网络风暴避免设备出现托管的情况。

应用效果及未来展望:

2021-2022年中国移动网络云三期项目建设的硬件集成阶段,零接触自配置技术方案在10多个省公司的数十个资源池规模应用。累计完成自动配置40余万项,与传统人工配置可能需耗时5-7天相比,单资源池零接触自配置的平均耗时仅1-2个小时,且一次正确率从传统的70%左右提升到100%,达到业界先进水平。

也正是因为采用了零接触自配置的模式,中国移动研究院的自动化集成技术支撑团队,才能够在投入人员很少的情况下,通过部署在现场的自动化工具,7x24不间断地支撑网络云三期各资源池的建设,为确保交付进度发挥了重要作用。

中国移动网络云零接触自配置是全球运营商大规模网络云资源池建设中首次实现硬件集成的零接触自配置,为NFV云化转型树立了技术创新标杆。未来技术团队还将进一步完善包含虚拟层、分布式存储、MANO和网元等在内的软件零接触自配置方案,并在更多场景推广应用。

作者:

袁昕 中国移动研究院网络与IT技术研究所

张璞 中国移动研究院网络与IT技术研究所

马换 中国移动研究院网络与IT技术研究所

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片