轨道分享 | 冗余技术提升城轨LTE-M系统可靠性水平
1. LTE-M已成为城轨领域主流的无线通信技术,支撑着CBTC、车车通信、乘客服务、视频监控、云平台等系统功能的实现
随着城市轨道交通系统的不断发展,基于TD-LTE开发的LTE-M车地无线通信系统已经成为城市轨道交通无线通信应用的主流技术,在城市轨道交通运行过程中承载着列车控制系统CBTC、乘客信息系统PIS、视频监控系统IMS等业务系统的数据。其中CBTC业务包括列车移动授权、列车位置报告等安全类数据,在全自动运行场景下,LTE-M系统承载一些关键的状态数据,如针对列车/车辆的休眠、唤醒、测试、车辆火灾报警、紧急文本传输等指令性和状态业务数据。
2. LTE采用冗余备份技术实现自身可靠性的提高,是城轨设备运行可靠性、运营安全的基础
LTE-M车地无线通信系统采用的冗余备份技术主要有:
网元的冗余备份
单板的冗余备份
设备的冗余备份
系统的冗余
2.1 网元的冗余备份
在LTE-M系统核心网设备中网元是多个业务模块的集合,主要包含HSS、MME、XGW、TCF、TMF等网元,通常情况下这些网元都采用1+1冗余备份的工作方式,即两个网元互为主备,一旦主用网元出现故障,备用网元就自动升级为主用并立即接管原主用网元的所有业务。
以MME网元为例,1+1备份的两个MME网元在系统启动时根据已经完成的配置数据或自行协商决定自己的主备状态,主MME立即完成与其它网元和设备间的接口链路建立工作并接管业务,接收外部业务请求并处理,同时备用MME通过备份通道接收主用MME的实时处理数据,形成对主用MME的热备份。
当主用MME网元发生故障,则备用MME将会感知并升为主用,使用现有的热备数据继续处理业务请求。主备的MME网元使用同一个虚拟IP对外进行通信,外部模块在与MME进行业务交互时不感知MME的主备状态。
2.2 单板的冗余备份
网元的冗余备份是基于软件层面,在硬件层面上则是单板的冗余备份。核心网和基站设备可以根据需要将业务模块部署在多个处理单板上,若干个功能单板采用1+1冗余备份的工作方式,即每两块单板互为主备,一旦主用板出现故障,备用板就自动升级为主用。
以基站设备为例,LTE-M系统的基站采用BBU+RRU的射频拉远结构,其中BBU(基带处理单元)的电源板、主控板、基带板都采用1+1冗余备份配置。BBU的主控板采用双主控时钟的独立设计,避免倒换时的人为参与。BBU的主备基带板分别连接到RRU,备用基带板实时备份主要基带板的数据,当主用基带板发生异常时,备用基带板继续提供服务,实现射频通道的备份。
2.3设备的冗余备份
LTE-M系统的设备级冗余备份主要有车载TAU的1+1备份和核心网设备的1+1备份。目前主流的地铁设计方案中TAU的双机备份都是用来传输PIS视频、IMS视频等通信业务,不涉及CBTC控制业务,暂不讨论。
在轨道交通的A/B双网方案中,承载CBTC等综合承载业务的A网会采用双LTE-M核心网设备的冗余备份方式。两套LTE-M核心网分别设置在主用控制中心和备用控制中心,两者构成异地容灾备份。
两套核心网设备间通过专用链路进行彼此间的状态感知和主备切换,通过数据同步链路完成主备局之间的数据同步。LTE-M基站通过S1链路接口分别连接到主备两套核心网设备,通过标准的SCTP协议的心跳检测来保活,一旦主用核心网设备故障后,LTE-M基站在备用核心网进行注册同时备用核心网升为主用并完成业务接管。
组网上,LTE-M核心网作为一个整体设备,在主备倒换时其内部的所有模块一起倒换,两个局点的核心网设备一般配置独立的网管系统分别对各自的配置数据进行管理。
2.4系统的冗余
为了提高轨道交通车地无线网络的可靠性,满足CBTC列车运行控制系统业务对车地无线承载的高安全、高可靠传输的需求,LTE-M无线车地通信系统在轨道旁边采用A/B双网冗余设计,即采用A/B双网覆盖。
A网和B网同时传输数据,且工作在不同的频段,其中A网用于综合业务承载,B网用于列车运行控制系统业务承载,A、B双层网络采用双网同时冗余承载方式工作,即A/B双层网络业务不存在主备之分。
定义系统内一个模块的失效率为 λ,可靠度为R(t),平均故障间隔时间为MTBF,则他们有如下的转换关系:
当一个模块采用1+1冗余备份方式时,即两个相同失效率λ的模块并联,则并联后的模块失效率由上述的计算可以得知 λe=2/3*λ,由此可见采用1+1冗余备份后降低了单一模块的失效率。
3.2 LTE-M系统可靠性计算
LTE-M系统的核心网设备在进行可靠性计算时,主要由以下模块组成:电源模块、HSS、MME、XGW、TCF、TMF,以上模块均采用1+1主备模式,系统的简化可靠性模型为:
4. 地铁工程应用时应重点关注的LTE-M可靠性制约点
4.1 主备倒换的触发和恢复
LTE-M系统的主备倒换触发及恢复条件是冗余备份的关键技术,在系统设计时是否考虑了所有可能触发主备倒换的条件,是否全面考虑了倒换异常(例如备升主失败、双主问题)及异常状态的恢复,是否考虑了导致主备倒换的故障恢复后主备两个局点恢复到初始状态的条件,触发主备倒换操作后倒换流程是否合理。
4.2 数据同步
同步数据包括用户数据和配置管理数据:用户数据又分为静态数据和动态数据,静态数据主要是用户的开户数据和订阅信息,动态数据主要是各网元中动态存储的移动性管理数据如TAI、GUTI等信息。配置管理数据主要是A网的两套主备用核心网一般会分别使用配套的网管系统,为保证主备两套系统的完全一致,除用户数据外两套网管间还需要同步配置管理数据,以保证系统内网络结构和参数配置的统一。
4.3 主备倒换时间
5. 总结
(4)LTE-M系统工程技术正受到业内越来越多的关注,根据城轨协发布的LTE-M团体标准规范,装备企业设计了新的产品架构以满足规范要求,进行工程应用。地铁业主和第三方检测认证机构应关注设计开发和验证确认“V”流程两条主线,结合系统设计方案、室内功能测试和工程实地验证,为城轨业务的安全运营提供可靠保障。