【学术论文】高铁动车组WiFi运营服务系统服务质量的测量与分析
0 引言
在我国,高速铁路作为中长途出行的重要公共交通工具之一,具有载客量大、旅客密度较高等特点。同时,近年来诸如手提电脑、智能手机、智能手表等移动设备逐渐普及,而高铁旅客的乘车时间平均约为3.8小时,乘客们在高铁上使用移动设备进行办公、休闲娱乐的需求不断增加,对高铁移动网络使用的需求也日渐增长。
如今,中国标准动车组“复兴号”列车的运行时速已经提升到350 km/h。列车的高速运行、车厢内高密度并发、车体对无线信号的屏蔽等特点给高速铁路上的无线通信带来巨大的挑战,如何为旅客提供高质量的移动通信服务成为需要解决的难题。铁路动车组WiFi运营服务系统的兴建,为广大旅客提供了一种新的互联网接入方式。该系统在提供互联网接入服务的同时,还为旅客提供影视、资讯、游戏、阅读和应用下载等本地内容服务。本文将根据用户在铁路动车组上使用WiFi系统的真实数据,测量并分析无线网络状态及用户的行为,对高铁WiFi服务质量进行整体的测评。
1 铁路动车组WiFi运营服务
铁路动车组WiFi运营服务系统运用先进的现代化信息技术,结合铁路自身资源优势,整合旅客出行所需的内、外部服务资源,为广大铁路旅客提供车站、车上便捷高效的影视、新闻资讯、游戏、阅读等内容服务及铁路出行相关的延伸服务,提高旅客服务质量,提升铁路行业整体形象,并通过系统化的安全保障措施确保用户信息安全、系统运行稳定可靠。
1.1 铁路动车组WiFi服务实现
车载WiFi子系统是铁路动车组WiFi运营服务系统的重要组成部分,为旅客在列车上提供车内的局域网服务以及互联网接入服务。车载WiFi子系统主要由车载中心服务器、单车服务器和接入AP等设备组成。
车载中心服务器是车载WiFi子系统中的关键设备,主要由内容服务器和路由器两大部分组成。其中,内容服务器为车载WiFi子系统提供运行环境及内容存储,为所有旅客提供局域网内的内容服务;路由器通过接入铁路沿线三大运营商的3G/4G网络,为旅客提供互联网接入服务,同时,路由器还对旅客的互联网行为进行安全管控和记录,保证铁路动车组WiFi运营服务系统互联网接入的安全。
路由器同时支持中国移动、中国联通、中国电信三大运营商的3G/4G网络,支持每个运营商最多3个3G/4G通信模块(使用用户身份识别SIM卡)同时接入网络,并支持带宽汇聚及负载均衡。由于列车统一使用布署在车顶的天线,有效地减弱了LTE信号穿过车厢的损耗,因此能够为乘客提供更加稳定的接入网络。
1.2 铁路动车组WiFi系统面临的挑战
由于铁路动车组WiFi运营服务系统是通过接入铁路沿线三大运营商的3G/4G网络为乘客提供服务,因此蜂窝网络的质量极大程度上影响着WiFi运营服务质量。高速列车运行速度高达350 km/h,因此会面临多普勒效应、基站频繁切换等问题。由于列车乘客较多,乘客之间也会造成大量用户竞争。
1.2.1 多普勒效应
在高铁列车高速移动过程中,车厢天线接收到的信号频率与基站发送出的信号频率会产生偏移,这称为多普勒频移。多普勒频移使得基站与车载移动终端之间通信信号发生频移,导致误码率较高,甚至无法正确接收信号,从而导致网络带宽进一步受到影响。
1.2.2 高速移动带来的频繁基站切换
蜂窝基站都呈蜂窝状结构覆盖,并且覆盖范围相对较小,即使在郊区等空旷地带,基站覆盖半径也只有千米左右。而铁路是典型的带状覆盖[1],列车在大约97.2 m/s的高速行驶过程中,大约10 s切换一次网络。LTE采用先断开再连接的切换策略,每次切换都会造成网络服务暂时不可用,如此频繁地切换基站给网络服务质量带来巨大挑战。
1.2.3 大量用户之间的竞争
高铁作为一种公共交通方式,其乘客流量大、密度高,一节满车厢为60~100人[2]。在提供铁路动车组WiFi运营服务系统之后,有大量旅客使用该系统,造成网络竞争,所有用户共享有限的带宽,使得服务无法满足每个用户的使用需求。
2 测量描述
本文对乘客使用高铁动车组WiFi运营服务系统的真实原始数据进行分析,真实地反应了用户的行为和网络状态的变化。
2.1 测量场景
铁路动车组WiFi运营服务系统已在京沪高铁“复兴号”列车上正式运营。系统通过中国移动、中国联通、中国电信三大运营商的3G/4G网络接入互联网,每家运营商使用3个3G/4G通信模块,其中主要使用4G LTE网络。同时,系统使用车载AP为旅客提供车厢内的WiFi接入服务。路由器负责网络负载均衡、带宽汇聚,将用户数据分发到不同的LTE网络出口上,实现互联网接入。
2.2 测量内容
通过使用Tcpdump工具在铁路动车组WiFi运营服务系统上采集旅客使用WiFi服务接入互联网的真实使用数据进行测量分析。
2.2.1 Tcpdump介绍
Tcpdump是Linux环境下的网络数据采集分析工具。Tcpdump拥有强大的获取数据包功能,可以将网络中的数据包完全截获下来进行分析,并支持针对网络层、协议、主机和端口的过滤[3]。使用-w参数可以将监听到的数据包写入指定的pcap格式的文件中[4]。
2.2.2 数据采集
通过在京沪高铁两列“复兴号”列车内部的路由器上运行Tcpdump,将所有用户通过局域网接入互联网后发送和接收的数据包头内容记录在pcap格式的文件中,两列列车分别采集记录10天的数据。Tcpdump采集的数据中,仅包含用户传输层、应用层的使用情况,未采集用户的隐私数据。真实的用户使用数据分析,可以反映出用户在高铁上的用户体验和铁路动车组WiFi运营服务系统的服务质量。
3 高铁动车组WiFi运营服务分析
本文基于Tcpdump采集到的用户数据,测量并分析了用户行为以及网络状态。
3.1 分析方法
过滤数据中与TCP协议相关的数据包,将每个用户传输的所有数据流划分出来。划分数据流的步骤为:首先按照源IP地址、目的IP地址、源端口号、目的端口号,将列车一次运行中的所有TCP流进行初步分类;再将每个IP地址对、端口号对相同的流,根据序列号的连续性进一步划分出每个流。
对于连接未建立成功或数据未发送成功的流,如在发送SYN包(TCP/IP建立连接时使用的握手信号中的第一个包)之后未能接收ACK包;或连接建立后没有后续数据的流;或收到RST包(表示重置连接、复位连接的信号),连接还没开始就意外中断等情况,本文不予考虑。
3.2 用户行为分析
用户在高铁上使用移动设备接入互联网进行休闲、娱乐活动,其行为有异于其他环境(例如:办公场所、家中、学校),具有一定的特殊性。同时,由于大量用户之间存在网络竞争,用户无法长时间持续进行高吞吐量、高质量的数据传输。在受到网络状态限制和高铁列车环境影响的情况下,乘客接入互联网、使用网络服务的行为极具独特性。
一般来说,应用软件可选择TCP或UDP作为传输层协议。TCP是面向连接的、可靠的传输层协议,而UDP是面向无连接的传输层协议[5]。通过分析发现,应用软件使用TCP进行数据传输为大概率事件。因此,本节将着重分析用户数据的TCP行为特征。
3.2.1 TCP流的大小分布
首先将每个流的大小计算出来,然后统计所有用户流的分布情况,并画出CDF图(累积分布函数图)。如图1所示,绝大多数TCP流都很小;超过90%的上行流的大小都小于3.1 KB,超过90%的下行流的大小都小于19.5 KB,上行数据中只有0.283%的流大小超过100 KB,下行数据中只有3.374%的流大小超过100 KB。
然而数量较少、流量较大的TCP流却占据了整个网络的大部分流量。上行流中占比约10%的较大数据流的流量占上行总流量的78.75%,而下行流中10%的较大数据流的流量占下行总流量的92.72%。上行传输中最大流大小为76.5 MB,而下行传输中最大流大小为147.8 MB。下行流的大小整体大于上行流,下行数据量远远超过上行数据量。经统计,下行流量约为上行流量的26倍。用户下行传输的需求远大于上行传输的需求。
3.2.2 TCP流的速率分布
本文首先计算TCP流的平均传输速率,然后综合统计所有数据中的速率分布情况。图2是TCP流的速率分布CDF图,90%的流上行速率均小于1 KB/s,80%的流下行速率均小于10 KB/s。下行流的速率比上行流速率大,这是因为上行的大部分流都小于1 KB,且TCP的慢启动(slow start)导致刚开始传输时速率缓慢,因此传输速率小。而下行流中大数据流占比高,在传输过程中可以较为合理地利用带宽,且运营商为蜂窝网络中下行数据分配的带宽更多,故下行传输速率较大。
流量和速率的关系图如图3和图4所示。图3和图4分别为下行、上行数据流的速率和流量关系图。图3和图4分别对流的大小在0.1 MB以内、0.1 MB~1 MB、1 MB~10 MB以及10 MB以上的数据流进行了分析。首先,计算所有成功建立会话的数据流大小,并按照大小进行分类。对每个类别中的流,计算其平均速率。对于上行数据,大小在0.1 MB以内的数据流,其速率80%均小于0.1 KB/s,而大于1 MB的数据流,70%均大于10 KB/s;对于下行数据,大小在0.1 MB 以内的数据流,其速率80%均小于10 KB/s,而大于10 MB的数据流,91.5%均大于10 KB/s。
从以上分析可以看出,流越大,传输所需要的时间越长,TCP慢启动对速率的影响越小,传输速率越高。
3.2.3 TCP流的持续时间分布
本文首先计算成功传输的TCP流持续时间,然后统计所有流的持续时间分布情况。图5是TCP流持续时间的CDF统计图,根据图中数据可以看出,超过90%的流持续时间在1 s以上,80%的流持续时间在10 s以内,60%的流持续时间在20 s以内。由此可见,持续时间较短的TCP流占比较多。
3.2.4 各传输内容类型分布
本文提取出使用HTTP协议进行传输的流,分析其Content-Type域,得出用户传输不同种类内容的分布图。本文计算了各类内容的流量比例,如图6所示。所有内容中,图片所占比例最高,约占48%;其次是应用程序发送的各类信息,约占37%;再次是文本内容,约占7%;视频内容约占5%;其他的内容传输占2%左右。
3.3 网络状态分析
3.3.1 实时用户数量统计
本文统计了每秒钟使用铁路动车组WiFi运营服务系统的用户数量,方法如下:按分钟为单位划分pcap数据包,统计每分钟进行数据传输的IP地址个数。图7是使用高铁网络的用户数目实时统计情况。
如图7所示,每分钟的活跃用户数量保持在100人左右,约占列车满员总人数的1/5,京沪高铁“复兴号”动车组运行时间约5 h。列车启动后使用人数迅速增加到170人,之后随着列车的运行,用户数目逐渐减少,在列车到达终点站后用户数迅速减少。在列车运行过程中,高铁动车组WiFi运营服务系统的每分钟活跃用户总数始终保持在100以上。
3.3.2 实时吞吐量统计
本文统计了列车上不同运营商各3G/4G通信模块的实时吞吐量以及9个3G/4G通信模块的总吞吐量。图8和图9分别为北京至上海区间和上海至北京区间高铁动车组WiFi运营服务系统各3G/4G通信模块的实时吞吐量统计图。从图中可以看出,铁路动车组WiFi运营服务系统实时平均总吞吐量约为20 Mb/s。整列车在车顶中部位置安装一个多模组合天线,并支持MIMO技术,为三大运营商的9个3G/4G通信模块提供无线信号收发,网络状态较为稳定。每个3G/4G通信模块的吞吐量随时间波动较大,并且有降为0的情况出现,高铁动车组WiFi运营服务系统的总吞吐量波动也较为明显,但相比较单张卡的吞吐量波动,其波动较为平稳。这是因为列车同时接入三大运营商的3G/4G网络,由于不同运营商基站地理位置不同,网络优化也不尽相同所致。列车在综合使用不同运营商的蜂窝网络后,系统TCP传输的平均总吞吐量始终稳定保持在10 Mb/s之上,从而可为乘客提供不间断的网络服务。
4 结论
高铁动车组作为运输量极大的公共交通工具,每天进行平均长达11个小时的长距离行驶。近年来网络的发展,移动设备越来越普及,乘客对于无线网络的使用需求不断增强。铁路动车组WiFi运营服务系统为旅客提供了方便快捷的互联网接入方式和良好的服务。通过综合使用不同运营商的蜂窝网络,保证了铁路动车组WiFi运营服务系统能够为乘客提供吞吐量稳定、服务优良的通信环境。从本文以上分析可以看出,该系统还可以从提高系统有效吞吐量、改善资源分配算法等方面进一步深化研究,提高系统性能,增强用户体验。
参考文献
[1] 唐飞雄.高速铁路TD-LTE网络覆盖关键问题探讨[J].电信工程技术与标准化,2013(7):45-48.
[2] 翟英鸿,王强,魏康.高速铁路TD-LTE无线网络覆盖方案的探讨[J].电信网技术,2014(11):89-93.
[3] FENG Y.An introduction to TCPDUMP.Computer Study,2004.
[4] JACOBSON V,LERES C,MCCANNE S.The tcpdump mannual page.Lawrence Berkeley Laboratory,Berkeley,CA,1989,143.
[5] 张艺濒,张志斌,赵咏,等.TCP与UDP网络流量对比分析研究[J].计算机应用研究,2010,27(6):2192-2197.
作者信息:
王忠峰1,王富章1,孙华龙2
(1.中国铁道科学研究院,北京100081;2.中铁程科技有限责任公司,北京100081)