【学术论文】D2D网络中基于博弈论的时隙分享合作策略研究

摘要:

 为了使D2D网络中从属于不同用户的终端进行合作通信,提出了一种基于博弈论的时隙分享合作策略。首先,使互为中继的终端通过分享时隙的方式建立合作;其次,采用博弈论中的纳什谈判方法对终端时隙分享问题进行分析,并通过拉格朗日乘数法求得终端以多大时隙中继彼此数据,解决了终端如何合作的问题;最后,给出了终端合作的截止条件,解决了终端何时合作的问题。仿真实验表明,与直传方式相比,终端采用合作传输策略能够有效地提升能量效率。

0 引言

终端直通(Device to Device,D2D)技术通过距离较近的两个设备之间直接进行数据传输,能够带来信道增益、跳数增益、复用增益等好处,从而达到减轻网络业务负载、降低移动终端能耗、提升移动终端电池寿命以及提升系统频谱效率的目的[1-2]。因此,D2D通信技术被广泛认为是5G通信系统的关键技术之一[3]。

目前,关于D2D通信技术的研究主要集中在D2D通信邻居节点发现机制、D2D通信会话建立、D2D通信干扰协调及D2D通信传输模式选择等方面[4-5]。但这些研究大多是在终端自愿合作的前提下进行的,当终端从属于不同的用户,用户为了节省终端的通信资源往往表现出“自私”的特性而不进行合作。为了促使网络中的“自私”节点进行合作,激励“自私”节点合作的机制研究受到了广泛关注。文献[6]针对一个节点互为中继的网络模型,提出了一种基于交换带宽资源的激励合作机制,作者通过合作博弈理论解决了两个节点相互合作时以多大带宽中继对方数据问题。文献[7]在文献[6]的基础上,提出了一种新的基于Kalai-Smorodinsky谈判解的激励合作方法。文献[8]采用合作博弈理论解决了两个对等用户采用交换功率资源进行合作时,以多大功率转发彼此数据的问题。文献[9]针对一个双向协作通信网络,提出了一种基于Stackelberg博弈的共享功率资源的合作算法。文献[10]采用博弈理论解决了在两种不同网络模型下“自私”节点的时隙和功率共享问题。

在上述文献中,文献[6-7]通过交换带宽资源在节点之间建立合作关系,但现在通信系统中频率资源已非常稀缺,因此,本文采用时隙分享的方式在终端之间建立合作。文献[8-10]未考虑数据传输中的能量效率问题。通过以上分析,本文在D2D网络中提出一种新的基于时隙分享的合作策略,解决了终端以多少时隙中继对方数据的问题,并最终达到提升终端能量效率的目的。

1 系统模型

图1为一对称D2D协作通信系统。系统中,终端T1传输数据至D3,终端T2传输数据至D4。如果系统为蜂窝无线网络,T1和T2代表手机或移动终端,D3=D4代表基站;如果系统为无线局域网,D3≠D4对应终端之间的一个Ad hoc设置,D3=D4=D则代表以D3(或D4)作为接入节点的接入网设置。本文假设D3=D4为AP,终端T1和终端T2为属于用户1和用户2的终端设备。图1中,所有节点均采用时分多址(Time Division Multiple Access,TDMA)方式分享信道,且终端的可用带宽为W Hz。终端采用全向天线进行数据的接收和发送,终端发送的信息可以被终端接收,反之亦然。

系统中,互为中继的终端节点采用放大转发(Amplify and Forward,AF)方式中继数据,并假设每帧的时长小于信道相干时间。在每帧的传输过程中信道增益不变,gi,j(i,j=1,2表示终端)、gi,D、gj,D分别为终端i到终端j、终端i到接入点D和终端j到接入点D的信道增益,当接入点采用最大比合并(Maximal Ratio Combining,MRC)对接收信号进行处理时,终端i通过中继到接入点的等效信噪比为[11]:

2 效用函数

2.1 效用函数的定义

本文采用SARAYDAR C U等人提出的能量效率函数作为效用函数来衡量终端的收益,其表达式为[12]:

其中,pi(i=1,2表示第i个终端)表示发射功率,Ti(pi)表示单位时间内成功传输的有效信息量,有效吞吐量Ti(pi)表示为:

2.2 终端效用

假设D2D网络中位置相近且属于不同用户的两个终端建立合作关系,图2给出了合作终端的帧结构。其中,终端传输的每帧时长为T s,每帧中的符号周期为T0 s。因此,终端在一帧中传输的TDMA符号(时隙)数量N=T/T0。在D2D协作通信系统中,终端T1和终端T2互为中继,终端T1用T12 s中继终端T2的数据,用(T-T12)s传输自己的数据;终端T2用T21 s中继终端T1的数据,用(T-T21)s传输自己的数据。对于终端T1来说,有时长为T21的数据会被终端T2中继,在接入点处利用最大比合并与自己直接发送的那部分数据合并,获得协作分集。而剩余的时长为(T-T12-T21)的信息只会被直接发送,从而无法获得协作分集。同样,终端T2产生的数据经历相似的过程到达接入点。

通过式(2)对效用函数的定义,如果终端T1的发射功率为p1,则终端T1的效用函数可表示为:

3 基于博弈论的时隙分享合作策略

上文所描述时隙分享问题的纳什谈判解表示方式为[14]:

过求解上式,可得T12和T21为:

如果协作带宽分配满足上述条件,则终端T1和终端T2进行合作,否则终端T1和终端T2采用直传策略,即T12=0,T21=0。

4 实验结果及分析

仿真模型由一个接入点和两个终端组成,如图3所示。假设接入点在原点的位置上,终端T1在X轴方向移动,其坐标为(d1,0);终端T2在y=50的直线上运动,其坐标为(d2,50)。图3中,d1D为终端T1到接入点的距离;d2D为终端T2到接入点的距离;d12为终端T1到终端T2的距离。仿真中的其他参数设置为:每帧的时长T=5 ms,每帧中的数据I为80 bit,其中有用信息为L=64 bit,假设终端T1和终端T2的带宽均W=1 MHz,噪声功率N0W=5×10-15 W,终端T1和终端T2的发射功率均为0.1 W,调制方式为M-QAM,其误码率如式(7)所示。

图4给出了终端T1和终端T2谈判能力随γ2D变化的情况。仿真实验中,d1D=800 m,终端T2在y=50直线上从(0,50)处开始向右移动。从图4中可以看出,当终端T2距离接入点较近时,其与接入点之间的信噪比γ2D大于终端T1与接入点之间的信噪比γ1D,故此时终端T2到接入点的信道条件好于终端T1到接入点的信道条件,终端T2在谈判中具有优势地位,因此,其具有更大的谈判能力;反之,则终端T1的谈判能力大于终端T2的谈判能力。

图5给出了DCUGP随γ2D变化的情况。当γ2D>12.63 dB时,DCUGP为零,这是因为随着终端T2到接入点的距离变近,信噪比γ2D变大,终端T2到接入点的信道条件变好,对终端T2来说没必要采取合作。当γ2D<-0.27 dB时,终端效用增益乘积也为零,这是因为随着终端T2到接入点的距离变远,终端T2到接入点的信道条件变差,合作传输效率变低,对终端T1来说没有必要合作。而当-0.27 dB≤γ2D≤12.63 dB时,终端效用增益乘积大于零,说明合作给终端T1和终端T2都带来了好处,在此情况下,终端T1和终端T2采取合作传输策略,本文所提策略起到了激励合作的作用。

图6比较了终端采用合作策略的效用和U1(p1)+U2(p2)与直传的效用和

由图6可以看出,当-0.27 dB≤γ2D≤12.63 dB时,终端采用合作策略的效用和与直传相比有了明显提升;当γ2D<-0.27 dB或γ2D>12.63 dB时,由于终端T1和终端T2不合作,因此合作时的效用和与直传时的效用和相等。

图7给出了终端协作带宽分配随信噪比γ2D变化情况。由图7可以看出,当γ2D<7.39 dB时γ1D>γ2D,此时T21>T12,说明终端T2到接入点的信道条件劣于终端T1到接入点的信道条件,因此终端T2需要提供更多的带宽换取终端T1的合作;当γ2D=7.39 dB时,此时T21=T12,说明终端T2到接入点与终端T1到接入点具有相同的信道条件,因此终端T1与终端T2具有相同的协作带宽分配;当7.39 dB<γ2D≤12.63 dB时,此时T21<T12,说明终端T2到接入点的信道条件优于终端T1到接入点的信道条件,因此终端T1需要提供比终端T2更多的带宽以换取终端T2的合作;而当γ2D<-0.27 dB或γ2D>12.63 dB时,终端T1和终端T2采用直传方式进行传输,T21=T12=0。

5 结论

为促使D2D网络中从属于不同用户的终端进行合作通信,采用合作博弈理论中的纳什谈判方法,使互为中继的两个终端通过分享时隙的方式进行合作。首先,通过适当选取效用函数以提升终端通信的能量效率,解决了终端合作的动机问题;其次,采用拉格朗日乘数法求解了终端以多大时隙中继彼此数据,解决了终端如何合作的问题。最后,给出了终端合作的截止条件,解决了终端何时合作的问题。

参考文献

[1] 冯大权.D2D通信无线资源分配研究[D].成都:电子科技大学,2015.

[2] KLAUS D,MIKA R,CARL W,et al.Device-to-device communication as an underlay to LTE-Advanced networks[J].IEEE Communications Magazine,2009,47(12):42-49.

[3] 钱志鸿,王雪.面向5G通信网的D2D技术综述[J].通信学报,2017,37(7):1-12.

[4] QIAO J,SHEN X S,JON W M,et al.Enabling device-to-device communications in millimeter-wave 5G cellular networks[J].IEEE Communications Magazine,2015,53(1):209-215.

[5] FENG D Q,LU L,YI Y W,et al.Device-to-device communications in cellular networks[J].IEEE Communications Magazine,2014,52(4):49-55.

[6] ZHANG Z,SHI J,CHEN H H,et al.A cooperation strategy based on Nash bargaining solution in cooperative relay networks[J].IEEE Transactions on Vehicular Technology,2008,57(4):2570-2577.

[7] ZHANG C,ZHAO H L.A novel fair cooperation strategy based on Kalai-Smorodinsky bargaining solution for selfish cooperative relay networks[C].Proceedings of IEEE 17th International Conference on Intelligent Transportation Systems.Qingdao:IEEE,2014:2107-2112.

[8] ZHANG G,ZHANG H,ZHAO L,et al.Fair resource sharing for cooperative relay networks using Nash bargaining solutions[J].IEEE Communication Letters,2009,13(6):381-383.

[9] JANZAMIN M,PAKRAVAN M,SEDGHI H.A gametheoretic approach for power allocation in bidirectional cooperative communication[C].Proceedings of IEEE Wireless Communications and Networking Conference.Sydney:IEEE,2010:1-6.

[10] ZHANG G,YANG K,LIU P,et al.Joint channel bandwidth and power allocation game for selfish cooperative relaying networks[J].IEEE Transactions on Vehicular Technology,2012,61(9):4142-4156.

[11] KRIKIDIS I,THOMPSON J,MCLAUGHLIN S,et al.Amplify-and-forward with partial relay selection[J].IEEE Communications Letters,2008,12(4):235-238.

[12] SARAYDAR C U,MANDAYAM N B,GOODMAN D J.Pricing and power control in a multicell wireless data network[J].IEEE Journal on Selected Areas in Communications,2001,19(10):1883-1892.

[13] GOLDSMITH A.Wireless communication[M].London:Cambridge University Press,2005.

[14] NASH J.The bargaining problem[J].Econometrica,1950,28(2):155-162.

作者信息:

张  闯1,邵  坦2,王慧武1

(1.哈尔滨电工仪表研究所有限公司,黑龙江 哈尔滨150028;2.河南许继仪表有限公司,河南 许昌461000)

 

(0)

相关推荐