博弈论复习题及答案
答:(1)该博弈有两个纯战略纳什均衡(X1,Y1)(X2,Y2),支付函数分别为(3,1)和(1,2),但对双方均有利的战略组合(X3,Y3)不是纳什均衡,因此在一次博弈中不可能出现。
(2)采用“触发战略”,即首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给予惩罚。
我们先假设这种触发策略可行,则第一阶段合作两方的策略为(X3,Y3),支付为(4,4),第二阶段合作双方的策略为(X1,Y1)或(X2,Y2),此时支付分别为(3,1)和(1,2)达到纳什均衡。
采用触发战略的两个参与人的战略是:
参与人X的战略:第一次选X3,则参与人Y为了收益最大必定会选择Y3,此时的策略为(X3,Y3)。在种情况下,Y的收益总和分别为4+2=6或4+1=5 参与人Y的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励;如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚。这两种情况下X的收益总和分别为:4+3=7 5+1=6选择合作可以使得X两次收益总和最大,所以X会选择合作。
(3)综上所述,存在着精炼的纳什均衡使得第一个阶段的得意时(4,4)(4)若战略组合(x3,y1)的得益改为(1,5),即支付矩阵如下:
此时,采用触发战略的两个参与人的战略是:
参与人X的战略:第一次选X3,若参与人为了收益最大会Y1,此时的策略为(X3,Y1),则X在第二阶段选X1以报复Y,在种情况下,Y的收益总和分别为5+1=6;若Y选择合作,则第一阶段策略组合为(X3,Y3),参与人X第二将诶段选择X1以对Y进行报复,此时参与人Y两阶段的收益总和为4+1=5,小于不合作时的收益总和,因此参与人Y不会选择合作,而会选择不合作。
参与人Y的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励;如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚。这两种情况下X的收益总和分别为:4+3=7 5+1=6,选择合作可以使得X两次收益总和最大,所以X会选择合作。(与未改变前情况相同)因此,实现第一阶段得益(4,4)的精炼纳什均衡战略组合不存在。
(5)至少能在部分阶段实现(4,4)的条件是:设(x3,y1)的得益改为(1,