好,所以我们先来要来看的是,这个
同时决定的这个优势可解赛局的实验,那这边呢 就是我们都会看到类似的情况,就是说一开始的决策
跟,就是我如果做第二次、第三次,不断地重复做类似的实验的时候
那虽然不是对同一个对手,可是我确实是会往这个均衡移动,所以这边有一个是
一开始我会怎么做,跟,就是长期的,我如果重复做了有经验之后会是怎么样。那我们这边要- 看的几个实验
第一个是价格竞争的实验,第二个是他们叫做 这个旅行者的两难这个实验,那
再来就是这个我们在第一堂特别有讲过的,是这个选美结果预测的这个赛局
好,那我们先来看的是价格竞争的实验,那这个是一个就是两家厂商互相竞争的这样的一个实验
那就是说,好,就说两家厂商同时决定价格,所以有p1 跟p2,那这个是在比如说0.60到1.60之间
那如果说两家厂商选的价格一样,都是p1等于
p2的话,那他们就会瓜分市场,所以就是得到就是(1+a)*p1/2
那这是他们瓜分市场的报酬,那可是呢如果说好,比如p1比p2小,比较小
的那家厂商他会拿到1*p1,可是呢,比较大的那家,就是第二家
选择p2的,他只会拿到a*p1,那所以这边的话,当然就是说,就是意思是说比较低价的- 厂商他就
抢到比较大的市占率,所以他就拿比较多的钱 那这边a就是跟,就是说人们对于这个
低价他们的反应有多大,那你可以想象说,如果最极端的情况是这个Bertrand competition,就是这个a就是0
那表示说,就是说大家都会拼命地想要去冲那个比较低的
只愿意跟比较低价的厂商买,那当然就是说,不是 每一个人都会,就是一看到什么特价就全部冲过去
那所以呢这个反应就会跟这个a有关系,那所以我们实验里面也会看到有两个,一个是a- 是0.2
这个是a非常小,所以就是接近这个Betrand competition的情况,那另外一个是a是
0.8,那这是说,哦对,我好像是,就是说
会有一些人冲过去,可是,是比较不会的,那所以这个
a越接近1是什么意思呢?就是说,对啊因为这样的话,即使我价钱比较低,可是
那为什么这个市场并没有被真的吸过去呢?那这个你可以想象就说,比如说是这个市场上的厂商
他提供这个最低价的保证,所以意思是说如果 说你跟我买,那另外一边那个买贵了
没关系,那个我会退你买贵退差价,所以
我保证说,就是我会去比照那个最低的价钱来退给你
那所以因为这样,那第二个厂商他拿到是a*p1,所以意思是说,他还是不会拿到那个p2- 的价钱,因为
他去要,他等于是用买贵退差价的办法,他还是给了另外一边这个比较
低的价钱,那当然如果这个买贵退差价的效果达到最大的时候,就是a趋近于1的时候
那所以意思是说,这个两家厂商呢,都会拿到就是1*p1这样的报酬
那可是,当然就说这个买贵退差价这样的保证不见得是 百分之一百的,所以它有可能会流失,我们实验里面是用比如用0.8
这样子。好,那所以这边的话,就是问的问题就说如果是你 你跟另外一家厂商要同时要定价,那你会怎么选?
那一样这边有两个问题。第一个是说理论上的预测是什么? 第二个是说,请问就说,如果你是在这样的实验里面你会怎么选?
那当然就是说这个可以是一次的决策,也可以是好 上一次你发现你的价钱比人家高,或比人家低,那下一次你会怎么选?
好那这边的话,理论预测是说如果这个a是小于1的时候,那你就知道说这个是Betrand competition
所以他们最后唯一的Bertrand Nash的均衡呢是所有人都选则这个最低的这个价钱
那当然原因就是因为说,好,就是你看到好,假设说 你选了1.60,我选了1.59
那会发生什么事情,那可是所以我会拿到1.59*1,你会拿到
1.60可是要打八折,所以就比这个还低,你还不如跟我一样选1.59,那我们就平分
那可是呢,那因为这样,所以那如果我知道说你要选1.59的话,我会怎么选
我看到说,我1.59的话我们要平方,可是如果我选1.58,我就可以占到比较大的市场
那所以虽然我损失一点钱,那可是我就愿意选1.58
那可是这个是互相的,所以到最后,就是唯一的Nash均衡就是呢,所有人通通都
选择最低价钱,那当然大家都杀得血流成河,消费者很高兴,可是两个厂商都觉得很可怜
好,实际上结果会不会是这样子呢
那我们来看这边的实验结果,这边的话横轴是这个时间,就是第几回合,所以第一次第二次一-
直到这个 就是它们会不断地重复,那纵轴是它们的价钱,就是从0到最高是1.6
那在那个0.6的那边,这个是Betrand Nash的预测,Nash预测是说只要a小于1
那它就是Betrand的均衡,就应该都是要选到0.6,那只要a小于1就会是
好实际上的结果,这边有两条线,第一条线呢,是这个上面是0.8的,然后下面是这个0.- 6的,那
这边有好多回合,所以你看到有很多条不同的实验
不同场次的实验得到的结果。粗的这个是整体的结果
那你就看到说,0.8虽然也是小于1,可是它好像是可以维持在比较高的价钱
那可是呢确实这个a等于0.2的时候它就一路掉到Betrand的均衡哦
那也因此,这个他们就真的尝试去
写一个这个调整的模型/学习的模型来解释说
就是确实在a在够大的时候它会到这个高的均衡,可是到这个a接近2的时候
它就往下掉,然后逼近这个,就是大家都选择最低价钱的这个Betrand Nash的均衡
那所以这边你们看到说,这边其实需要两个理论来解释它,一个是一开始,第一回合的时候他- 们会怎么选
对因为这个你记得我刚刚讲的这个进价,如果从1.6
开始,那你会希望选1.59,我会希望也选1.59
你会选1.58一直类推,这样一步一步地思考,那是不是人们可以一次就会想到底呢?
有可能如果人们能够想的步数是有限的话,那可能不是的,所以他们一开始他们会怎么选?那- 这是一个问题
那当然下一个是说好,就是给定一开始是怎么选,那没关系,上一次发生什么事情,那下一次-
我怎么调整 这样的一个学习的模型,那我会怎么样让我可以converse到
Betrand Nash还是继续维持在一个比较高的这个,我们都是 就是比较像是一个联合垄断这样一个比较高的定价
下一个实验,我们要看的是这个旅行者的两难。那这边的话一样是
两个旅行者,好故事是这样子,就是说两个旅行者的行李都丢了,那所以他们就要决定说
他们要去跟这个航空公司抱怨说,我的行李价值是多少 那所以每个人都要报一个数字,p1跟p2
那是在80到200之间,那这个航空公司很贼,他就说这样子,就是呢
你们两个报的数字呢,我会补偿你们,是补偿你们数字里面
比较低的那一个,那可是呢,因为报得比较低的这个人他比较诚实,那所以呢
我会特别就是把第二个人里面补偿的钱
拿走R,然后拿来当做是第一个人诚实申报的奖金
所以第一个人会多R,第二个人会少R,所以意思就是说呢
好,你报p1,我报p2,如果p1你比较低的话 那你会拿到p1+R,我会拿到p1
-R,那所以好,所以一样,在这一个赛局里面,理论的预测是什么?
然后第二个是说如果你在这样的一个这个 旅行者两难这个赛局的实验里面那你会报多少?
80到200你会报多少?好所以理论上的预测是说
大家都会报最低的,那原因是因为,好比如如果你报200,我报
190,那我会拿到 190+R,你会拿到190
-R,那所以相较之下,就说如果你报180
的话或者你报189,那比你报200要好
那可是如果你报189,那我报190,就是很笨,我当然要报188对不对,要故意比你
低一点,那我可以拿到188+R这个好处,那不要被惩罚
那可是问题是你也会这样想,那所以这个一步一步想下去,最后的结果就是说两边都会报最- 低的80
好,那这个当然就是说到底是不是实际上会这么做
这个其实是个有趣的问题,然后你会注意到说其实这一个实验呢跟就是我们前面看到那个
两边厂商Betrand竞争的也是类似的,那也跟我们在第一堂(课)讲的这个选美结果- 预测赛局
也是类似的。好那当然这边很有趣的另外一个事情是说这个R的大小,那所以他们实际上做-
这个实验 的时候,他们真的去用比较高的R跟比较小的R去看这个到底这个影响有多少?
好,那这边是实验结果,这边一样,横轴是10回合,1到10的回合的结果,纵轴就是这- 个从这个
200开始往下到80,对,它
这边给你看的是,它的纵轴是从200到60,可是其实那个80是最下限,
那个虚线的Nash均衡,就是这个80,这个是它可以 允许选择的最下限,那这边的一条一条线就是不同的实验
从R是5、10、25、20、50到80 那你就发现说,这个R非常小的时候,5或10的时候
大家一开始是报,可能报180,可是其实还会微浮上升到接近200
好如果我们这个,因为这个R很低 所以我背叛你的其实这个得利不是很大
那所以我们可以这个,好像是处于勾结的情况,我们都可以报很高的数字,可是当R变成20
25的时候就会开始往下掉,那如果R是50、80的时候,哇就很快地,就是10回合之内
就会掉到就是Nash均衡预测,我们几乎两个人都会只报80 那所以这边你就发现说,第一个是说理论的预测
在一开始的时候,第一回合没有一组是两个人都报80的。所以一开始
的Nash均衡的预测是不对的,那第二个是说,好,我如果做了重复地学习之后
在R过大的时候,确实,Nash均衡的预测是对的,就是
我们十回合之内就会学习,就是要来按照这个Nash均衡来做
那可是呢,这个学习的过程,其实学习的速度是受到这个R的影响,有的像
R只有20、25,它掉下来是有掉下来,可是掉下来的速度很慢
那甚至如果R非常小的时候,甚至它掉下来的速度几乎都没有
那只有在这个R够大的时候,它才会就是很快地就掉到均衡
那所以这边的话,就是学习的速度,其实是跟你设计的这个,奖惩的这个R是有关系的,那所以
第一个是说你要怎么样来解释,确实,第一回合其实不同R就有不同
结果,那第二个是说你要怎么解释说,这个它往下掉这个部分
[无声]