weng.asia: 【博弈论】前三讲的笔记

Lecture1：
首先简单介绍了一下博弈论的概念和适用范围。接着介绍了其中的一个矩阵的分析方法。
请注意课堂黑板笔记，在课件文件夹中
GAME1：
你和你的对手两个人参与的游戏，游戏的结果取决于你和你对手各自的选择，只要确定了选择，结果是一定的。
第一回合：双方都是正常情况。
选择对自己有利的答案是所有同学的共识，但对有利的定义有一定的分歧。有些人考虑的是绝对的结果；而有些人则考虑在各个选择间结果的变化幅度；有些人则侧重于将自己和对手的结果综合起来作为衡量的标准。
在这个例子中，教授由于教学目的，偏向的是考虑绝对的有利于自己的结果的那个选择。（通过整个章节，我认为在此是教学目的）。这个结果被认为是优势结果。而事实上，当将两个对手综合起来看，如果你的对手处于相同的目的选择了和你一样的结果，那么对于你来说，你没有得到最大的利益，虽然从图表上看这个利益也不算最糟糕。也就是说，你的决定导致了你无法得到最大的利益。
教授因此引出了第一个观点：不要选择对你来说非常有利的选择。
而他的第二个观点建立在第一个观点上：你选择对你有利的选择其实会导致一个糟糕的结果。
第二回合：出现了所谓的天使情况（内疚）
这个我认为是教授加入的一个可变因素。这个可变因素其实不影响选择的优劣，但是影响你在得到结果后自身的反应，事实上你的反应不影响你的对手的结果。换句话说，相对之前的选择没有结果和本质变化，只有你的感觉的波动。（就像你花2000快买个ps3和买个二线品牌手提袋的区别）。如果将这反馈到你的选择上，可能会影响你做出判断。
教授因此得出了第三个观点：如果你不知道你的目的，所有的选择都是盲目的。
第三回合：我扮演恶魔（唯利是图），对手扮演天使（有内疚）
通过矩阵明显的看到，alpha依旧是一个优势选择。
第四回合：我扮演天使，对手扮演恶魔。
这种情况比较特殊，alpha不在是一个优势选择，但是，由于对手的臭名昭著，我知道他会选择对他有优势的beta，所以我选择了alpha，因为在那种情况下我选择alpha比选择beta结果要好。
教授因此得出了第四个结论：要学会换位思考。
第五个结论：耶鲁的学生是邪恶的（搞笑是教授的必要品质，呵呵）。

Lecture2：
首先是对Lecture1的一些简要的复习，包括其中的五个重点point。
接着是一个符号的定义。大家可以留意lecture2的课堂笔记中所记载的东西。这些只要看了就可以明白，笔记上也有注视。

接下来是一个通过举例说明的定义：无论对方选择如何，你选择S1都比S2强，那么，S1就是S2的优势选项。
注意点如下：在一个完整的策略中，可能会有绝对的优势选项（在所有选择中最优），和相对的优势选项（相对于有些选择最优，但是不是对全部选择最优），也有可能会出现无最优选项。

随后是另一个关于汉尼拔军事选择游戏所导出的结论：
游戏特点：你和对手的选择余地是相同的。并且你有明确的目的性。
1：在所有可能选项中，当你选择S1，对方选择S1以外策略的结果不会比你随意选择策略而对方选择S1以外策略的结果差的时候。
2：在部分可能选项中，当你选择S1，对方选择S1以外策略的结果比你随意选择策略而对方选择S1以外策略的结果好的时候。
在1，2两种情况下，S1会是一个相对优先的选择。

最后是一个关于上周数字游戏的总结。
在这个游戏中，出现了一个递阶的理性选择这个概念。你的选择是理性的，但是你的对手同样是理性的。那么毫无疑问，你可以预测你对手的选择，当然，你的对手也可以这么做。在经过重复多次的理性思考以后，毫无疑问，最后的选择将会是1.
得到这样的结果需要很多前提，当然最重要的一个是所有的参与者都是绝对理性的。也就是教授在课堂中用到的common这个词。
common这个和mutual有一定的区别。教授在最后用了帽子游戏来说明两者的区别。mutual knowledge的含义是我在看到对手时知道有对手这样的选择存在，但是对手知道我什么我却无法了解。而common knowledge的含义是我知道对手所知道的，也知道对手知道我所知道的东西。换句话说，没有秘密。
最后游戏的结果是9，毫无疑问，这样的选择是因为这个不是绝对理性的环境，也就是说关于数次不停的博弈得出结论的理性做法不是一个common knowledge。
课程大概到此结束。

课后总结：本节我们学了一点基本的术语和符号，也探讨了在没有绝对优势选项情况下的选择。最后还探讨了common knowledge的问题。
当common knowlege环境建立的时候，所有的选项似乎都会只有一个结果，这个结果是理性的，也是可以被预期的。这也就是为什么在市场上许多技术成熟的低门槛产品会利润比较低，而高科技产品技术比较高的原因。类似的例子在身边还是很多的。

第三课
在这课中我们将接触到两个事例，两个都有很深的现实意义，同样，如果一个游戏有了现实的意义，那么参与者本身就是一个变数。在分析一个复杂的情况时，我们习惯于先成立一个简单的模型，分析这个模型的变化情况，然后再逐步添加其他要素，丰富这个模型。
在第一个选举的游戏中，我们暂定的变化要素只和你选择的位置有关。规则在黑板笔记上有了详细的说明。
首先的问题是有没有绝对最佳选项？没有。事实上，这个问题可以转化为一个很有趣的说法。如果对方随机在这10个位置中进行选择，那么你准确做出对你有利的选择的可能性没有对方足够理性下你做出有利选择的可能性高。这个可能成为现实吗？我们在通过博弈论导出答案后回头再来看这个问题。
由于没有好的绝对选择，我们只能通过一个一个比较座位的方法来尝试找出一种趋势。根据我们的罗列（参考课堂笔记），我们可以看出选择2号位置好于选择1号位置。可以说2号位置是1号位置的相对优势选项。那么2号位置相对于3号位置的结论那？通过罗列我们发现3号位置不是2号位置的绝对优势选项。
看来我们没有找到最好的选择，但是我们肯定了2号位置比1号位置好，很显然，我们可以将1号位置剔除出我们的选择范围了（同理我们可以将10号剔除）。让我们看一下现在的位置情况。位置为1-10号不变，但是合适的选项为2-9号。我们再来看看这个排列，只有2-9号的排列。我们可以通过罗列的方法看出3号是2号的绝对优势选项。
得出这样结论需要注意的重要点有以下几个：
1：我们参考的位置从1-10号10个位置变为了2-9号8个位置。请记住，1号位置在我们的考虑中被完全剔除了，它不存在了，不论任何情况都不会选择它，它被隐藏了。
2：1号位置事实上是存在的，只是不在我们的选择范围内，这点非常重要。
2号成为了这个可选范围内的新的牺牲品，3号是2号的完全优势选项。我们剔除了2号，和先前的类似，我们的选择范围再次缩小变成了3号到8号。
同理，我们逐步逐步缩小，最后得到了5号和6号。
看来这就是我们最后的结论了。
得出这个结论看似有些断章取义，我们在做出选择的时候无视了一些可能在某些特定情况下相对可能更好的选项。我们主观的认为这些特殊情况不会被采用。在这种看似合理，却又有所矛盾的背景下。我们最后得出了5，6两个位置。
但是，事实上，我们通过罗列也可以看出5，6是最好的选择，当一个人选择5，或者6的时候，他至少处于不败之地。唯一的可能性就是对手也选择5，或者6。至少它成功的机会为80%。
这是不是必然？我并没有找到证据。课堂中对5，6的选择来源于一步一步的推理和剔除。而我的5，6结论来源于罗列。课堂问题并不是无懈可击，但是弱点之处确实有待进一步分析。但是这个方法的优点在于可以大规模演算，比较方便处理大规模的数据。
而我的方法确实比较繁琐，不适合大规模的数据。
但是两者却有了惊人的相同结果，这个是必然的吗？看来还需要考虑。
先写到这里，大概40%吧，晚上接着更新。
继续自己的更新
我们来进入第二个游戏，最佳进攻方案的选择。
游戏规则依旧请查看课堂笔记部分，在这里我就不再重复了。
这个游戏有以下几个特点：
1：你的选择和你对手的选择无重复点。
2：你没有绝对的优势选项，你对手也没有绝对的优势选项。
3：建立在第2点的基础上，判断对手的选择将会变得非常困难。
这3个特点是游戏本身所具备的。
进入分析阶段。
课堂中对你的选择的预期收益的计算是通过当你选择UP时，对方可能选择L,R两个中的一个，那么各取50%，综合起来作为你选择UP时的收益。在对待Middle和Down时同理。通过计算，我们可以得出一个结果，那就是选择Down的时候相对的收益最高。
很明显，这样的分析有局限性。它几乎避开了考虑对手选择的可能性，完全由自身出发，考虑了一个相对的结果。但是，我要指出的一点是，这样的选择不见得是糟糕的。事实上你选择Down的时候，当对手选择L或者R时，你都将获一个相对其他选择中等的一个结果，不是最好，也不是最糟糕的。而不论你选择U或者M的时候，好消息是你都将有50%的机会去天堂，坏消息是50%的几率你会去地狱。
因此，就这个游戏来说。我们完全考虑自己的情况下，得出了一个相对中性的结果。
课程接着介绍了一个将问题模型化的方法。通过图表。
在一个类似矩形的图形中，左侧纵轴代表选择对手L时你的收益。右侧纵轴代表对手选择R时你的收益。底侧横轴代表你对对手选择R的可能性的评估。左侧为0%，右侧为100%。并且构筑了一个函数图表。从中我们可以直观的看出在你对对手的可能性做出一定估计以后，你可以做出相对比较合适的选择。
这个方法也有一定的局限性。首先是你对对手评估的方法不在这个分析方法中，也就是你凭空给了这个游戏一个条件。其次，根据实际情况，我们知道，这个游戏的模型函数不是连续的，也就是说收益不会随着自己对对手的猜测而成线性变化。
综合两个方法，都有一个致命的问题，那就是你无法通过已有的条件得出对手的可能举措，也就是说，你所有的对策都是建立在一个有一定假设的基础上的。如果要我说的话，我想把它归咎成为是一个"防守游戏"，即一个你没有主动权的游戏。对手可能会有与你相似的问题，但是很遗憾，从各个方面来看，你的选择都取决于你的运气。
以上只是我的课堂笔记和一些初步的想法。
第三课带给我们很多的思考，有太多的问题值得考虑。
比如：更改几个数据是不是会直接影响理论上的选择？如果多几个选项，函数的图表如何建立？重复的博弈会不会是一个智者一步一步走向愚蠢的过程？等等等等，太多了，欢迎大家积极参与讨论，积极发帖。

http://www.douban.com/group/topic/12892881/

weng.asia

2012年9月15日星期六

【博弈论】前三讲的笔记

没有评论:

发表评论