猜硬币的游戏

Guess

快两个月没更新了，成天瞎忙…… 我们来看一个简单的题目吧，选自俄罗斯大神阿诺德（Влади́мир И́горевич Арно́льд）出的一百道题。[1] 题目是这样的：

一位游戏者藏起一枚 10 戈比或 20 戈比的硬币，另一位游戏者猜。猜对了就可以把硬币赢走，猜错了就要付出 15 戈比。这是个公平的游戏吗？双方最佳的混合策略是怎样的？

乍一看这游戏似乎还可以玩玩，要是猜对的几率有一半，那么作为猜的一方——且慢，我一旦猜错要付 15 戈比，可对方手里要是总是 10 戈比，我就是猜对也补不上猜错的啊？！但作为藏硬币的一方，我既不想冒太多输掉 20 戈比的风险，又不能一直出 10 戈比导致对方找到了规律，这应该怎么办呢？

题目中提到了一个词“混合策略”，这个是相对于纯策略而言的。纯策略是说你看到了一个情况，如何应对就完全确定了。但是这种互相猜的游戏，当然是出得随机让对方找不到规律才行，确定性的纯策略显然是不适用的。混合策略是指在给定的情况下，只为各种策略分配一个概率。那现在的问题，就是如何搭配这个概率了。

假设藏硬币的一方出 10 戈比的概率是 \( p\)，自然出 20 戈比的概率就是 \( 1-p\)。设猜硬币的一方猜 10 戈比的概率是 \( q\)。那猜硬币的一方赢钱数的期望就是把猜对猜错的几种可能搭配起来：

\[
\begin{split}
E &= 10pq + 20(1-p)(1-q) – 15p(1-q) – 15q(1-p) \\
&= 60pq – 35p – 35q + 20
\end{split}
\]

研究下这个式子，如果猜的人观察到了对方出 10 戈比的概率 \( p\)，那么\( E = (60p – 35) q – 35p + 20\)。自己能控制的是 \( q\)，怎样才能赢最多钱呢？显然，如果 \( p > \frac{35}{60} = \frac{7}{12}\)，那 \( q\) 就应当取尽量大，也就是一直猜 10 戈比。反过来，如果 \( p< \frac{7}{12}\)，就应当一直猜 20 戈比。可藏硬币的一方也不是等闲之辈啊，他要让赢钱的期望尽量小——如果他观察到了猜者的 \( q\)，同样的道理，如果 \( q > \frac{7}{12}\)，那 \( p\) 就应当取尽量大，也就是一直出 10 戈比。如果 \( q< \frac{7}{12}\)，就应当一直出 20 戈比。

综合下来，藏硬币一方的最佳策略就是以 \( \frac{35}{60}\) 也就是 \( \frac{7}{12}\) 的概率出 10 戈比的硬币，那么不管对方如何应对，自己的收益是一定的。这个时候猜的一方赢钱的期望是：

\[
E = – 35 \times \frac{35}{60} + 20 = – \frac{5}{12}
\]

所以这个游戏是不公平的，下次要是再遇到类似的路边摊可不要上当啦。

–
[1] Арнольд, В. И. “МАТЕМАТИЧЕСКИЙ ТРИВИУМ.” Успехи математических наук 46.1 (1991): 277.

Published by 犊犊

2 thoughts on “猜硬币的游戏”

发表回复取消回复

Published by 犊犊

2 thoughts on “猜硬币的游戏”

发表回复 取消回复

发表回复取消回复