第六十六夜 机制博弈(1 / 2)

加入书签

基于频率的适应机制(具体原理分析见博弈论)。

我们选择策略时往往是博弈的过程,很多同一事件的选择策略都基于频率,当选择某一策略的个体增多时,那么采取这个策略所能带来的收益将会下降。

例如,性别。

当男性在群体中占多数时,女性采取的择偶策略就会比女多男少的群体中收益大。

这是一个动态平衡的过程,自然选择总是倾向于博弈各方动态平衡,否则这个系统最终会被淘汰。

例如密西西比河中的太阳鱼,雄鱼有三种不同的择偶策略,每一种策略都有存在的合理性,并且相互之间是博弈关系。

一种是抚养策略,一种是潜藏策略,一种是拟态策略。

潜藏者体态很小,它可以偷偷找准时机让雌鱼排出的卵子受精而不被抚养者发现。

拟态者外观与雌鱼难分,也可以容易让卵子受精而不让抚养者发现,它们之间是竞争关系,但它们都必须要依赖抚养者,这个系统动态平衡。

如果任意一方数量超出,对它们的繁殖都会产生负面结果。

例如,当潜藏和拟态数量增多,这是雄性潜在进化方向,因为这是代价最小的繁殖策略。

但问题是,抚养者数量就会变少,雌鱼没有稳定的生存繁殖场所,不会排卵,而且数量众多的潜藏者和拟态者在雌鱼周围扰动,加剧雌鱼不安感,也让抚养者四处奔波疲于奔命,所有策略都失效了,他们都不能繁殖后代。

雄鱼为了达到繁殖目的,只有再次改变策略,采取代价更高的抚养者策略,系统再次达到平衡。

博弈论案例一

囚徒困境。

在博弈论中,一个著名例子是由塔克给出的"囚徒困境"(prisoner'sdilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:

如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年。

如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择"坦白"总是最优的。

显然,根据对称性,B也会选择"坦白",结果是两人都被判刑8年。

但是,倘若他们都选择"抵赖",每人只被判刑1年。

四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

但是,"坦白"是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。

单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。

正如中国古代将官员之间的行贿受贿称为"陋规"而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。

比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的"出卖"角色将会使他损失更多。

而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破"行规"。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。

案例二

智猪博弈。

"智猪博弈"(Pigs'payoffs)这个例子讲的是:

假设猪圈里有一头大猪、一头小猪。

↑返回顶部↑

书页/目录