假设20年后发生灾害的概率不为0。我们无法通过实验判断这个概率到底是大还是小,即使科学认知水平不断取得进步,这也是难以彻底解决的问题。此外,20年后是否出现严重灾害并非重复发生的现象,因此这里所谓的概率并不是客观概率。从某种意义上来看,这更接近于主观概率。
佐和隆光认为针对全球气候未来变化趋势的预测属于主观概率,在这一前提下,使用最小机会损失准则是科学、合理的。针对气候变暖问题,节能减排和转变生活方式都是不发生费用或性价比较高的应对策略。我们将这种应对策略称为无悔策略(policy)。
为了公平起见,我再介绍一本反对地球气候变暖理论的学者的书——最具代表性的怀疑论者之一伊藤公纪的著作《全球气候变暖》。这本书中介绍了科学史家米本昌平先生的观点,他认为:“到了22世纪,即使大家都认识到全球气候变暖的预测是一个错误,也能留给后人一大堆用于环保节能和防止自然灾害的技术以及装置。对于未来一代而言,所谓地球环境问题,总有一种幸运的威胁的意味。”当然,作为怀疑论者,伊藤公纪将这种想法讽刺地称为“善意的谎言”。
但是,在这一基础上,他又提出“如果不是日本将推进核电站建设作为应对全球变暖问题的措施,恐怕自己就会袖手旁观了”。这是因为“虽然采取的措施是为了防止全球变暖的问题,但是付出了建设许多核电站的代价,未来会为此感到‘后悔’”。这是极富伊藤公纪个人风格的“最小机会损失准则”。伊藤公纪并不推崇“无悔策略”的理念,批评这是一种“倒退”的“阻碍进步的观念”。但是,他还是在某些方面对无悔策略给予了肯定,并且也应用到了自己的“反核电站理论”之中。
沙万奇是这样考虑问题的
正如第一章所述,最早提出最小机会损失准则的是20世纪的统计学家沙万奇。因此,这一准则又被称为“沙万奇准则”。
第二章介绍过,正是因为提出了主观概率这一划时代的思维方式,沙万奇成为享誉世界的知名学者。这一评价来自《统计学基础》(TheFoundationofStatistics)一书。该书还对最小机会损失准则进行了说明。
沙万奇之所以会研究这一准则,是因为在统计学领域,决策准则是非常重要的主题。下面,我将就此稍做说明,以供参考。
统计学是基于搜集到的数据实施推测、分析的学科。比如,从死亡率的统计数据中,可以判断“是否由于某种环境因素发生了变化,导致许多人病亡”。通过对试验对象服用新药后的治愈率与服用安慰剂(与新药的外形看起来相同,但没有任何药效)后的治愈率进行对比分析,可以检验新药是否达到了预期的治疗效果。在这种情况下,如何对数据进行统计分析并做出结论是非常重要的问题。针对这一方法论开展研究就是统计学的工作。人们将通过数据推导出结论的方法称为“统计决策”。
20世纪的著名统计学家亚伯拉罕·瓦尔德[6]在统计决策领域做出了巨大贡献。有一个非常有意思的现象,瓦尔德深受冯·诺依曼和奥斯卡·摩根斯特恩的零和博弈理论决策思维(请参考第三章)影响,坚持认为在统计决策方面,也应采用最大最小准则。如果说得再详细一点的话,他主张将“基于数据决策”的问题视为统计学家与“自然”之间的零和博弈,应该坚持选择将最差结果转化为最有利局面的统计决策方法,也就是最大最小准则。
受到瓦尔德研究影响的沙万奇并没有直接使用最大最小准则,而是提出了最小机会损失准则。
针对统计决策的两大策略,应该如何进行选择?
下面,我将从沙万奇的书中,选择对瓦尔德与沙万奇思维方式进行比较的实例,以明确两者之间的差异。请大家一起思考一下下面的实例。
现在,让我们对是否投资某个生意做出判断。在投资生意的情况下,如果是好天气,可以赚10万日元的利润。但是,如果遇到恶劣天气,则要亏损10万日元(利润为-10万日元)。如果不投资任何生意,无论是遇到好天气还是恶劣天气,利润都是0。
在统计决策中,人们将这一博弈视为“自然与人之间的零和博弈”。也就是说,人选择的行为包括“投资”“不投资”两种,自然选择的行为包括“好天气”“恶劣天气”两种。在这种情况下,人的利润如表4-1所示,自然的利润与人的利润相反。
表4-1 人的利润表
这种零和博弈思维的奇妙之处在于将自然想象为人,设想“自然也会采取行动,尽可能增加自己的收益”。也就是说,这是将自然视为与人博弈的玩家,想象它会想方设法阻碍人的行动。在大多数人看来,自然是没有生命的,对它而言根本就谈不上收益或受损,这是非常合理的想法。不过,由于缺乏足够的证据证明,可以说认为自然没有生命的观点也没有跳出主观判断的范畴。
如果将统计决策定性为人们积极主动创造针对某种博弈的有效策略的工具,对于利用数学框架思考问题是非常有利的。这种思考方式运用了博弈理论的成果,是非常难得的。因此,我希望大家姑且将这一过程理解为思维实验,将统计决策想象成“自然与人之间的博弈”。未来,随着研究的进一步深入,这一分析方法会逐渐被完善,最终必将被更为合理的方法论取代。我们就不再需要想象自然的损益了。科学就是在重复这种思维实验的过程中,不断取得发展进步的。
从瓦尔德的逻辑思维出发,在零和博弈中,人们应该依据最大最小准则选择行动方式,具体原因如下:
当人们采取概率组合的方式决策时,假设“投资”的概率为p,那么“不投资”的概率就是(1-p)。在这种情况下,最严峻的局面就是自然出现“恶劣天气”的概率为1时(也就是说,一定会出现“恶劣天气”,根据计算公式,在这种情况下,完全没有可能出现正值)。此时,人的收益期望值就是(-10万日元)×p,这个值就是保底值。因此,为了实现最大保底值,人们应该将p值降到最低,也就是取p=0的数值。这就意味着,人们应该选择的策略是“绝对不要投资”,也就是将投资的概率降为0。
“沙万奇准则”则完全不同。这是因为沙万奇在思考问题时,着眼的是“后悔”的状态。实际上,当天气转好时,选择“不投资”的人就会感到后悔不已,觉得“早知道就投资好了,可以赚10万日元”。沙万奇主张应该将这种后悔值降到最低。那么,具体应该如何做呢?
我们应该先弃用收益表,改用机会损失作为对比数值的表格,如表4-2所示。
表4-2 机会损失对比数值表
在选择“不投资”而出现“好天气”的情况下,可能会觉得“如果投资的话,可以赚10万日元”,因此机会损失就是10万日元。在选择“投资”但出现“恶劣天气”的情况下,就会觉得“早知道不投资了,如果不投资就不会亏10万日元”,因此机会损失就是10万日元。在其他情况下,由于选择是正确的,因此,机会损失就是0日元。
在上述情况下,当人采取概率组合的方式决策时,假设“投资”的概率为p,“不投资”的概率为(1-p)。当自然选择对人而言最差的行动方式时,就意味着出现了人的最大机会损失。当p大于0。5时,如果自然选择“绝对是恶劣天气(概率为1)”的话,将出现最大机会损失,此时人的损失期望值为10p万日元。与之相对,当p小于0。5时,如果自然选择“绝对是好天气(概率为1)”的话,将出现最大机会损失,此时人的损失期望值为10(1-p)万日元。
在p不小于0。5的情况下,最大机会损失10p万日元的最小值为p=0。5时的10万日元×0。5=5万日元。在p不大于0。5的情况下,最大机会损失10(1-p)万日元的最小值也是p=0。5时的10万日元×(1-0。5)=5万日元。因此,为了将人的最大机会损失降到最低,应该将“投资”的概率设定为0。5。
如果进行概括总结,就会发现在这一博弈中,人的最小机会损失准则相当于投硬币决策,即“试着投一次硬币,出现正面就投资,出现反面就不投资”。换句话说,就是“遇到2次机会,就应该投资1次”。在这一点上,沙万奇与瓦尔德之间的分歧显而易见。
在瓦尔德的最大最小准则指导下,由于担心投资时遇到恶劣天气的最差局面,因此投资者会选择绝对不投资的极端保守行为。与之相对,在沙万奇的最小机会损失准则指导下,投资者会提前考虑如果不投资却遇到好天气时后悔的情形,从而保留0。5的投资概率。
那么,你究竟是支持瓦尔德,还是支持沙万奇呢?
真正令人意识到后悔的是想象未来的自己
真正运用最小机会损失准则是非常困难的。正如大家通过之前介绍的实例所感受到的那样,其计算方法过于复杂。不仅如此,就算不考虑计算的问题,光是想想“未来可能要后悔”的事情就足够令人感到为难了。这是因为人只有在决策失败后才会后悔。因此,如果想体会后悔的感觉,就要以失败为前提,这与人们倾向于规避消极局面的本性之间存在深深的矛盾。
但是,当后悔成为过去时,人必然会随之成长进步,这是一个不争的事实。当一个人有过为醉酒之后的严重失态而感到懊悔不已的经历后,他肯定不想再喝醉了;当一个人有过由于一时之气搞砸了人际关系的经历后,再遇到令人生气的局面,他肯定也会想着冷静应对。
使用最小机会损失准则,就是要将这种后悔之后痛改前非的领悟运用到未来的生活中。经过反复训练,人们可以反思过去的自己,同样也能预知自己未来会感到后悔的事情。在这种直面自己未来困境的挫折训练中,或多或少会伴随着艰辛和痛苦,但从另一个角度来看,这也能帮助自己不断成长进步。
[1]市场失灵是指在充分尊重市场机制作用的前提下,市场仍然无法有效配置资源和正常发挥作用的现象。
[2]《京都议定书》的全称为《联合国气候变化框架公约的京都议定书》,是《联合国气候变化框架公约》的补充条款,1997年12月在日本京都由联合国气候变化框架公约参加国三次会议制定。其目标是“将大气中的温室气体含量稳定在一个适当的水平,进而防止剧烈的气候改变对人类造成伤害”。
[3]比约恩·隆伯格(Bj),曾担任哥本哈根环境评估协会会长,哥本哈根商学院客座教授,著有《怀疑的环保论者》,强烈反对全球气候变暖的理论。
[4]气候门(climategate)事件,是指发生在2009年11月的多位世界顶级气候学家的邮件和文件被黑客公开的事件。这些邮件和文件显示,一些科学家在操纵数据,伪造证据来支持他们有关气候变化的说法。自此,人们的焦点开始转向全球气候变暖的可信度上。
[5]联合国政府间气候变化专门委员会(IalPanelonClimatege,IPCC)是世界气象组织(WMO)及联合国环境规划署(UNEP)于1988年联合建立的政府间机构。其主要任务是对气候变化科学知识的现状、气候变化对社会经济的潜在影响以及如何适应和减缓气候变化的可能对策进行评估。
[6]亚伯拉罕·瓦尔德(AbrahamWald),罗马尼亚裔美国统计学家,1902年10月31日生于罗马尼亚克卢日,主要从事数理统计研究,用数学方法使统计学精确化、严密化,取得了很多重要成果。其中最重要的两项成就是统计决策理论和序贯分析。在第二次世界大战期间,他为军需品的检验工作首次提出了著名的序贯概率比检验法,并研究了这种检验法的各种特性。他的专著《序贯分析》奠定了序贯分析的基础。瓦尔德对统计理论发展的方向有重大的影响。