出乎意料的概率

大英帝国彩票

“下一个赢家就是你!”这句响亮的具有极大蛊惑性的话是大英帝国彩票的广告词。买一张大英帝国彩票的诱惑有多大呢?只要你花上1英镑,就有可能获得2200万英镑!

一点小小的投资竟然可能得到天文数字般的奖金,这没办法不让人动心,很多人都会想:也许真如广告所说,下一个赢家就是我呢!因此,自从1994年9月开始发行到现在,英国已有超过90%的成年人购买过这种彩票,并且也真的有数以百计的人成为百万富翁。如今在世界各地都流行着类似的游戏,在我国各省各市也发行了各种福利彩票、体育彩票,各地充满诱惑的广告满天飞,而报纸、电视上关于中大奖的幸运儿的报道也热闹非凡,因此吸引了不计其数的人踊跃购买。很简单,只要花2元的人民币,就可以拥有这么一次尝试的机会,试一下自己的运气。

但一张彩票的中奖机会有多少呢?让我们以大英帝国彩票为例来计算一下。大英帝国彩票的规则是49选6,即在1至49的49个号码中选6个号码。买一张彩票,你只需要选六个号、花1英镑而已。在每一轮,有一个专门的摇奖机随机摇出6个标有数字的小球,如果6个小球的数字都被你选中了,你就获得了头等奖。可是,当我们计算一下在49个数字中随意组合其中6个数字的方法有多少种时,我们会吓一大跳:从49个数中选6个数的组合有13983816种方法!【备注:计算方法为C(49,6)=(49×48×47×46×45×44)÷(6×5×4×3×2×1)=13983816】

这就是说,假如你只买了一张彩票,六个号码全对的机会是大约一千四百万分之一,这个数小得已经无法想象,大约相当于澳大利亚的任何一个普通人当上总统的机会。如果每星期你买50张彩票,你赢得一次大奖的时间约为5000年;即使每星期买1000张彩票,也大致需要270年才一次六个号码全对的机会。这几乎是单个人力不可为的,获奖仅是我们期盼的偶然而又偶然的事件。

那么为什么总有人能成为幸运儿呢?这是因为参与的人数是极其巨大的,人们总是抱着撞大运的心理去参加。孰不知,彩民们就在这样的幻想中为彩票公司贡献了巨额的财富。一般情况下,彩票发行者只拿出回收的全部彩金的45%作为奖金返还,这意味着无论奖金的比例如何分配,无论彩票的销售总量是多少,彩民平均付出的1元钱只能赢得0.45元的回报。从这个平均值出发,这个游戏是绝对不划算的。

概率:直觉易出错

在社会和自然界中,我们可以把事件发生的情况分为三大类:在一定条件下必然发生的事件,叫做必然事件;在一定条件下不可能发生的事件,叫做不可能事件;在一定条件下可能发生也可能不发生的事件,叫做随机事件。在数学上,我们把随机事件产生的可能性称为概率。严格说来,概率就是在同一条件下,发生某种事情可能性的大小。概率在英文中的名称为probability,意为可能性、或然性,因此,概率有时也称为或然率。

彩票是否中奖就是个典型的概率事件,但概率不仅仅出现在类似买彩票这样的赌博或游戏中,在日常生活中,我们时时刻刻都要接触概率事件。比如,天气有可能是晴、阴、下雨或刮风,天气预报其实是一种概率大小的预报;又如,今天某条高速公路上有可能发生车祸,也有可能不发生车祸;今天出门坐公交车,车上有可能有小偷,也有可能没有小偷。这些都是无法确定的概率事件。

由于在日常生活中经常碰到概率问题,所以即使人们不懂得如何计算概率,经验和直觉也能帮助他们作出判断。但在某些情况下,如果不利用概率理论经过缜密的分析和精确的计算,人们的结论可能会错得离谱。举一个有趣的小例子:给你一张美女照片,让你猜猜她是模特还是售货员?很多人都会猜前者。实际上,模特的数量比售货员的数量要少得多,所以,从概率上说这种判断是不明智的。

其实,上面所说的彩票问题也反映了人们对概率自以为是的直觉是多么靠不住。人们在购买彩票时总是只看到那些中了大奖的故事,而不愿去考虑中大奖其实是个最典型的小概率事件,其概率低到根本不值得去买。数学专家认为,概率低于1/1000,就可以忽略不计了,而大英帝国彩票中特等奖的概率只有一千四百万分之一,即使是选号范围小一些的彩票,中到特等奖的概率一般也要五百万分之一,这样小的概率居然还有这么多人趋之若鹜。有笑话说全世界的数学家都不会去买彩票,因为他们知道,在买彩票的路上被汽车撞死的概率远高于中大奖的概率。

人们在直觉上常犯的概率错误还有对飞机失事事件。也许出于对在天上飞的飞机本能的恐惧心理,也许是媒体对飞机失事的过多渲染,人们对飞机的安全性总是多一份担心。但是,据统计,飞机旅行是目前世界上最安全的交通工具,它绝少发生重大事故,造成多人伤亡的事故率约为三百万分之一。假如你每天坐一次飞机,这样飞上8200年,你才有可能会不幸遇到一次飞行事故,三百万分之一的事故概率,说明飞机这种交通工具是最安全的,它甚至比走路和骑自行车都要安全。

事实也证明了在目前的交通工具中飞机失事的概率最低。1998年,全世界的航空公司共飞行1800万个喷气机航班,共运送约13亿人,而失事仅10次。而仅仅美国一个国家,在半年内其公路死亡人数就曾达到21000名,约为自40年前有喷气客机以来全世界所有喷气机事故死亡人数的总和。虽然人们在坐飞机时总有些恐惧感,而坐汽车时却非常安心,但从统计概率的角度来讲,最需要防患于未然的,却恰恰是我们信赖的汽车。

随意的估算也不准

不断地抛一枚硬币,当它落到地上时,出现正、反面次数相同的概率是多少?很多人都会以为随着抛硬币次数的增加,正、反面出现次数相同的概率也在递增,但这个想法错了。恰恰相反,其概率随着抛硬币次数的增加在递减。抛2次时出现正反两面各1次的概率是50%,抛6次时出现正反两面各3次的概率是31.25%,抛10次时出现正反两面各5次的概率是24.61%,抛100次时出现正反两面各50次的概率只有大约8%(当然,随着抛的次数增加,正、反面出现的次数非常接近,就是难以做到完全相同)。这说明,面对一个貌似简单的概率问题时,我们如果随意估算,轻易下结论,可能与实际情况恰好南辕北辙。

我们来看一个经典的生日概率问题。以1年365天计(不考虑闰年因素),你如果肯定在某人群中至少要有两人生日相同,那么需要多少人?大家不难得到结果,366人,只要人数超过365人,必然会有人生日相同。但如果一个班有50个人,他们中间有人生日相同的概率是多少?你可能想,大概20%~30%,错,有97%的可能!

它的计算方式是这样的:

a、50个人可能的生日组合是365×365×365×……×365(共50个)个;

b、50个人生日都不重复的组合是365×364×363×……×316(共50个)个;

c、50个人生日有重复的概率是1-b/a。

这里,50个人生日全不相同的概率是b/a=0.03,因此50个人生日有重复的概率是1-0.03=0.97,即97%。

根据概率公式计算,只要有23人在一起,其中两人生日相同的概率就达到51%!

但是,如果换一个角度,要求你遇到的人中至少有一人和你生日相同的概率大于50%,你最少要遇到253人才成。

再来看一个常见的抽奖例子。参加抽奖,当然人人都会想得奖,这时候该先抽奖还是后抽,才能让中奖机率提高呢?

恐怕很多人都会在这个问题上犯糊涂,让我们用科学方法解决这个问题吧。假设有二个酸苹果、一个甜苹果,甲乙丙依次从箱中摸出一个,谁最有机会吃到甜苹果呢?首先,甲的机会是三摸一,所以甲摸到甜苹果的概率是1/3。乙的机会如何呢?甲没有摸到的概率是2/3,然后在这个概率中计算乙摸到的概率:(2/3)×(1/2)(只剩2个苹果让乙摸)=1/3,所以乙摸到甜苹果的机率是1/3。丙呢?丙只有在甲、乙都没有摸到的情况下才可能摸到甜苹果,所以扣掉甲、乙摸中的概率,就是丙的机会大小了,其概率是1-(1/3)-(1/3)=1/3。

明白了吗?不管先摸也好,后摸也罢,每个人摸到甜苹果的机会其实都是一样的。

从赌博中发展的概率理论

既然一个事件的概率凭感觉随便估计总是容易出错,而概率又与人类生活息息相关,那人们就得严肃对待概率问题了。

概率问题的历史可以追溯到遥远的过去,很早以前,人们就用抽签、抓阄的方法解决彼此间的争端,这可能是概率最早的应用。而真正研究随机现象的概率论出现在15世纪之后,当时的保险业已在欧洲蓬勃发展起来,不过,当时的保险业非常不成熟,只是一种完全靠估计形势而出现的赌博性事业,保险公司要承担很大的不确定性风险,保险业的发展渴望能有指导保险的计算工具的出现。

这一渴望戏剧性地因15世纪末赌博现象的大量出现而得到解决。当时的主要赌博形式有玩纸牌、掷骰子、转铜币等。参加赌博的人,特别是那些专门从事以赢利为生的职业赌徒,鏖战赌场,天长日久就逐渐悟出了一个道理:在少数几次赌博中无法预料到输赢的结果,如果多次进行下去,就可能有所预料,这并不是完全的碰巧。这无意中就给学者们提供了一个比较简单而又非常典型的概率研究模型。

1654年,有一个法国赌徒梅勒遇到了一个难解的问题:梅勒和他的一个朋友每人出30个金币,两人谁先赢满3局谁就得到全部赌注。在游戏进行了一会儿后,梅勒赢了2局,他的朋友赢了1局。这时候,梅勒由于一个紧急事情必须离开,游戏不得不停止。他们该如何分配赌桌上的60个金币的赌注呢?梅勒的朋友认为,既然他接下来赢的机会是梅勒的一半,那么他该拿到梅勒所得的一半,即他拿20个金币,梅勒拿40个金币。然而梅勒争执道:再掷一次骰子,即使他输了,游戏是平局,他最少也能得到全部赌注的一半——30个金币;但如果他赢了,并可拿走全部的60个金币。在下一次掷骰子之前,他实际上已经拥有了30个金币,他还有50%的机会赢得另外30个金币,所以,他应分得45个金币。

赌本究竟如何分配才合理呢?后来梅勒把这个问题告诉了当时法国著名的数学家帕斯卡,这居然也难住了帕斯卡,因为当时并没有相关知识来解决此类问题,而且两人说的似乎都有道理。帕斯卡又写信告诉了另一个著名的数学家费马,于是在这两位伟大的法国数学家之间开始了具有划时代意义的通信,在通信中,他们最终正确地解决了这个问题。他们设想:如果继续赌下去,梅勒(设为甲)和他朋友(设为乙)最终获胜的机会如何呢?他们俩至多再赌2局即可分出胜负,这2局有4种可能结果:甲甲、甲乙、乙甲、乙乙。前3种情况都是甲最后取胜,只有最后一种情况才是乙取胜,所以赌注应按3:1的比例分配,即甲得45个金币,乙15个。虽然梅勒的计算方式不一样,但他的分配方法是对的。

三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯把这一问题置于更复杂的情形下,试图总结出更一般的规律,结果写成了《论掷骰子游戏中的计算》一书,这就是最早的概率论著作。正是他们把这一类问题提高到了理论的高度,并总结出了其中的一般规律。同时,他们的研究还吸引了许多学者,由此把赌博的数理讨论推向了一个新的台阶,逐渐建立起一些重要概念及运算法则,从而使这类研究从对机会性游戏的分析发展上升为一个新的数学分支。

由赌徒的问题引起,概率逐渐演变成一门严谨的科学。

相同的概率,不同的结论

有时,面对同一个概率事件,随着问题的着眼点不同,我们得出的结论可能截然相反。这一点会使一般人感到迷惑不解,我们在这里打一个通俗的比喻:某人是嫌疑犯,也找到了一些他的犯罪证据,但不是决定性的,若我们要求“只有找到了更重要的犯罪证据才能判他有罪”,则他将被判为无罪;反之,若要求“只有找到了证明他没有犯罪的重要证据才能判他无罪”,则他将被判有罪,在这里,着眼点的不同决定了不同的判罚。

这方面的著名事例是辛普森杀妻案。

1994年6月12日深夜,美国洛杉矶西部一个豪华住宅区里,一只小狗在不停地狂吠,引起了邻居家的注意。当人们随着狗吠声来到一住宅门前时,赫然发现两具血淋淋的尸体!警察接到报警后迅速赶到现场,发现两名死者是美国黑人橄榄球明星辛普森的妻子和一个餐馆服务员,而这所豪宅就是辛普森的家。

警方在经过大量艰苦细致的调查后,搜集到了大量证据都表明辛普森有重大杀人嫌疑:他的汽车上染有死者血迹,车道上也发现血迹,案发现场还有染血手套和其它证据;还有证人作证说在辛普森妻子死亡的时间段内看到了辛普森就在其豪华住宅附近;历年报警记录还显示辛普森曾多次暴力虐妻。这些证据都对辛普森极为不利,检察官据此向法院控告辛普森犯有一级谋杀罪。遗憾的是,控方所提供的证据中有小一部分因不符合法定程序而不被法庭采信。即便如此,在这起案件中,辛普森杀人的概率也有95%以上。

然而,最后的审判结果却让全世界大吃一惊:辛普森被无罪释放!

原来,美国的刑事法律是建立在无罪推定的基础上的,尤其是对于杀人案这样重大的案件,要最后给被告定罪,控方所提供的证据要近乎100%令人信服才行,稍有疑问就不得被判有罪。95%以上的概率不足以使辛普森被判有罪。

颇具戏剧性的是,当辛普森前妻的娘家在向法院提起民事诉讼时,法院却判决辛普森输,赔偿原告3350万美元。之所以有如此结果,是因为刑事审判与民事审判的证据采用规则有差别,在民事诉讼中,只要原告提供的证据只要比被告的有说服力就可以赢。用数学概率来表示,刑事诉讼中控方需要近乎100%的证明,民事诉讼中原告只要证明有51%以上的可能性即可。在这起案件中,95%以上的概率足以使辛普森赔得倾家荡产。

统计开辟概率新天地

早期人们对概率的研究,都局限于我们日常接触到的有限事件的组合,例如玩牌、赌博中的计算问题,彩票的中奖问题,体育比赛时的抽签问题,等等,这些都是古典概率问题。古典概率只能处理诸如赌博中有限事物的组合,有非常大的局限性。而自然与社会中有许多事件是非常复杂的,如人口统计、男女出生统计、消费统计、各种民意调查等等,无法用简单的古典概率穷尽。经过几代数学家的努力,大约用了200年的时间,概率论发生了质的飞跃,具备了与统计结合的条件,出现了统计概率。

19世纪初,由于生产力的迅猛发展,统计事业开始走向昌盛。比利时学者A·凯特勒率先把统计方法从自然科学领域推广到社会科学领域,从而为人们认识社会发展规律的客观性打开了一扇窗口。

凯特勒认为,规律躲避着我们的理智,因为我们观察到的只是单个人的行为,大量偶然性的、个体特征我们无法记录下它们。因此,需要一种崭新的、方法来反映社会的整体风貌和趋向。他把统计理论和概率理论结合起来,开创了统计概率应用的先河。

凯特勒仔细研究了当时法国、比利时和英国的司法刑事机关报的汇编,惊讶地发现,这些国家每年犯罪的次数大体不变,不仅如此,各种类型的犯罪也有惊人的重复性。凯特勒本人都为这些惊人的发现所震动,他感叹道:“这是人类多么可悲的性质啊!监狱、铁链和断头台的命运对人类来说就像国家的收入一样,可以以某种概率被预先决定。我们甚至能预先计算出来,下一年会有多少人将用和自己一样的血弄脏自己的手,有多少人将是伪造者,多少人是投毒者,这一切就像能够确定出生与死亡的数量一样。”凯特勒还分析了人的“自由意志”的其他表现,如结婚、自杀等,也得到同样的结果。在我们以为完全是由个人的自由意志决定的地方,仍然有客观规律在起作用,这真是冥冥之中无法逃脱的宿命。

凯特勒的报告引起了当时社会的轰动。从此,统计走出了原来的杂乱无章的状况。把概率应用到统计中凯特勒是第一人,科学史上将凯特勒开创性的工作看作是现代统计学的起点,凯特勒也被誉为“现代统计学之父”。从那以后,统计概率在社会中的应用得到了蓬勃发展,当时的各种社会调查,如犯罪调查、贫民调查、工业调查、城市调查等都得到了广泛开展。这些调查使得人类首次能够从数学的角度审视自身行为、并把它们置于概率论模型下进行研究。

用概率来统计的社会

统计概率对人们的观念的影响是深远的,自从十九世纪二三十年代凯特勒开创了统计概率以来,人们对统计数据规律性的信任超过了以往的任何一个时代。国家以各种报表来了解工业、农业、国防、人口、消费、犯罪等方面的资料。制定银行利息的高低需要消费指数和通货膨胀率,如果通货膨胀率高,消费指数低,银行就会考虑提高利率,反之亦然。国家举行重大活动需要了解几百年甚至上千年的天气资料,以避免遭遇恶劣天气的影响。例如,1990年北京亚运会的举办时间为8月21日至9月6日,就是因为根据统计资料显示,北京这期间遭遇恶劣天气的概率非常低。

今天,统计概率已经渗透到社会科学、自然科学的方方面面,特别是计算机的广泛运用,使社会统计工作得以全面展开。我们耳熟能详的食品检测报告、人口统计、犯罪统计、国民生产总值的统计,国家和公司为了了解民意所进行的民意调查、市场调查,无一不涉及统计概率。同时,概率统计已经变成现代人理念与信念体系中的一部分。比如,对于美国大选,可以通过民意调查,用概率统计的方式计算某个候选人的受欢迎程度。而反过来,这种数据又一定程度左右人们的好恶,致使民意倾向变化,而影响到实际的选举过程。这说明概率统计的观念也影响到每一个人的行为和生活方式。

总之,从概率的思想走出机会性(博彩)游戏的范围,到应用的不断深化,这一过程中人类的思想观念发生了巨大的转变,这就是概率带来的革命。

概率不仅出现在人类社会生活中,在大自然的精心安排之下,生命的繁殖、进化也莫不服从于概率论的神奇安排。早在1843年,捷克修道士孟德尔首先为世人揭示了大自然的奥秘。醉心于自然科学的孟德尔,在闲暇研究植物的遗传规律,他选择了豌豆作为实验材料。豌豆是一种严格自花传粉的植物,它的雄蕊被花瓣包围,将外来的花粉拒之门外;同时,具有一些如高茎对矮茎、圆形对皱形、黄子叶对绿子叶、灰种皮对白种皮等具有明显差异的性状。孟德尔发现,当把不同品种的豌豆的这些性状在遗传到下一代时,总是遵循着大约3∶1的统计概率:高茎的与矮茎的植株比例为2.84比1;圆形的与皱形的植株比例为2.96比1;黄子叶与绿子叶的植株比例为3.01比1;灰种皮的与白种皮的植株比例为3.15为1。

现在,人们在教科书中称这个奇妙的比例为孟德尔第一定律,这个比例产生的原因是由于两种遗传基因在进入下一代的杂种细胞时,彼此分离,互不干扰,最后在生物传粉过程中随机组合,所以这个规律又称“分离定律”。后来孟德尔经过艰苦的探索又发现了两对性状不同的植株进行时,不同对的遗传基因自由组合,而且机会均等。这就是孟德尔第二定律,也称“自由组合定律”。孟德尔发现的分离规律和自由组合规律实质上就是概率统计规律在遗传过程的体现。

发表评论

电子邮件地址不会被公开。 必填项已用*标注