100個(gè)紅綠球,讓2萬(wàn)人集體翻車(chē),數(shù)學(xué)家「罐中難題」引爆全網(wǎng)討論
這道100個(gè)紅綠球的「罐中謎題」,兩萬(wàn)多人中僅有20%能答對(duì)?這位數(shù)學(xué)家為我們揭示了,為何概率推理謎題如此反直覺(jué)的原因?,F(xiàn)在,這些已經(jīng)掀起全網(wǎng)大討論,它們絕不僅僅是腦筋急轉(zhuǎn)彎,甚至還催生出了數(shù)篇學(xué)術(shù)論文!
一道看似簡(jiǎn)單的概率謎題,竟然讓80%的人都做錯(cuò)了?
這道題如下——
你有一個(gè)裝有100個(gè)球的罐子,罐子看不到里面,其中有n個(gè)紅球,「100-n」個(gè)綠球。n為「0,100」之間的一個(gè)隨機(jī)數(shù)。你伸手進(jìn)入罐子并取出一個(gè)球,它是紅色的,把它扔掉后,如果你現(xiàn)在再取出一個(gè)球,它更有可能是紅色還是綠色?或者兩種顏色的可能性是相等的?100個(gè)紅綠球,讓2萬(wàn)人集體翻車(chē),數(shù)學(xué)家「罐中難題」引爆全網(wǎng)討論!
目前,已經(jīng)有兩萬(wàn)多人對(duì)這道題進(jìn)行了投票,但是,只有22%的人做對(duì)了。
你的答案是什么?請(qǐng)等待后文公布正確答案。
今年1月份,當(dāng)數(shù)學(xué)家Daniel Litt在網(wǎng)上發(fā)出這道題后,引爆了眾多數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家和經(jīng)濟(jì)學(xué)家的解題熱情!
有研究者聲稱,自己如此沉迷于這道題,以至于正經(jīng)研究都無(wú)心去做了
甚至,還有一些哲學(xué)家、金融家、體育分析師參與了進(jìn)來(lái)。
甚至,這道謎題還催生了一系列相關(guān)論文,來(lái)探討謎題背后的數(shù)學(xué)意義!
論文地址:https://sites.math.rutgers.edu/~zeilberg/mamarim/mamarimhtml/MihaiNicaAliceBob.pdf
論文地址:https://arxiv.org/pdf/2405.16660
論文地址:https://arxiv.org/pdf/2406.20049
可以說(shuō),這道在線謎題真正凸顯了腦筋急轉(zhuǎn)彎對(duì)于大眾的持久吸引力。
而且,它還展示出了我們數(shù)學(xué)直覺(jué)的局限性,以及概率推理的反直覺(jué)性。
Litt表示,沒(méi)有什么比出一道多項(xiàng)選擇題更令人興奮的了,而且50000人的成績(jī)甚至比隨機(jī)選擇的還要差
這道題,究竟為什么如此反直覺(jué)?為什么簡(jiǎn)單的概率問(wèn)題,會(huì)如此出人意料地困難?
讓我們仔細(xì)討論一下,是什么造就了一個(gè)偉大的謎題。
選中紅球,下一個(gè)球是什么?
話說(shuō)回來(lái),在這道罐子謎題中,你的答案是什么?
下面公布正確答案——紅色。
怎么樣,的確十分反直覺(jué)吧。
為什么答案不是綠色,或二者概率相等呢?
Litt表示,這位來(lái)自倫敦的數(shù)學(xué)研究者George Lowther的解釋,給出了自己最為喜歡的思考方式——
想象一下,一開(kāi)始有101個(gè)球排成一行,而非100個(gè)球,再隨機(jī)挑選一個(gè)球。
然后,把它左邊的球涂成綠色,右邊的球涂成紅色,再把手里的球扔掉,便剩下100個(gè)球。
然后,隨機(jī)選擇第二個(gè)球,這個(gè)球?qū)?yīng)原問(wèn)題中的第一個(gè)球。問(wèn)題告訴你,你選了一個(gè)紅球,所以它在你扔掉的球的右邊。
現(xiàn)在挑選第三個(gè)球,這個(gè)球有三種可能的位置:
1)在第一個(gè)球的左邊
2)在第一個(gè)球和第二個(gè)球之間
3)在第二個(gè)球的右邊
在這三種可能性中,有兩種情況下,第三個(gè)選中的球是紅色的。所以球是紅色的概率是2/3。
另一位統(tǒng)計(jì)學(xué)博士Jonatan Pallesen提出了一個(gè)很好的啟發(fā)性解釋:
如果你去釣魚(yú),并很快釣到一條魚(yú),便會(huì)期望湖里有更多的魚(yú)。同樣,如果你已經(jīng)拿到一個(gè)紅球,這表明罐子里有很多紅球。
「反直覺(jué)陷阱」,為何如此有迷惑性
不過(guò),這一問(wèn)題恰恰反映出了一個(gè)反直覺(jué)的陷阱。
按理說(shuō),如果拿出了一個(gè)紅球,那么甕中紅球的數(shù)量就減少了,所以下一個(gè)球就更有可能是綠色的。
很多人都是這么想的,然而,這是一個(gè)錯(cuò)誤的直覺(jué)!
許多人堅(jiān)持認(rèn)為,因?yàn)榧t球數(shù)量減少,所以下一個(gè)球更有可能是綠色的。
Litt對(duì)此表示,「他們不愿意接受數(shù)學(xué)論證,但對(duì)模擬結(jié)果更具信服力」。
其實(shí),這是一個(gè)隨機(jī)選擇的概率,但從中獲得的信息,會(huì)影響我們對(duì)后續(xù)事件概率的判斷。
一些參與者驚訝道,如此顯而易見(jiàn)的答案,竟有很多人沒(méi)有發(fā)現(xiàn)。
我確實(shí)感到驚訝的是,我們?cè)谶@類問(wèn)題上表現(xiàn)得如此糟糕,因?yàn)楦怕逝c現(xiàn)實(shí)世界的活動(dòng)有著如此明顯的相關(guān)性。我們必須不斷地觀察世界并評(píng)估可能性,然后決定行動(dòng)方案。
或許這個(gè)問(wèn)題確實(shí)對(duì)于一些專業(yè)人士來(lái)說(shuō),的確輕而易舉。但多數(shù)人還是會(huì)掉入陷阱,為什么對(duì)他們來(lái)說(shuō),這道題會(huì)如此困難?
Litt認(rèn)為,關(guān)鍵點(diǎn)在于初始設(shè)置中的概率分布。
也就是說(shuō),罐子問(wèn)題是完全依賴于,紅球數(shù)量是根據(jù)所謂的均勻分布(即從甕中抽取)來(lái)選擇的。
當(dāng)抽出的是一個(gè)紅球,告訴你的信息是,自己處于一個(gè)「紅色的世界」中,但也只是因?yàn)長(zhǎng)itt這樣設(shè)置的問(wèn)題。
但若是,根據(jù)二項(xiàng)分布來(lái)選擇球的顏色——即通過(guò)拋硬幣來(lái)選擇每個(gè)球的顏色。
那么,即便你知道了第一個(gè)球是紅色的,但對(duì)下一個(gè)球來(lái)說(shuō),沒(méi)有什么含義,進(jìn)而不會(huì)影響后續(xù)抽取概率。
修改起始分布非常容易,這樣就能獲得紅色、綠色、或可能性等同的三種答案中的一種。
如果調(diào)整分布,就會(huì)完全改變答案,因此,一個(gè)人的直覺(jué)必須對(duì)問(wèn)題的設(shè)置非常敏感,這才是解決此類問(wèn)題的關(guān)鍵。
對(duì)此,Litt設(shè)計(jì)了一系列罐子問(wèn)題,每一個(gè)都是為了打敗某人為之前某個(gè)變體提出的啟發(fā)性解釋而設(shè)計(jì)的。
所以說(shuō),很難想出能夠檢測(cè)到這些細(xì)節(jié)的啟發(fā)性方法。
其實(shí),在現(xiàn)實(shí)世界中,我們?cè)诟怕视?jì)算上,并非那么擅長(zhǎng)。
但在生活中,有些活動(dòng)卻與概率問(wèn)題息息相關(guān)。我們通過(guò)不斷觀察世界,評(píng)估概率,然后再做出行動(dòng)方案。
Litt稱,雖然我不是心理學(xué)專家,但人們?cè)诳紤]問(wèn)題各個(gè)方面,都會(huì)變現(xiàn)出規(guī)避風(fēng)險(xiǎn),由此會(huì)系統(tǒng)地高估了/低估了極不可能發(fā)生事件的概率。
在線謎題,萬(wàn)人參戰(zhàn)
一直以來(lái),Litt專注于研究代數(shù)幾何和數(shù)論交集的領(lǐng)域,而在概率論方面,他還只是業(yè)余愛(ài)好者。
過(guò)去,他參加了一些有關(guān)概率的講座,并激發(fā)出極大的興趣,躍躍欲試。
Litt表示,「雖然概率論與日常的數(shù)學(xué)思考內(nèi)容,相去甚遠(yuǎn),但也涉及到了自己一些相對(duì)熟悉的東西」。
閑暇時(shí)候,他會(huì)提出一些簡(jiǎn)單的概率問(wèn)題。
當(dāng)自己發(fā)現(xiàn)得到了一個(gè)很酷、且反直覺(jué)的答案時(shí),便會(huì)將謎題發(fā)在X上,讓大家一起破解。
人們喜歡在社交媒體上吐槽,Litt的謎題下面,也逐漸成為大家討論的社區(qū),構(gòu)建起一個(gè)概率圈的生態(tài)系統(tǒng)。
之所以在X上討論數(shù)學(xué),是因?yàn)?020年疫情期間,Litt感到非常孤獨(dú),便發(fā)現(xiàn)在社交媒體中,與隨機(jī)的人聊自己喜歡的主題可以獲得快樂(lè)。
在Litt看來(lái),即便是拋硬幣這種最基本的概率事件,也會(huì)產(chǎn)生有趣的問(wèn)題。
就比如,前段時(shí)間,他發(fā)布的有關(guān)擲硬幣的一個(gè)謎題,便吸引了2萬(wàn)多人參與討論。
還有另一個(gè)改版的同類謎題,更是得到近5萬(wàn)位網(wǎng)友的投票。
下一個(gè)謎題:拋硬幣
下面這道拋硬幣難題,被Litt稱為自己最喜歡的謎題。
而且,僅有10%的參與者答對(duì)了,比例低到驚人!
Alice和Bob各拋硬幣100次(正面是H,反面是T)。每當(dāng)連續(xù)出現(xiàn)兩個(gè)正面HH時(shí),Alice得1分;出現(xiàn)正反面HT時(shí),Bob得1分。因此,現(xiàn)在,二人已經(jīng)得到了「THHHT」,因此Alice得2分,Bob得1分,最后誰(shuí)更有可能獲勝?
有人對(duì)此推理的是,如果列出100次拋硬幣的所有不同結(jié)果,并計(jì)算出Alice和Bob的分?jǐn)?shù)。他認(rèn)為每個(gè)人總分相同。
因此,他們預(yù)期的答案是二者相同。
但事實(shí)證明,Bob獲勝的可能性更大!這是為什么?
顯然,人們的直覺(jué)又在作祟了。
一個(gè)直覺(jué)是,Alice可以在短時(shí)間內(nèi)得很多分。例如,在連續(xù)出現(xiàn)正面HHHHHHH情況下,她在第一次之后的每次拋擲中都得分。
在100次拋擲中,Alice的分?jǐn)?shù)可以高達(dá)99,但Bob最多只能得50分。
所以Alice會(huì)以壓倒性的優(yōu)勢(shì)獲勝,這意味著她在游戲中浪費(fèi)了一些期望得分。
相較之下,Bob可能會(huì)贏得更多比賽,但每次獲勝優(yōu)勢(shì)較小。通過(guò)模擬驗(yàn)證,可以證明這個(gè)結(jié)果是正確的。
不確定的是,如果改變游戲規(guī)則的話,這個(gè)啟發(fā)性的方法是否成立。
而且,Litt表示,我不知道是否存在一個(gè)證明,能夠完全解釋這種現(xiàn)象,特別是一個(gè)適用于任意次數(shù)翻轉(zhuǎn)的證明。
概率論家、數(shù)學(xué)博士發(fā)論文
對(duì)于自己所出的概率題,Litt也做了一個(gè)證明,但僅是一個(gè)復(fù)雜,且缺乏理論的論證。
而真正讓他興奮的是,這些謎題在一大波專業(yè)人士中,掀起了熱議。
一位數(shù)學(xué)博士Sridhar Ramesh收集了一些漂亮的論證。
他將拋硬幣問(wèn)題比作成一個(gè)「隨機(jī)行走」的問(wèn)題,其中向上和向下的步驟概率相等,但速度分布不同。
從中可以獲得的關(guān)鍵觀察是,返回原點(diǎn)所需的時(shí)間,與第一步向上還是向下無(wú)關(guān)。
因?yàn)榉聪驁?zhí)行相同的步驟,也有相同的概率。
由此,可以得出,對(duì)于任何固定的行走時(shí)間,最后一步離開(kāi)原點(diǎn)的方向(向上或向下)的概率是相等的。
那么,再將這個(gè)觀察應(yīng)用到硬幣游戲中:
-HH相當(dāng)于一個(gè)單位時(shí)間的「向上」步驟
- HT^n H相當(dāng)于n+1個(gè)單位時(shí)間的向下步驟
這意味著,游戲結(jié)束時(shí),我們同樣可能在原點(diǎn)之上(Alice贏,或者存在一個(gè)可能讓游戲平局HT^n H的中間步驟),或原點(diǎn)之下(Bob贏)。
如果游戲由HHT,后面全是T組成,有可能會(huì)平局。
由于可能在HT^n H步驟的中間結(jié)束,(在給Bob一個(gè)使游戲平局的分?jǐn)?shù)后,但在返回到H之前),而不可能在HH的中間結(jié)束,所以Alice獲勝的可能性比Bob小。
Litt還表示,有一大類問(wèn)題是從最初拋硬幣問(wèn)題中衍生出來(lái)的。
對(duì)于這些問(wèn)題,很多人提出了不錯(cuò)的論證,但他個(gè)人仍然覺(jué)得,無(wú)法實(shí)現(xiàn)直觀的理解。至少?gòu)臉I(yè)余觀點(diǎn)來(lái)看,其中有很多令人驚訝的有趣的數(shù)學(xué)。
另有一位來(lái)自羅格斯大學(xué)教授Doron Zeilberger,在這些問(wèn)題中發(fā)現(xiàn)了有價(jià)值的內(nèi)容,并發(fā)表了論文。
論文地址:https://arxiv.org/pdf/2405.13561
論文中,Zeilberger編寫(xiě)了一個(gè)軟件包,用于分析這類概率問(wèn)題的長(zhǎng)期行為。
比如,他的程序可以證明在n次拋擲后(當(dāng)n非常大時(shí)),平局的概率大約是1/√n乘以某個(gè)明確的常數(shù)。
他還計(jì)算了一些稱為「矩」的量。
當(dāng)你查看Alice和Bob的得分之間的所有可能差異,這些差異的平均值為0,這也是使其成為一個(gè)難題的部分原因。
但你也可以計(jì)算「二階矩」,即對(duì)差異的平方求平均值,以及「三階矩」,即對(duì)差異的立方求平均值等等。
Zeilberger和數(shù)學(xué)家Mihai Nica提出了一個(gè)猜想,即僅僅知道二階和三階矩,就足以確定誰(shuí)贏得更多的比賽。
不過(guò),Litt認(rèn)為,這一點(diǎn)尚未完全證明。
而現(xiàn)在,又有后繼者,另一位數(shù)學(xué)家Svante Janson以及Nica正在撰寫(xiě)一個(gè)證明。
答案&一道新題
以下三道題,答案會(huì)在后面公布。
第一題:Equally likely
第二題:HTTTH
第三題:Bob
就在剛剛,Litt又發(fā)布了一個(gè)改版的罐子問(wèn)題,你認(rèn)為答案會(huì)是哪個(gè)?
個(gè)人介紹
Daniel Litt目前是多倫多大學(xué)數(shù)學(xué)助理教授。2019-2022年,他也曾在佐治亞大學(xué)擔(dān)任助理教授。
2015年,他獲得了斯坦福大學(xué)博士學(xué)位。2018年在哥倫比亞大學(xué)擔(dān)任NSF博士后。另外,2018-2019年,他還是高級(jí)研究所的成員。
總的來(lái)說(shuō),Litt對(duì)代數(shù)幾何和數(shù)論之間的相互作用感興趣,對(duì)拓?fù)鋵W(xué)也有一定的興趣。
他的大部分工作都集中在,使用算術(shù)技巧來(lái)研究比如復(fù)雜代數(shù)簇的經(jīng)典問(wèn)題。
目前,他的研究重點(diǎn)是,代數(shù)簇基本群上的算術(shù)結(jié)構(gòu),以及這些結(jié)構(gòu)和簇的幾何之間的關(guān)系。
此外,他本人其他感興趣方向包括,關(guān)于正性和消失性定理的問(wèn)題,代數(shù)簇的動(dòng)力學(xué),以及霍奇理論(廣義理解)。
目前,他得到了NSERC的資助項(xiàng)目——算術(shù)和代數(shù)幾何中的Anabelian方法,還曾是斯隆的研究獎(jiǎng)學(xué)金獲得者,以及安大略省的早期研究人員。100個(gè)紅綠球,讓2萬(wàn)人集體翻車(chē),數(shù)學(xué)家「罐中難題」引爆全網(wǎng)討論!