先验链之“Hello world!”


某天有个概率面试题在窝里引起了争论:

有一对夫妇已生了一个儿子,那么这对夫妇再生一个小孩是儿子的概率是多少?

其实就是经典的扔硬币问题:

扔一次硬币,正面朝上,再扔一次还是正面的概率是多少?

有一个说法是,理由是两次投硬币的所有可能是:正正、正反、反正、反反,已经有一个正面,那么下一个还是正面的概率显然是。 然而据坊间传言,这个问题的正确答案竟然是,竟与如下问题有同解?

有一对夫妇生了两个孩子,其中一个是儿子,那么另外一个还是儿子的概率是多少?

类似的坊间传言还有很多,比如说这个赌博必胜法,实际上这是个悖论,必胜条件是要有无穷多的本金来赌博,因为输了多少钱,钱都是无穷的。 这个问题有价值的地方是可以用来做“别噎死”学派的“Hello world!”。 众生提起“别噎死”学派,无不祭出“别噎死”公式:

“别噎死”门徒们认为硬币均匀程度是个概率分布,先验设为均匀分布,借用该文中的定义,应该是。 那么扔了一次正面朝上之后,这个均匀程度被修正了,这个均匀程度的修正过程就是“别噎死”公式:

右侧正好对应的是的贝塔分布:

就是说“别噎死”门徒给出的答案不是一个固定的数值,给出的是一个分布。 “别噎死”门徒欲图通过抽样不断地修正答案。 且看“别噎死”门徒如何处理如下两个问题(其实是一个问题,不同的说法):

有一对夫妇已生了两个儿子,那么这对夫妇再生一个小孩是儿子的概率是多少?

有一对夫妇已先生了一个儿子,之后又生了一个儿子,那么这对夫妇再生一个小孩是儿子的概率是多少?

第一个问题的答案是

,而第二个问题的答案要分为两步修正这个答案。 第一步可以得到

,进一步将这个修正之后的概率分布做为下一步的先验,

与第一个问题的答案相同。 为什么相同呢?因为第一次先验的系数也在分母中出现了,于是约去了系数,且后验与似然有相同的多项式形式。 也就是为什么采用共轭先验(前文中的均匀分布,共轭先验是相对于似然而言)的实际意义。

石见石页 /
在共享协议(CC)下发布于
类别: 学术 
标签: 贝叶斯学派  频率学派  hello world  中
不愿分享?也可捐赠……