-
为了
督促自己看文献汲取人类科研精华,笔者决定开设这个系列,用于记录自己阅读的统计及计算机相关或不太相关的期刊、会议文章。鉴于笔者目前仍为大二菜鸟,故可能无法完整地复现文章的观点,请多多包涵。 -
目前考虑阅读的期刊与会议包括(参考封面设计doge):
- 统计“四大”(JASA、JRSSB、The Annals of Statistics、Biometrika);
- STAT相关:STARF、ARSIA、JDS……
- CS/ML/AI相关(会议为主):JMLR、ICLR、AAAI、NeurIPS、UAI……
- 其他期刊会议(AISTATS……)
-
今日作为Day 1,找了一篇有意思的文章作为起点:
# 文章基本信息
- 标题:Fair Coins Tend to Land on the Same Side They Started: Evidence from 350,757 Flips(论文仓库:data)
- JASA 2025年第552期
- 作者:František Bartoša等(共50个人)仙之人兮列如麻
- 摘要翻译:
许多人曾抛掷硬币,但鲜少有人停下来思考这一过程中的统计学与物理学复杂性。我们收集了350,757次硬币抛掷数据,以验证由Diaconis、Holmes和Montgomery(DHM;2007)开发的人类抛硬币物理模型提出的反直觉预测。本模型认为,当人们抛掷普通硬币时,其倾向于落在初始面相同的一侧。我们的数据支持这一预测:硬币落在同一面的概率高于其他面(,),同一面偏倚的贝叶斯因子(BF)=。此外,数据揭示了这种同一面偏倚程度在个体间存在显著差异。我们的数据还证实了通用预测:当人们抛掷初始面随机确定的普通硬币时,正面朝上与反面朝上的概率相等(,,正面-反面偏倚的BF=)。进一步分析显示,随着抛掷次数增加,个体内部的同一面偏倚程度降低,这一效应与“练习使人们抛硬币更稳定”的可能性一致。因此,我们的数据为“部分(但非全部)公平抛掷者倾向于将硬币落在初始面相同的一侧”提供了有力证据。本文补充材料可在线获取,包括用于重现本研究的标准化材料描述。
# 文章主要内容
- 抛硬币作为均等机会决策的方式历史悠久且广泛使用,却很少有人思考抛硬币的结果是否真的随机。实际上,抛硬币的过程遵循牛顿物理定律,属于确定性的过程,人们感知到的随机性源于初始条件(包括起始位置、初始构型、向上的作用力和角动量)的微小波动,以及狭小的结果空间。因此,标准模型在预测抛掷一枚 公平的硬币(fair coin) 的结果时,不存在 “正反面偏倚”(heads-tails bias)。
- 然而,2007年diaconis,holmes和montgomery在论文中提出,人抛硬币的结果应该考虑硬币的微小“进动”(硬币旋转轴在抛掷过程中的变化)。他们的模型指出,这种进动会使硬币初始面朝上的时间更长,导致结果是初始面的概率更高。只有完全没有进动的条件下才没有 (初始面)同侧偏倚(same-side bias)。
- 先前的抛硬币实验大部分都没有考虑抛掷结果与初始面的关系,故无法利用其数据。2009年Janet Larwood 与 Priscilla Ku控制了硬币投掷的初始面进行实验(初始正面/反面各20000次),得到的结果(初始正面,结果正面次;初始反面,结果反面次)仍不足以说明这种偏倚的存在。
- 为求证DHM提出的偏倚假设,本研究收集了次硬币抛掷数据,这些数据提供了初始面同侧偏倚的统计学证据。但本研究也指出这一影响因个体而异,同时这一偏倚也会随着抛掷次数增加而减弱。同时,本研究也提供中等程度的证据说明不存在正反面偏倚。
# 具体的实验方法
- 这次抛掷实验组成如下:
- 人各自抛掷约次硬币,总共抛掷次;
- 人参与小时的“硬币抛掷马拉松”,共抛掷次硬币;(视频)真闲
- 另外人贡献了枚硬币。
- 为确保普适性,共使用了中不同货币/面值组合,且硬币有交换。
- 具体抛掷过程:每个人每次记录连续次抛掷硬币的结果序列。每个序列中,第一次随机选择硬币的一面朝上开始抛掷,之后每次都以上一次抛掷的结果作为初始面抛掷。若硬币未被手接住,则抛掷失败,重新从相同的初始面开始投掷。
# 结果分析
- 初步验证DHM的模型预测:次投掷中,次结果与初始面相同,占比(置信区间,基于均匀先验分布的二项分布模型),这与DHM预测的约比较接近;
# 对同侧偏倚的分析
- 对于DHM模型同侧偏倚的验证,使用带信息的贝叶斯二项检验:设成功(即结果与初始同一面)概率为,二项分布模型:
其中为总次数,为成功次数,假设如下:
其中备择假设使用了高信息量的Beta先验分布以充分体现同侧偏倚的影响。结果通过贝叶斯因子进行量化:
可用于比较不同假设对观测数据的预测能力。结果值为,说明备择假设成立的概率极大。
# 对正反面偏倚的分析
- 使用类似的方法对正反面偏倚进行假设检验:设成功(即结果为正面)概率为,二项分布模型:
- 在次实验中,正面朝上次数为次,概率为,置信区间为。
- 备择假设将上面的先验分布改为(代表先验背景知识中正反面偏倚影响较小),最终得到值为。
# 投掷人/硬币的异质性影响
- 研究结果分析发现,同侧偏倚的影响因人而异,如研究将二项分布模型扩展为分层模型:
- 总体平均偏倚与
- 人编号,硬币编号,对应具体偏移(服从)与(服从)
- 故个体偏倚可表示为:
- 最终得到模型:
其中与分别代表初始面为反面与正面。
- 建立好模型后,先用略带信息量的先验分布做参数估计,然后用高信息量先验分布做模型比较。
# 参数估计/假设检验,以及异常值处理
略(直接看论文原文吧www)
# 结论
- 通过次抛掷硬币实验得到结论:存在强有力的实证证据支持 DHM 模型的预测:硬币更容易落在与起始面相同的一面(同侧偏倚),且这个偏差是微小但精确的。
- 虽然这种偏差存在人与人之间的差异,但不违背 DHM 模型。不同人抛硬币方式不同,会导致“进动”程度不同,进而导致偏倚不同,所以人际差异是合理的。
- 另外,偏倚会随着练习减少(抛得越多,同侧偏倚越小)。约次抛硬币几乎可以消除同侧偏倚。这个原因可能是因为抛掷者抛掷技术的进步,也可能是疲劳或者注意力下降等的影响。
- 统计结论对以下改变是稳健的:
- 不同硬币类型
- 不同先验分布
- 不同分析方法
- 不同异常值剔除标准
- 最终提出建议:在使用硬币抛掷进行高风险决策时,最好隐藏硬币的初始位置。
# 简评
- 说实话,初见这篇文章笔者还以为是整活,但这毕竟是JASA上的文章,总归还是有点学习的价值()。通篇读下来,确实没用特别深的统计理论(无外乎一些假设检验+贝叶斯),总体更像是基于2007年DHM研究的实证扩展(指动用了几十人抛了几十万次硬币……)。
- 就抛硬币本身而言,文章提出的这个结论虽然确实反直觉,但其分析还是比较严谨的,或许可以作为数理统计的案例hh
以后的阅读记录形式大概就是这样了,可能会进行一些调整(比如文章内容精华的提取、相关文献的扩展、相关知识的补充等)科研人的第一步:写好文献综述
