• 为了督促自己看文献汲取人类科研精华,笔者决定开设这个系列,用于记录自己阅读的统计及计算机相关或不太相关的期刊、会议文章。鉴于笔者目前仍为大二菜鸟,故可能无法完整地复现文章的观点,请多多包涵。

  • 目前考虑阅读的期刊与会议包括(参考封面设计doge):

    • 统计“四大”(JASA、JRSSB、The Annals of Statistics、Biometrika);
    • STAT相关:STARF、ARSIA、JDS……
    • CS/ML/AI相关(会议为主):JMLR、ICLR、AAAI、NeurIPS、UAI……
    • 其他期刊会议(AISTATS……)
  • 今日作为Day 1,找了一篇有意思的文章作为起点:

# 文章基本信息

  • 标题Fair Coins Tend to Land on the Same Side They Started: Evidence from 350,757 Flips(论文仓库:data
  • JASA 2025年第552期
  • 作者:František Bartoša等(共50个人)仙之人兮列如麻
  • 摘要翻译:
    许多人曾抛掷硬币,但鲜少有人停下来思考这一过程中的统计学与物理学复杂性。我们收集了350,757次硬币抛掷数据,以验证由Diaconis、Holmes和Montgomery(DHM;2007)开发的人类抛硬币物理模型提出的反直觉预测。本模型认为,当人们抛掷普通硬币时,其倾向于落在初始面相同的一侧。我们的数据支持这一预测:硬币落在同一面的概率高于其他面(Pr(同一面)=0.508Pr(\text{同一面})=0.50895%CI[0.506,0.509]95\%\mathrm{CI}[0.506,0.509]),同一面偏倚的贝叶斯因子(BF)=23592359。此外,数据揭示了这种同一面偏倚程度在个体间存在显著差异。我们的数据还证实了通用预测:当人们抛掷初始面随机确定的普通硬币时,正面朝上与反面朝上的概率相等(Pr[正面]=0.500Pr[正面]=0.500,95%CI[0.498,0.502]95\%CI[0.498,0.502],正面-反面偏倚的BF=0.1820.182)。进一步分析显示,随着抛掷次数增加,个体内部的同一面偏倚程度降低,这一效应与“练习使人们抛硬币更稳定”的可能性一致。因此,我们的数据为“部分(但非全部)公平抛掷者倾向于将硬币落在初始面相同的一侧”提供了有力证据。本文补充材料可在线获取,包括用于重现本研究的标准化材料描述。

# 文章主要内容

  • 抛硬币作为均等机会决策的方式历史悠久且广泛使用,却很少有人思考抛硬币的结果是否真的随机。实际上,抛硬币的过程遵循牛顿物理定律,属于确定性的过程,人们感知到的随机性源于初始条件(包括起始位置、初始构型、向上的作用力和角动量)的微小波动,以及狭小的结果空间。因此,标准模型在预测抛掷一枚 公平的硬币(fair coin) 的结果时,不存在 “正反面偏倚”(heads-tails bias)
  • 然而,2007年diaconis,holmes和montgomery在论文中提出,人抛硬币的结果应该考虑硬币的微小“进动”(硬币旋转轴在抛掷过程中的变化)。他们的模型指出,这种进动会使硬币初始面朝上的时间更长,导致结果是初始面的概率更高。只有完全没有进动的条件下才没有 (初始面)同侧偏倚(same-side bias)
  • 先前的抛硬币实验大部分都没有考虑抛掷结果与初始面的关系,故无法利用其数据。2009年Janet Larwood 与 Priscilla Ku控制了硬币投掷的初始面进行实验(初始正面/反面各20000次),得到的结果(初始正面,结果正面1023110231次;初始反面,结果反面1001410014次)仍不足以说明这种偏倚的存在。
  • 为求证DHM提出的偏倚假设,本研究收集了350757350757次硬币抛掷数据,这些数据提供了初始面同侧偏倚的统计学证据。但本研究也指出这一影响因个体而异,同时这一偏倚也会随着抛掷次数增加而减弱。同时,本研究也提供中等程度的证据说明不存在正反面偏倚。

# 具体的实验方法

  • 350757350757次抛掷实验组成如下:
  1. 55人各自抛掷约1500015000次硬币,总共抛掷7503675036次;
  2. 3535人参与1212小时的“硬币抛掷马拉松”,共抛掷203440203440次硬币;(视频真闲
  3. 另外77人贡献了7228172281枚硬币。
  • 为确保普适性,共使用了4444中不同货币/面值组合,且硬币有交换。
  • 具体抛掷过程:每个人每次记录连续100100次抛掷硬币的结果序列。每个序列中,第一次随机选择硬币的一面朝上开始抛掷,之后每次都以上一次抛掷的结果作为初始面抛掷。若硬币未被手接住,则抛掷失败,重新从相同的初始面开始投掷。

# 结果分析

  • 初步验证DHM的模型预测:350757350757次投掷中,178079178079次结果与初始面相同,占比50.77%50.77\%95%95\%置信区间[0.5060,0.5094][0.5060,0.5094],基于均匀先验分布的二项分布模型),这与DHM预测的约51%51\%比较接近;

# 对同侧偏倚的分析

  • 对于DHM模型同侧偏倚的验证,使用带信息的贝叶斯二项检验:设成功(即结果与初始同一面)概率为β\beta,二项分布模型:

    kBinomial(N,β)k\sim\mathrm{Binomial}(N,\beta)

    其中NN为总次数,kk为成功次数,假设如下:

    H0:β=0.5H1:βBeta(5100,4900)[0.5,1]\begin{aligned} &\mathcal{H}_0:\beta=0.5\\ &\mathcal{H}_1:\beta\sim\mathrm{Beta}(5100,4900)_{[0.5,1]} \end{aligned}

    其中备择假设使用了高信息量的Beta先验分布以充分体现同侧偏倚的影响。结果通过贝叶斯因子进行量化:

    BF10=p(dataH1)p(dataH0)\mathrm{BF}_{10}=\frac{p(\mathrm{data}\mid\mathcal{H}_1)}{p(\mathrm{data}\mid\mathcal{H}_0)}

    可用于比较不同假设对观测数据的预测能力。结果值为1.76×10171.76\times 10^{17},说明备择假设成立的概率极大。

# 对正反面偏倚的分析

  • 使用类似的方法对正反面偏倚进行假设检验:设成功(即结果为正面)概率为α\alpha,二项分布模型:

    kBinomial(N,α)k\sim\mathrm{Binomial}(N,\alpha)

  • 350757350757次实验中,正面朝上次数为175421175421次,概率为0.50010.500195%95\%置信区间为[0.4985,0.5018][0.4985,0.5018]
  • 备择假设将上面的先验分布改为Beta(5000,5000)[0.5,1]\mathrm{Beta}(5000,5000)_{[0.5,1]}(代表先验背景知识中正反面偏倚影响较小),最终得到BFBF值为0.1680.168

# 投掷人/硬币的异质性影响

  • 研究结果分析发现,同侧偏倚的影响因人而异,如研究将二项分布模型扩展为分层模型:
    • 总体平均偏倚logit(αμ)\mathrm{logit}(\alpha_\mu)logit(βμ)\mathrm{logit}(\beta_\mu)
    • 人编号k=1,2,,Kk=1,2,\cdots,K,硬币编号j=1,2,,Jj=1,2,\cdots,J,对应具体偏移γβk\gamma_{\beta_k}(服从N(0,σβ2)N(0,\sigma_\beta^2))与γαj\gamma_{\alpha_j}(服从N(0,σα2)N(0,\sigma_\alpha^2)
    • 故个体偏倚可表示为:

      logit(αj)=logit(αμ)总体同侧偏倚+γαj个体同侧偏倚的偏移logit(βk)=logit(βμ)总体正反面偏倚+γβk硬币同侧偏倚的偏移\begin{aligned} \text{logit}(\alpha_j) &= \underbrace{\text{logit}(\alpha_\mu)}_{\text{总体同侧偏倚}} + \underbrace{\gamma_{\alpha_j}}_{\text{个体同侧偏倚的偏移}} \\[1em] \text{logit}(\beta_k) &= \underbrace{\text{logit}(\beta_\mu)}_{\text{总体正反面偏倚}} + \underbrace{\gamma_{\beta_k}}_{\text{硬币同侧偏倚的偏移}} \end{aligned}

    • 最终得到模型:

      μijk={logit(αj)+logit(βk)Ys=0,ijk=1 (Starting heads)logit(αj)logit(βk)Ys=0,ijk=0 (Starting tails)Ys=1,ijkBernoulli(logit1(μijk)),\begin{aligned} &\mu_{ijk} = \begin{cases} \text{logit}(\alpha_j) + \text{logit}(\beta_k) & Y_{s=0,ijk} = 1 \text{ (Starting heads)} \\ \text{logit}(\alpha_j) - \text{logit}(\beta_k) & Y_{s=0,ijk} = 0 \text{ (Starting tails)} \end{cases}\\ &Y_{s=1,ijk} \sim \text{Bernoulli}(\text{logit}^{-1}(\mu_{ijk})), \end{aligned}

      其中s=0s=0s=1s=1分别代表初始面为反面与正面。
  • 建立好模型后,先用略带信息量的先验分布做参数估计,然后用高信息量先验分布做模型比较。

# 参数估计/假设检验,以及异常值处理

略(直接看论文原文吧www)

# 结论

  • 通过350757350757次抛掷硬币实验得到结论:存在强有力的实证证据支持 DHM 模型的预测:硬币更容易落在与起始面相同的一面(同侧偏倚),且这个偏差是微小但精确的。
  • 虽然这种偏差存在人与人之间的差异,但不违背 DHM 模型。不同人抛硬币方式不同,会导致“进动”程度不同,进而导致偏倚不同,所以人际差异是合理的。
  • 另外,偏倚会随着练习减少(抛得越多,同侧偏倚越小)。约1000010000次抛硬币几乎可以消除同侧偏倚。这个原因可能是因为抛掷者抛掷技术的进步,也可能是疲劳或者注意力下降等的影响。
  • 统计结论对以下改变是稳健的:
    • 不同硬币类型
    • 不同先验分布
    • 不同分析方法
    • 不同异常值剔除标准
  • 最终提出建议:在使用硬币抛掷进行高风险决策时,最好隐藏硬币的初始位置。

# 简评

  • 说实话,初见这篇文章笔者还以为是整活,但这毕竟是JASA上的文章,总归还是有点学习的价值()。通篇读下来,确实没用特别深的统计理论(无外乎一些假设检验+贝叶斯),总体更像是基于2007年DHM研究的实证扩展(指动用了几十人抛了几十万次硬币……)。
  • 就抛硬币本身而言,文章提出的这个结论虽然确实反直觉,但其分析还是比较严谨的,或许可以作为数理统计的案例hh

以后的阅读记录形式大概就是这样了,可能会进行一些调整(比如文章内容精华的提取、相关文献的扩展、相关知识的补充等)科研人的第一步:写好文献综述