快要期末了,笔者发现好多题目不够熟练,故紧急把一些知识点整理成cheatsheet,也相当于复习了。
# 概率空间
- 样本点、样本空间、随机事件、事件域、样本空间分割的概念(略,看书)
- 概率的四种确定方法+公理化定义(见下):
- 非负性:;
- 正则性:;
- 可列可加性:当互不相容,有
- 本质为集函数(将集合映射到实数域)
- 概率空间:(下面如无特别说明,均在此空间下讨论)
# 概率的性质
- 对立事件概率、有限可加性、可减性、单调性、有界性、加法公式(容斥定理,庞加莱公式)、次可加性
- 概率为的事件不一定为不可能事件
- 可列可加性有限可加性,反之不然
- 概率的连续性:
- 极限事件:
- 对于单调不减事件列(),为
- 对于单调不增事件列(),则为
- 集函数的上(下)连续性:对于单调不增(减)的事件列满足
(记忆:可以将事件包含关系理解为叠高楼,被包含的事件在上面)
- 概率测度满足上(下)连续性
- 极限事件:
- 概率等价定义:可列可加性替换为有限可加性+连续性
# 常见概率模型
- 不返回抽样(超几何模型):
- 返回抽样
- 盒子模型
- 配对模型(人拿个帽子,一人一个,至少一人拿到自己帽子的概率)
# 随机事件的独立性
- 定义:
- 独立事件不一定互斥(如掷骰子,),互斥事件不一定独立(比如两个事件概率均不为)
- 多个随机事件的独立:
- 两两独立、三三独立、相互独立(简称独立)
- 若相互独立,则与独立,与独立,与独立
- 相互独立条件下的庞加莱公式:
- 事件类的独立
- 有限个随机事件类的独立——每个事件类中任取一个随机事件结合,相互独立
- 任意多个随机事件类独立——基于有限子集事件类的独立性
- 事件域的独立性
# 条件概率
- 定义:在概率空间中,且,则,定义
- ,与相互独立
- 其他性质:
- ;
- 若,则
- 若,则
- 乘法公式:
- ,且,则
- 推论1:,则有
- 推论2:,则
- 全概率公式:
- ,,则
- 推论:设为的一组分割,,则对任意有
- 贝叶斯公式(后验概率公式):
- 设为样本空间的一组分割,,且有,则有
# *可测映射
- -代数:设是给定的非空集合,是由的部分子集组成的集合类,若满足下列条件,则称为上-代数:
- ;
- 若 则 ;
- 对任意,若 则 .
- 定义(所有子集集合,有时也记为);.
- 设,则称集类
为由生成的-代数,记为。
- 注:设,记
记为所生成集合在上的-代数,则有:
这也是条件概率的理论基础。
- Borel -代数:设,
则称为Borel -代数或Borel域,记为,称中的集合为borel集。(注:之后的随机变量定义中,采用)
- 可测映射:
- 设为集合到上的映射,对任意,定义
即建立了到上的映射.
若,记 - 定理1:设为到上的映射,,则.
- 定理2:设为到上的映射,,则,且.
- 设为集合到上的映射,对任意,定义
- 可测空间:若,则称为可测空间。
- 可测映射:设和是两个可测空间,为到上的映射,若对任意,成立,则称为到上的可测映射,记为.
- 定理:设和是两个可测空间,其中。若为到上的映射,且对任意,成立,则.
- 推论:设为可测空间到Borel域上的映射,则为可测映射.
- 可测映射的复合:若是由到上的可测映射,是由到上的可测映射,则与的复合映射是由到上的可测映射.
- 若是可测空间到Borel域上的可测映射,称
为由诱导的-代数。为使得可测的最小-代数。
# 排列组合
- 略,除了一个重复组合:
- 本质:已知一个正整数,求将其分为个非负整数之和的不同方案数,即求
- 计算:可理解为将个球和个隔板进行组合,个位置先选出个位置放球,剩下位置放隔板,隔板间球的数量即为分配的非负整数。故总方案数为。
# 随机变量
- 定义:可测空间到上的可测映射。
- 等价定义:给定概率空间,为定义在上的实值函数(将中元素映射到上),则为随机变量
- 当取值只有两个值时,称为伯努利随机变量;取值只有一个值时称为常值随机变量。
- 示性函数:设,称
为的示性函数。可知为伯努利随机变量。
# 分布函数
- 定义:设为随机变量,对任意实数,称函数为随机变量的(累积)分布函数(记为d.f.)。
- 常值随机变量的分布函数
也被称为退化分布函数。
- 不同的随机变量可能有相同的分布函数。
- 性质:
- 单调性:;
- 有界性:,;
- 右连续性:()
- 常用公式:
- ,
# 概率分布
# 离散型分布
- 定义:若随机变量可能取值为,则称为的分布列(记为p.f.),并称为离散型随机变量(具有离散型分布)。
- 分布列形式:
- 性质:非负性、正则性(略)
- 定理1:若离散型随机变量有分布列,则的分布函数为
- 定理2:若离散型随机变量有分布列,则
- 分布函数特征:阶梯型、间断点为可能取值点、跳跃高度为该点概率值
- 已知分布函数求分布列:若为分布函数,则可能取值点为的所有间断点,分布列为
# 连续型分布
- 定义:设随机变量分布函数为,若存在函数使得对任意,满足成立,则称为连续型随机变量(具有连续型分布),称为概率密度函数(记为p.d.f.)
- 性质:
- 在上连续,故对;
- 若随机变量的概率密度函数为,则
故在处取值反映了在附近取值可能性大小(但不是概率值)。
- 非负性、正则性(略)
- 注:概率密度函数可以有间断点(如分段函数)
- 定理1:若随机变量有概率密度函数,,则
- 定理2:若概率密度函数为偶函数,则对任意实数,分布函数满足
# *混合型分布
- 定义:若为离散随机变量分布函数,为连续随机变量分布函数,则,为混合型分布函数。
# 常用离散分布
- 二项分布
- 分布列:
- 记为
- 当时称为两点分布(或0-1分布)
- 几何分布
- 分布列:
- 记为
- 具有无记忆性:
- 负二项分布(帕斯卡分布)
- 分布列:
- 记为
- 与几何分布关系:
- 泊松分布
- 分布列:
- 记为
- 泊松定理:设,则对给定正整数,有
- 应用:当很大,很小时()可以用二项分布列近似泊松分布列
- 超几何分布
- 分布列:()
- 记为
- 当固定,,时,超几何分布近似于二项分布
# 常用连续型分布
- 正态分布
- 概率密度函数:
- 记为
- 性质:
- 关于对称,在处取得最大值;
- 控制对称轴位置,控制陡峭程度。
- 标准正态分布:取,概率密度函数被记为,其对应的分布函数被记为。
- 性质:,
- 正态分布标准化:当,则
- 推论:设,则分布函数.
- 正态分布准则(略)
- 均匀分布
- 概率密度函数:
- 记为
- 分布函数:
- 概率密度函数:
其中
()
- 记为
- 当时,为指数分布
- 概率密度函数:
- 分布函数:
- 具有无记忆性
- 当时,为卡方分布
- 概率密度函数:
# 数学期望和方差
# 数学期望
-
定义:
- 设离散型随机变量有分布列,若
绝对收敛,则称其为的数学期望,记为;
- 设连续型随机变量有概率密度函数,若
绝对收敛,则称其为的数学期望,也记为;
- 设离散型随机变量有分布列,若
-
随机变量函数的期望:当为随机变量的函数,若存在,则
-
性质:
- (为常数)
- (为常数)
# 方差
- 定义:若存在,则称其为随机变量的方差,记为
- 另称为的标准差
- 具体计算:
- 性质:
- 常见分布期望&方差汇总:
分布 形式 期望 方差 二项分布 泊松分布 几何分布 负二项分布 超几何分布 均匀分布 正态分布 指数分布 Gamma分布
# 马尔科夫不等式
- 设随机变量且存在,则,有
- 推论:若在时单调递增,则
(当然这里条件可以放宽,只要保证时即可)
# 切比雪夫不等式
- 若随机变量的方差存在,则,有
- 推论:设的方差存在,则存在常数,满足
# 矩与其他数字特征
# 中心矩与原点矩
- 设为正整数,若数学期望存在,则称为的阶中心矩(记为),称为的阶原点矩(记为)
- 性质:
- 若高阶矩存在,则低阶矩必存在
- (二项展开式)
- 常用分布矩公式:
- 正态分布:
- Gamma分布:
(根据二项展开式计算)
- 正态分布:
# 分位数
- 设为随机变量的分布函数,,称
为(或分布)的-分位数。特别地,当严格单调时,为的解。
- 标准正态分布的-分位数一般用表示。
- 中位数:根据分位数的定义,称为(或分布)的中位数。
- 中位数满足.
# 变异系数
- 公式:
- 消除量纲的影响,用于比较不同量纲的两个随机变量的波动大小
# 偏度系数与峰度系数
- 偏度系数公式:
- 用于衡量随机变量的分布对称性:若则右偏(中位数小于均值),则左偏(中位数大于均值)

- 用于衡量随机变量的分布对称性:若则右偏(中位数小于均值),则左偏(中位数大于均值)
- 峰度系数公式:
- 其中为标准正态分布的阶原点(中心)距
- 用于刻画分布尾部的肥瘦程度(与标准正态分布相比)
- 计算Gamma分布的偏度系数与峰度系数:
因为故
# 随机向量(多元随机变量)
- 定义:
- 二维随机变量:设为定义在上随机变量,则称为二维随机变量(向量);
- 类似可定义维随机变量。
# 二维随机变量
- 联合分布函数:对任意,称为的联合分布函数
- 性质:单调性、有界性()、右连续性、非负性()
- 二维离散随机变量
- 取值有限对或可列对
- 称为的联合分布列
- 形式:
- 定理:
- 二维离散随机变量
- 设二维随机变量联合分布函数为,则存在函数使得
则称为其联合概率密度函数
- 定理:设概率密度函数为,,则
- 若可分解为,则积分可转化为
其中,为在轴上的投影。
- 若可分解为,则积分可转化为
- 设二维随机变量联合分布函数为,则存在函数使得
# 常用多维分布
- 多项分布
- 每次实验种结果,设, 记为次独立重复试验中出现次数
- 联合分布列:
- 多维超几何分布
- 个球,分为个类,第种有个,
- 联合分布列:
- 二维均匀分布
- 记为:
- 联合概率密度函数:
其中为的面积。
- 二维正态分布
- 记为:
- 联合概率密度函数:
其中
- 高维正态分布
- 记为:设为随机向量,向量
- 联合概率密度函数:
其中
为协方差矩阵,为的期望向量
- 记为
# 边际分布
- 边际分布函数
- 设随机变量联合分布函数为,则随机变量和的分布函数分别为:
- 边际分布列
- 设随机变量有分布列,则随机变量和的边际分布列为
- 边际概率密度函数
- 已知联合概率密度函数为,则随机变量和的边际概率密度函数分别为
- 一般无法由边际分布推导出联合分布;二维均匀分布的边际分布不一定是均匀分布。
- 二维正态分布的边际分布:
- 设服从二维正态分布,则服从正态分布,服从正态分布
# 随机向量的独立性
- 二维定义:若对任意,随机事件与相互独立,则称随机变量与相互独立。即:
- 等价描述:
- 若为离散随机向量,则与独立;
-
- 若为连续随机向量,则与独立;
- 二维正态分布的独立性:
- 设随机变量服从二维正态分布,则与相互独立
- 一般定义:相互独立
# 随机变量函数的独立性
- 定理:设为定义在概率空间上的随机变量,均为上的可测函数,若与相互独立,则与相互独立。
- 推论:若相互独立,则与相互独立(与为互不相同的下标,均属于)
# 随机向量函数的分布
# 一元情形
- 定理:已知随机变量有分布列或概率密度函数,则(为Borel可测函数)的分布函数为
其中
- 例子:
- 若,则;
- 若,,则
- 定理1:若随机向量的分布函数严格单调增,则
- 证明:
- 定理2:设随机变量的概率密度函数为,函数严格单调,且其反函数连续可导,则随机变量的概率密度函数为:
其中为的值域。
- 定理3(正态分布的线性不变性):设,则时,.
- 推论:当时,
- 定理4(Gamma分布线性性):设,则.
- 推论:设,则.
# 多个随机变量函数的分布(二元情形)
- 定理:设有分布列或联合概率密度函数,则(为到上可测函数)的分布函数为
- 特别地,当或时,即为求边际分布函数。
- 推论:当所有取值为,则的分布函数为
# 卷积公式
- 离散情形:设分布列为,则的分布列为
特别地,当与相互独立,则
- 连续情形:设联合概率密度函数为,则,的概率密度函数为
- 特别地,当时,的概率密度函数为
- 当然,当与相互独立,则.
- 另外,当与为分段函数时,计算就需要根据分段函数划定范围,再积分
# 概率分布的可加性
- 二项分布的可加性
- 若,且相互独立,则
- 即二项分布可视为多个相互独立的两点分布的和
- 泊松分布的可加性
- 若,且相互独立,则
- Gamma分布的可加性
- 若,且相互独立,则
- 推论:卡方分布的可加性
- 若,且相互独立,则
- 注:指数分布不具有可加性
- 正态分布的可加性
- 设服从二维正态分布,则.
- 推论:若,且相互独立,则
- 正态分布的线性性:若且相互独立,为任意常数,则
# 极值分布
- 设相互独立,分布函数为,记,则与的分布函数分别为
- 特别地,当相互独立且同分布,分布函数均为,则.
- 更进一步,当上述均为连续型随机变量,概率密度函数均为,则
# 混合型随机变量函数的分布
- 计算分布函数:使用定义()
# 随机向量变换的分布
- 注:本节所述随机变量均为连续型随机变量
- 问题:设随机变量的联合概率密度函数为,且有(为到上可测函数),试求的分布。
- 使用定义——多重积分(麻烦,略去)
- 使用坐标变换:若对任意,的逆变换存在且有连续偏导数,则的概率密度函数为
其中为的值域,为坐标变换的雅格比行列式:
# 增补变量法求联合分布函数的分布
- 问题:已知的联合分布,求的分布。
- 方法:增加一个随机变量(通常取或),再求的联合分布,最后对求边际分布。
- 例:
- 两个随机变量的积(取):
- 两个随机变量的商(取):
- 两个随机变量的积(取):
# 随机变量的数字特征
# 数学期望与方差
- 数学期望定义:设为二维随机向量,若与均存在(通过边际分布求得),则称为的数学期望(向量)【也可推广为维随机向量,下略】
- 方差定义:类似一维随机变量,故省略
- 定理:设随机变量为的函数,若存在,则
- 性质(注:下面将替换为也成立):
- 若相互独立,则
- 若与相互独立,则:
- 推论:若维随机变量,则
# 协方差
- 定义:设为二维随机变量,若存在,则称其为与的协方差,记为.
- 性质:
- (计算时更常用)
- 若与独立,则
- 协方差阵
- 设为维随机向量,若,存在,则称为的协方差矩阵
- 性质:
- 主对角线上元素为的方差
- 所有元素之和为的方差()
- 若,则 $$
- 有对称性与半正定性
# 相关系数
- 定义:若为二维随机向量,则称
为与的相关系数(也记为)
- 在实际计算中,一般采用下述公式:
即计算五个量。
- 在实际计算中,一般采用下述公式:
- 性质:
- 若,则
- ,且取等号当且仅当与有线性关系(即满足)
- 推论:
- 由可立即推得
而令即得柯西-施瓦茨不等式:
当然这个不等式在时也成立,不过就需要其他证明方法。
- 由可立即推得
- 当时,称与正/负相关(隐去了线性性);当时,称与不相关(但不代表没有关系!)
- 若与相互独立,则,即与不相关,但反之不成立
- 二维正态分布的相关系数:
- 若,则.
- 如果满足二维正态分布,则与不相关与相互独立(但如果只有与满足正态分布命题不成立)
# 条件分布
- 定义:设为二维随机变量,且对任意,(若离散,则等价于可取到;若连续,则等价于)。若对任意实数,
存在,则称其为条件下的条件分布函数,记为或。
# 条件分布列
- 设的联合分布列为,若,则条件下的条件分布列为
# 条件概率密度函数
- 设的联合概率密度函数为,与的边际概率密度函数分别为与,则()条件下的条件分布函数为
其中被称为条件下的条件概率密度函数,记为.
- 公式推导:
故
最后一个等号由微分中值定理得到。
同理,
- 公式推导:
- 注:在计算连续型随机变量条件概率(如)时不能直接使用条件概率公式(因为),而应该先求条件概率密度函数,再用积分求解。
# 条件数学期望
- 定义:设为二维随机变量,称
为条件下的条件数学期望。(在连续情形下,需要有意义)
- 另外,对于随机变量与随机事件,若,可定义关于的条件数学期望:
- 在实际运算中,一般会先求出条件分布,再使用期望公式得出。
- 注:条件数学期望是关于的函数,且可能不存在。
- 设,则可以考虑随机变量的函数,记为(即时取值)。
- 重期望公式:
- 设为二维随机变量,且存在,则.
- 本质为全概率公式:
- 条件数学期望的性质:
# 条件方差
- 定义:称
为时的条件方差(也为的函数)
- 类似有为的函数
- 条件方差公式:
- 简单证明(基于重期望公式):
- 简单证明(基于重期望公式):
# 极限理论
# 随机变量序列的收敛性
- 几乎处处收敛(依概率收敛)
- 定义:若随机变量序列满足
则称几乎处处收敛到(记为)
- 样本点角度定义:
即满足的发生的概率为
- 定义:若随机变量序列满足
- 依概率收敛
- 定义:若
则称依概率收敛到(记为)
- 与几乎处处收敛的区别:“几乎处处收敛”针对随机变量取值取极限,而“依概率收敛”针对随机变量偏离的概率求极限
- 定义:若
- 依分布收敛
- 定义:设随机变量的分布函数为,随机变量的分布函数为,如果对于的任意连续点,有
则称依分布收敛到(记为或),也称弱收敛于(记为)
- 定义:设随机变量的分布函数为,随机变量的分布函数为,如果对于的任意连续点,有
# 性质
- 几乎处处收敛性质
- 下面四个条件等价:
- Borel-Cantelli引理:设为中的随机事件列,记
表示为“事件发生无穷多次”(infinity often),那么:
- 若,则;
- 若为相互独立的事件列,且,则
- 那么由引理可得:
- 若,则;
- 若为相互独立的随机变量序列,为常数,则
- 下面四个条件等价:
- 依概率收敛性质
- 若随机变量序列满足,则(可使用马尔科夫不等式证明)
- 计算:设,则
- 判别:若,则
- 设为定义在上的连续函数,则;
-
- 依分布收敛性质
- Slutsky定理:若(为常数),则
- ;
- 时,
- Slutsky定理:若(为常数),则
# 三种收敛之间的关系
- 蕴含,反之不成立
- 对每个子列,存在子子列满足
- 蕴含,反之不成立
- 设为一个常数,则蕴含
# 特征函数
- 前提概念:
- 复值随机变量:设为上的实值随机变量,则称为复值随机变量(若存在,则称为的数学期望);
- 的共轭随机变量:;
- 的模:;
- 独立性:设,若分别与相互独立,则称与相互独立。
- 另一种形式:若与相互独立,则与相互独立
- 定义:设为随机变量,其分布函数为,则称复值函数
为(或)的特征函数。
- 任何随机变量(或概率分布)的特征函数均存在(因为)
- 常见分布特征函数:
分布 特征函数
# 特征函数的性质
- (共轭)
- 设为常数,,则
- 若与相互独立,则 比卷积公式好记
- 特征函数与矩的关系:若随机变量的阶矩存在,则的阶导数存在,且
- 定理1:设为随机变量的特征函数,则非负定,即对于任意正整数,取任意个复数与个实数,有
- 定理2(唯一性定理):概率分布由其特征函数唯一确定。设为分布函数的特征函数,则
(这一公式也被称为逆转公式)
- 定理3(连续性定理):
- 设为的特征函数,为的特征函数,则;
- 设在点连续,对任意成立,则(同上)
- 注:上面条件中在点连续是为了保证为分布函数。
# 多维随机变量的特征函数
- 定义:设为维随机变量,则称
为的特征函数,这里
- 例:设服从二维正态分布,则的特征函数为
# 矩母函数(特征函数的实数版本)
- 定义:设为一随机变量,对于使得,则称
为的矩母函数。
- 注:矩母函数不一定对所有均存在(比特征函数条件更严格)
- 若为维随机变量,则称
为的特征函数,这里
- 性质:
- 若随机变量与相互独立,则(与特征函数相同)
- 与原点矩的关系(基于泰勒展开):
- 与中心矩的关系:设,则
- 常见分布矩母函数(基本就是特征函数把换成了):
分布 矩母函数
# 大数定律
- 伯努利大数定律
- 设一次试验中事件发生的概率为,记为次独立实验中事件的发生次数,则时,
- 设一次试验中事件发生的概率为,记为次独立实验中事件的发生次数,则时,
- (弱)大数定律
- 定义:对于随机变量序列,若存在数列与(单调增且趋于无穷),且有时,
其中.则称满足(弱)大数定律。
- 注1:如无特别说明,一般取,即
- 注2:若独立同分布,上式也等价于
(伯努利大数定律就是的情形)
- 定义:对于随机变量序列,若存在数列与(单调增且趋于无穷),且有时,
- 其他大数定律(均对于随机变量序列,并设,满足下述条件之一即满足(弱)大数定律)
- 切比雪夫大数定律:两两不相关,且一致有界;
- 马尔科夫大数定律:马尔科夫条件成立,即;
- 辛钦大数定律:独立同分布且存在。
- 相互关系:
- 伯努利大数定律是切比雪夫大数定律的特例;切比雪夫大数定律是马尔科夫大数定律的推论(前者成立,后者一定成立);马尔科夫大数定律可以由切比雪夫不等式推得:
- 辛钦大数定律可以用特征函数的连续性定理证明
# (弱)大数定律的应用
- 蒙特卡洛法计算定积分:
故可以在中随机生成个均匀分布的随机数,再由大数定律,
# 更一般的大数定律(不要求数学期望存在)
- 设为相互独立的随机变量序列,对任意,记
另记,若时,
则有
即满足大数定律。
- 利用这一构造,也可以证明辛钦大数定律(略)。
# 强大数定律
- 定义:对于随机变量序列,若存在数列与(单调增且趋于无穷),且有时,
其中.则称满足强大数定律。
- 特别地,当独立同分布,且数学期望存在,则有:时,
# 中心极限定理
- 与大数定律的区别:大数定律研究的是随机变量和的均值与和的期望的关系;而中心极限定理研究的是随机变量和的分布与正态分布的关系
- 定义:设为随机变量序列,,若数学期望与方差均存在,且
依分布收敛于标准正态分布,则称满足中心极限定理。
- 性质:若满足中心极限定理,则对任意,
其中为标准正态分布的分布函数。
- Lindeberg-Lévy中心极限定理:设为独立同分布的随机变量序列,数学期望为,方差为,则满足中心极限定理。
- 可用于近似计算概率:
(提示:均值为,方差为)
- 可用于近似计算概率:
- DeMoivre-Laplace中心极限定理:设服从二项分布,则
其中为标准正态分布的分布函数。
- 注:由于二项分布为离散分布,正态分布为连续分布,故用正态分布近似二项分布时,需要做以下修正:
- 注:由于二项分布为离散分布,正态分布为连续分布,故用正态分布近似二项分布时,需要做以下修正:
- 三类应用:已知和,求概率;已知和概率,求;已知和概率,求。(具体见题目分类汇编)
- 中心极限定理比直接用切比雪夫不等式作近似计算精度更好。
# *独立不同分布情形(仅作了解)
- Lindeberg-Feller条件:对于独立的随机变量序列,若,记,若,
则称满足Lindeberg-Feller条件。
- Lindeberg-Feller中心极限定理:若独立随机变量序列满足Lindeberg-Feller条件,则对任意,
- Lyapunov定理:对于独立的随机变量序列,,记,若存在,满足
则对任意,
- 注:这里常取或。
- 推论(伯努利分布的中心极限定理):若独立随机变量序列满足,记,若,则对任意,
# *Delta方法(也仅作了解)
- Delta定理:设为随机变量序列,为连续的分布函数,为实数,数列满足,且使得
若为的函数,且有连续导函数,则
即与具有相同渐近分布。
- 推论:设随机变量序列独立同分布,具有数学期望和方差,记.设为的函数且有连续的导函数,则
- 推论:设随机变量序列独立同分布,具有数学期望和方差,记.设为的函数且有连续的导函数,则
