Skip to content

概率论与数理统计基础

概率论的基本概念

集合论视角

事件的表示:

  • BA 的子事件,记作 BA,特殊时有 A=B
  • AB 至少一个发生,记作 ABAB 同时发生记作 ABAB
  • AB 表示从 A 中挖去 B 的部分,亦记作 AABAB¯
  • AB=\empty,则两事件互斥/互不相容
  • AA¯ 互逆/对立

基本运算律:

  • 交换律
  • 结合律
  • 分配律
  • 对偶律:AB=A¯B¯=A¯B¯AB=AB=A¯B¯

概率公理化

基本原则:

  • 非负性:P(A)0​(任何事件发生的概率都大于等于 0)
  • 规范性:P(Ω)=1​(全部事件发生的概率和为 1);P(\empty)=0
  • 可列可加性:设 AiAj 间互不相容,P(A1A2...)=P(A1)+P(A2)+...

几大重要结论:

  • 逆事件概率:P(A¯)=1P(A)
  • 加法公式:P(AB)=P(A)+P(B)P(AB)
  • 减法公式:P(AB¯)=P(AB)=P(AAB)=P(A)P(AB)
  • AB=\empty 时,P(AB)=0;当 AB 相互独立时,P(AB)=P(A)P(B)
  • AB 相互独立,则 A¯B 相互独立、AB¯ 相互独立、 A¯B¯​ 相互独立

条件概率

A 发生后 B 发生的概率,记作 P(B|A)​,它仍然满足概率定义的三个条件。

两大重要公式:

  • 乘法公式:P(AB)=P(B|A)P(A)
  • 全概率公式:P(A)=P(A|Bi)P(Bi)
  • 贝叶斯公式(揉合了上列两者)P(Bi|A)=P(A|Bi)P(Bi)P(A|Bj)P(Bj)

随机变量及其分布

基本概念

  • 随机变量分为离散型和连续型。离散型常用分布律表表示;连续型常用概率密度函数和分布函数表示。
  • 分布函数 F(x)=P{Xx}[0,1],其中 F()=0,F(+)=1 .​
  • P{a<Xb}=F(b)F(a) .
  • 概率密度函数积分的结果是分布函数。
  • 连续型的 F(x<x0)=x0f(x)dx,其中任意一点 P(x=xa)=0 .

常见分布律

名称记法表达式/密度函数期望(E(X)方差(D(X)
两点分布/0-1 分布XB(1,p)
P{X=k}=pk(1p)1k
pp(1p)
二项分布XB(n,p)
P{X=k}=Cnkpk(1p)nk
npnp(1p)
泊松分布Xπ(λ)XP(λ)
P{X=k}=λkk!eλ
λλ
均匀分布XU(a,b)
f(x)={1baa<x<b0others
a+b2(ba)212
指数分布XE(θ)
f(x)={1θe1θxx>00x0
θθ2
正态分布/高斯分布Xμ(μ,σ2)XN(μ,σ2)
f(x)=12πσe(xμ)22σ2
μσ2
标准正态分布Xμ(0,1)
f(x)=12πex22
01

随机变量函数分布

若已知 xfX(x),则可得到 yfY(y)=fX(h(y))|h(y)|。其中 h(y)XY​ 关系的反函数。

多维随机变量及其分布

抽象地来说,{fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx(X,Y) 的边缘概率密度。

多元密度函数的积分也为 1++f(x,y)dxdy=1 .

从二维区域任取一片子区域的概率为:P((X,Y)G)=Gf(x,y)dxdy .

XY 相互独立 f(x,y)=fX(x)fY(y) .

XY 相互独立,且 Xμ(μ1,σ12)Yμ(μ2,σ22),则 (X±Y)μ(μ1+μ2,σ12+σ22) .

随机变量的数字特征

期望

E(X)={xipi+xf(x)dx​ .

若存在常数 C{E(C)=CE(E(X))=E(X)E(CX)=C·E(X)​ .

E(X±Y)=E(X)±E(Y)​ .

E(XY)=E(X)E(Y)+E((XE(X))(YE(X))) .

XY 相互独立,E((XE(X))(YE(X)))=0 .

方差

D(X)=E2(XE(X))=E(X22X·E(X)+E2(X))=E(X2)E2(X)​ .

若存在常数 C{D(C)=0D(E(X))=0D(CX)=C2·D(X) .

D(X±Y)=D(X)+D(Y)±2E((XE(X))(YE(Y))) .

协方差

Cov(X,Y)=E((XE(X))(YE(Y)))=E(XY)E(X)E(Y)​ .

Cov(X,X)=D(X) .

Cov(X,Y)=Cov(Y,X) .

若存在常数 CCov(X,C)=0 .

若存在常数 abCov(aX,bY)=ab·Cov(X,Y)​ .

Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)​ .

相关系数:ρXY 用于表达 XY 之间的相关性。

ρXY=Cov(X,Y)D(X)D(Y) .

XY 相互独立,ρXY=0;若 ρXY=1,则 XY​ 呈线性相关。

特别地,若 (X,Y)μ(μ1,μ2,σ12,σ22,ρXY),则:XY 相互独立 ρXY=0 .

大数定律及中心极限定理

证明了“频率代替概率”。

XB(n,p)n+Xμ(np,np(1p)) .

样本及抽样分布

统计量

X1,X2,... 为样本,则 g(X1,X2,...) 为统计量。

常见的统计量:

名称记法
均值
X¯=1nXi
方差
S2=1n1(XiX¯)
标准差
S=S2
样本 k 阶原点矩
Ak=1nXik
中心矩
Bk=1n(XiX¯)k

四大重要分布

  • Z 分布:

    Z=X¯μσnμ(0,1)
  • χ2 分布:

    Xμ(0,1)\rarrX2χ2(1)
  • T 分布:

    t=Xμ(0,1)Ynχ2(n)\rarrtt(n)
  • F 分布:

    F=Un1Yn2F(n1,n2)

参数估计

点估计

点估计分为矩估计最大似然估计。通式为 xF(x,θ),其中 θ 未知。

若利用矩求解 θ,则该方法被称为矩估计:

E(xk)=Ak=1nxik

特别地,当 k=1 时:

E(x)=X¯

这里面的 E(x) 就是想要的 θ^(也就是 θ,只是在结果中要换种写法)。

若利用函数求解 θ,则该方法被称为最大似然估计:

  1. 建立似然函数:L(xi,θ)=f(x1,θ)·f(x2,θ)·...·f(xn,θ)
  2. 双边取对:lnL(xi,θ)=f(xi,θ)
  3. (lnL(xi,θ))=0,求 θ
  4. θ 即是所需的 θ^

区间估计

区间估计通式为 xμ(μ,σ2)(正态分布),若:

  • σ 已知,置信区间在 X¯±σnza2 之间(z 分布)
  • σ 未知,置信区间在 X¯±Snta2(n1) 之间(t 分布)

如果是 χ2 分布,则置信区间为 ((n1)S2χα22(n1),(n1)S2χ1α22(n1))

假设检验

小概率事件

α0.05 的事件为小概率事件,在单次实验中几乎不发生。

两大重要检验

警告,分布与检验是两个不同的概念!

若总体标准差:

  • 已知:使用 z 检验z=X¯μσnN(μ,σ2)
  • 未知:使用 t 检验t=z=X¯μSnt(n1)

一般流程

  1. 提出假设
  2. 判断使用 z 或 t 检验
  3. 画(正态分布)图,检查拒绝域
  4. 将数据全部代入分布表达式,检查值与拒绝域的关系:拒绝或接受假设

遵从 CC BY-NC-SA 4.0