概率论与数理统计基础
概率论的基本概念
集合论视角
事件的表示:
- 若
是 的子事件,记作 ,特殊时有 与 至少一个发生,记作 ; 同时发生记作 或 表示从 中挖去 的部分,亦记作 或 - 若
,则两事件互斥/互不相容 与 互逆/对立
基本运算律:
- 交换律
- 结合律
- 分配律
- 对偶律:
;
概率公理化
基本原则:
- 非负性:
(任何事件发生的概率都大于等于 0) - 规范性:
(全部事件发生的概率和为 1); - 可列可加性:设
、 间互不相容,
几大重要结论:
- 逆事件概率:
- 加法公式:
- 减法公式:
- 当
时, ;当 、 相互独立时, - 若
、 相互独立,则 与 相互独立、 与 相互独立、 与 相互独立
条件概率
在
两大重要公式:
- 乘法公式:
- 全概率公式:
- 贝叶斯公式(揉合了上列两者):
随机变量及其分布
基本概念
- 随机变量分为离散型和连续型。离散型常用分布律表表示;连续型常用概率密度函数和分布函数表示。
- 分布函数
,其中 . . - 概率密度函数积分的结果是分布函数。
- 连续型的
,其中任意一点 .
常见分布律
| 名称 | 记法 | 表达式/密度函数 | 期望( | 方差( |
|---|---|---|---|---|
| 两点分布/0-1 分布 | ||||
| 二项分布 | ||||
| 泊松分布 | ||||
| 均匀分布 | ||||
| 指数分布 | ||||
| 正态分布/高斯分布 | ||||
| 标准正态分布 |
随机变量函数分布
若已知
多维随机变量及其分布
抽象地来说,
多元密度函数的积分也为
从二维区域任取一片子区域的概率为:
若
随机变量的数字特征
期望
若存在常数
若
方差
若存在常数
协方差
若存在常数
若存在常数
相关系数:
若
特别地,若
大数定律及中心极限定理
证明了“频率代替概率”。
样本及抽样分布
统计量
若
常见的统计量:
| 名称 | 记法 |
|---|---|
| 均值 | |
| 方差 | |
| 标准差 | |
| 样本 | |
| 中心矩 |
四大重要分布
Z 分布:
分布: T 分布:
F 分布:
参数估计
点估计
点估计分为矩估计和最大似然估计。通式为
若利用矩求解
特别地,当
这里面的
若利用函数求解
- 建立似然函数:
- 双边取对:
- 令
,求 即是所需的
区间估计
区间估计通式为
已知,置信区间在 之间(z 分布) 未知,置信区间在 之间(t 分布)
如果是
假设检验
小概率事件
两大重要检验
警告,分布与检验是两个不同的概念!
若总体标准差:
- 已知:使用 z 检验:
- 未知:使用 t 检验:
一般流程
- 提出假设
- 判断使用 z 或 t 检验
- 画(正态分布)图,检查拒绝域
- 将数据全部代入分布表达式,检查值与拒绝域的关系:拒绝或接受假设