概率论与数理统计 - Probability Theory and Mathematical Statistics
公式整理
- 全概率
- 贝叶斯
- 随机变量
- 参数估计
- 假设校验
第一章 概率论的基本概念
条件概率与乘法公式
全概率公式
其中
贝叶斯 (Bayes) 公式
独立性
如果两事件
则这两事件相互独立
第二章 随机变量及其分布
随机变量
设随机试验的样本空间为
分布函数
则
对于极限情况有
概率密度函数
存在非负可积函数
则称
0-1 分布 (Bernoulli Distribution)
概率质量函数 (PMF):
分布函数 (CDF):
二项分布 (Binomial Distribution)
概率质量函数 (PMF):
分布函数 (CDF):
其中
泊松分布 (Poisson Distribution)
- 泊松定理
概率质量函数 (PMF):
其中
分布函数 (CDF):
其中
均匀分布 (Uniform Distribution)
概率密度函数 (PDF):
分布函数 (CDF):
指数分布 (Exponential Distribution)
概率密度函数 (PDF):
分布函数 (CDF):
正态分布 (Normal Distribution)
概率密度函数 (PDF):
分布函数 (CDF):
标准正态分布 (Standard Normal Distribution)
概率密度函数 (PDF):
分布函数 (CDF):
重要性质:
若
随机变量的函数分布
设随机变量
其中
第三章 多维随机变量及其分布(二维)
分布函数
有
离散型
连续型
特别的,有点
以及
边缘分布
以及
离散型
连续型
其中
同理
分别称为关于
条件分布
离散型
以及
连续型
有条件概率密度
同理
那么有条件概率分布
同理
相互独立的随机变量
若对于所有
则称随机变量
两个随机变量的函数分布
Z = X + Y 的分布
做变量代换
那么根据定义
通常
这两个公式又称为卷积公式
M = max{X,Y} 以及 N = min{X,Y} 的分布
相互独立
对于
即
对于
由于分布函数是个上界函数,无法约束下界,因此我们需要
获得下界
第四章 随机变量的数字特征
数学期望
离散型
连续型
性质
相互独立时,
方差
定义
性质
常见分布的期望与方差
| 分布名称 (Distribution) | 符号表示 | 数学期望 (Expected Value) | 方差 (Variance) |
|---|---|---|---|
| 0-1 分布 (Bernoulli) | |||
| 二项分布 (Binomial) | |||
| 泊松分布 (Poisson) | |||
| 均匀分布 (Uniform) | |||
| 指数分布 (Exponential) | |||
| 正态分布 (Normal) | |||
| 标准正态分布 (Standard Normal) |
协方差及相关系数
协方差定义
协方差的性质
相关系数的定义
相关系数的性质
的大小表示 之间存在线性关系的概率 时表示 不相关
切比雪夫不等式
设随机变量
第五章 大数定理及中心极限定理
大数定理
弱大数定理
设
记为
伯努利大数定理
设
或
中心极限定理
设
的分布函数
也就是说,只要
上下同除去
或
第六章 样本及抽样分布
抽样分布
设
设
样本均值
样本方差
是因为少一个自由度,因为有
样本标准差
样本 k 阶(原点)矩
样本 k 阶中心矩
卡方分布
定义
设
服从自由度为
和项数并不相关,只跟自由度有关, 的自由度为
性质
- PDF 图形不对称
- 可加性
,其中
期望和方差
t 分布 或 学生氏(Student)分布
定义
设
为服从自由度为
性质
- PDF 图像为单峰,关于
对称
F 分布
定义
设
服从自由度为
性质
- PDF 图像不对称
正态总体的样本均值与样本方差的分布
定义
设总体
而
由此也可知
是为了无偏估计
进而
性质
与 相互独立.
第七章 参数估计
矩估计法 (Method of Moments)
矩估计法的基本思想是用样本矩来估计相应的总体矩。
设总体
计算总体矩: 假设总体的前
阶原点矩存在,并记为:( 连 续 型 ) 或
( 离 散 型 ) 其中
。这些 都是未知参数 的函数,即 。建立矩估计方程: 用样本的前
阶原点矩 来估计对应的总体矩 。样本 阶原点矩的定义为:令总体矩等于样本矩,得到一个包含
个未知参数的方程组:求解估计量: 从上述方程组中解出
,它们都是样本 的函数。我们将解出的结果记为 。称
为参数 的矩估计量 (Moment Estimator)。
最大似然估计法 (Method of Maximum Likelihood)
最大似然估计法的基本思想是:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个
设总体
构造似然函数 (Likelihood Function): 似然函数是样本观测值的联合概率密度(或联合概率),但它被看作是未知参数
的函数。这里的
可以是一个向量 。取对数: 为了便于计算,通常对似然函数取自然对数,得到对数似然函数
。由于对数函数是单调递增函数,
和 在相同的 处取得最大值。求导并令其为零: 对对数似然函数关于每个未知参数
求偏导数,并令其等于零,得到似然方程组:求解估计值: 解这个似然方程组,得到的解记为
。这些解是使似然函数达到最大值的参数值,它们是样本观测值 的函数。称
为参数 的最大似然估计值 (Maximum Likelihood Estimate, MLE)。
注意:如果似然方程无解,或者参数
无偏性
若估计量
则称
有效性
设
且至少对某一个
相合性
若对于任意
则称
区间估计
则称随机区间
单个正态总体均值和方差的区间估计
假设
已知- 使用统计量:
- 置信区间:
- 其中
是标准正态分布的上 分位点。
- 使用统计量:
未知- 使用统计量:
- 置信区间:
- 其中
是自由度为 的 分布的上 分位点。
- 使用统计量:
单个总体 方差 的置信区间
假设
未知- 使用统计量:
- 置信区间:
- 其中
和 分别是自由度为 的 分布的上 和上 分位点。
- 使用统计量:
已知- 使用统计量:
- 置信区间:
- 其中
和 分别是自由度为 的 分布的上 和上 分位点。
- 使用统计量:
第八章 假设检验
单个正态总体 的参数假设检验
设总体
一、 均值 的假设检验
- 方差
已知( 检验)
原假设与备择假设 分为以下三种情况:
| 检验类型 | 原假设 |
备择假设 |
|---|---|---|
| 双侧检验 | ||
| 单侧(右侧)检验 | ||
| 单侧(左侧)检验 |
检验统计量:
拒绝域:
- 双侧检验:
- 右侧检验:
- 左侧检验:
其中
- 方差
未知( 检验)
原假设与备择假设 同上述三种情况。
检验统计量:
拒绝域:
- 双侧检验:
- 右侧检验:
- 左侧检验:
其中
二、 方差 的假设检验( 检验)
前提:均值
原假设与备择假设 分为以下三种情况:
| 检验类型 | 原假设 |
备择假设 |
|---|---|---|
| 双侧检验 | ||
| 单侧(右侧)检验 | ||
| 单侧(左侧)检验 |
检验统计量:
拒绝域:
- 双侧检验:
或 - 右侧检验:
- 左侧检验:
其中