概率论基础#
分布函数与概率分布#
\(E(X^2)=E^2(X)+D(X)\) 和 \(E(\overline{X}^2)=E^2(\overline{X})+D(\overline{X})\) 这两个公式对所有公式都满足吗?
在 数理统计公式大全 中,多次出现符号 \(\lambda\),其实 \(\lambda=\dfrac{1}{\bar{X}}\)
概念区分
密度:
概率密度:
概率分布:
概率:
概率密度函数图像的纵坐标代表的是概率,总面积求和等于 1。
如何查表(认识符号的含义)角标为概率值。角标有三种叫法,1)信任系数 2)置信度 3)置信水平。置信水平是指某个范围包含参数 \(\theta\) 真值的可信程度。 \(P(\underline{\theta} \leq \theta \leq \overline{\theta}) \geq 1 - \alpha\)。 置信区间并不唯一,因此区间长度也不唯一。
i.i.d. 独立同分布
有一些分布的性质这里并没有写全。可以上网搜索。
一些函数:
\(\theta\) 的先验分布: \(\pi(\theta)\)
条件密度函数: \(P(x_1, x_2, \dots, x_n | \theta)\)
\(x_1, x_2, \dots, x_n\) 和参数 \(\theta\) 的联合密度函数: \(P(x_1, x_2, \dots, x_n, \theta) = P(x_1, x_2, \dots, x_n | \theta) \pi(\theta)\)
参数 \(\theta\) 的后验密度函数或后验分布: \(\pi(\theta | x_1, x_2, \dots, x_n)=\dfrac{P(x_1, x_2, \dots, x_n, \theta)}{P(x_1, x_2, \dots, x_n)} = \dfrac{P(x_1, x_2, \dots, x_n | \theta) \pi(\theta)}{\int P(x_1, x_2, \dots, x_n | \theta) \pi(\theta)\mathrm{d}\theta}\)
边际分布或 \(x_1, x_2, \dots, x_n\) 的无条件分布: \(P(x_1, x_2, \dots, x_n) = \int P(x_1, x_2, \dots, x_n | \theta) \pi(\theta)\mathrm{d}\theta\)
离散型#
两点分布
二项分布
泊松分布
几何分布
超几何分布
连续型#
均匀分布
指数分布
正态分布
标准正态分布
多维#
贝叶斯估计#
贝叶斯估计是执果索因,在已知结果 \(A\) 发生的情况下,求 \(B_i\) 发生的概率。也就是说,探究是哪个原因导致了 \(A\) 的发生。
\(P(B_i|A) = \dfrac{P(AB_i)}{P(A)}=\dfrac{P(B_i)P(A|B_i)}{\displaystyle\sum_{j=1}^nP(B_j)P(A|B_j)}\)
\(AB_i\) 同时发生的概率为已知过程 \(B_i\) 发生的情况下,结果 \(A\) 发生的概率与过程 \(B_i\) 发生的概率的乘积。
\(P(A|B_i)=P(A|B_i)P(B_i)\)
例如:结果为晚点、不晚点,原因为乘飞机、乘动车、乘非机动车。则可以设
A:晚点
B1:乘飞机
B2:乘动车
B3:乘非机动车
考虑:
如果求一个结果发生的概率,而且知道这个结果有不同的原因,考虑全概率公式。
已知结果发生,求某个原因发生的概率,考虑贝叶斯公式。