变量变换求卷积P152
$Y=f(X)$,$f(X)$是一个严格单调递增,$X=h(Y)$,是其反函数。
设二元随机变量$(X,Y)$联合密度函数为$p(x,y)$,如果函数$\begin{cases}u=g_1(x,y)\v=g_2(x,y)\end{cases}$,有连续偏导数,且存在唯一的反函数。$\begin{cases}x=x(u,v)\y=y(u,v)\end{cases}$,其变换的雅可比行列式$J$。
则$(U,V)$的联合密度函数为:$p(u,v)=p(x(u,v),y(u,v))|J|$
多元雅可比行列式
$|J|_{n\times n}$
$J=|\frac{\part(h_1,h_2,…,h_n)}{\part(y_1,y_2,…,y_n)}|=|\frac{\part{h_i}}{\part{y_j}}|$,省去了转制
此时多元的密度相同,把反函数带进去再求雅可比行列式。
例子:书上例3.3.10
X和Y是i.i.d.
正态验证独立的另一种思路,先验证独立性再求边际要好求很多。
条件分布与条件期望
联合密度和边际密度的关系
定义
remarks
连续场合的全概率公式和贝叶斯公式
贝叶斯公式并不一定意味着贝叶斯学派。
即贝叶斯公式很counts.贝叶斯是利用已知信息对未知信息进行推断。
p(y|x)=$\frac{p(x,y)}{p(x)}$
全概率公式:利用某一个分割来求一个事件的概率(加权来算)
连续:加权求和->求积分
连续贝叶斯公式
联合正态,边际正态,条件正态
条件期望
核心:$E(Y|X=x)=\int y·p(y|x)dy$
remarks:
$E[Y|X=x]$是x的函数
$E(Y|X)$是一个变量X的函数,它一定是随机变量。它自己也有期望。
$E_X(E_Y(Y|X))=E(X)$,重期望定理。
平均成绩:w1✖️男生均分+w2✖️女生均分=全班均分
例题:经典例题:3.5.7
随机个随机变量的和也可以通过重期望公式去解(书上例题)。
冲期望的重要性质,书上习题:
$E(g(X)·Y|X)=g(X)·E(Y|X)$,在线性模型的推导比较有用。
P185-15
概率不等式
- 马尔可夫不等式(tailProb)
- 切比雪夫不等式(tailProb)
尾概率控制风险
柯西-施瓦滋不等式:二阶内积小于二阶平方
$(Cov(X,Y))^2\le Var(X)Var(Y)$
证明Cov是在[-1,1]区间的
琴生不等式f是凸函数
$f(E(X))\le E(f(X))$
凸函数:二阶导
证明EM算法的收敛性
三种收敛性
定义4.1.2
$X_1,X_2,…,X_n$是一系列的随机变量,$F_i(X)$
X一个r,v是$F(X)$
弱收敛
应用:CLT的定义
依概率收敛
书上缺乏:下周统计推断公式有用:以概率1收敛
P(lim X_n=X)=1
三种收敛关系之间有强弱之分
以概率1收敛>依概率收敛>弱收敛(按分布收敛)(general)
有时,收依概率收敛于某一常数是有反向符号的
大数定律(LLN)和中心极限定理(CLT)
大数定律
大数定律:用频率,样本均值真的很好用!估计概率
CLT:独立同分布的CLT和独立不同分布的CLT。
和的某一倍数或线形组合,受到正态分布的控制。
收敛到真值且不会太远,LLN度量的误差是可以被控制的
期望存在,方差一定存在。反之不一定成立。
但如果方差不存在,还有中心极限定理嘛?
在现代,基于鞅Martingale的提出,对CLT的独立性也放宽到相关性。[left to do ]
重点
变量变换,条件,条件密度与重期望公式,LLN和CLT到底在说啥。