变量变换求卷积P152
Y=f(X),f(X)是一个严格单调递增,X=h(Y),是其反函数。
设二元随机变量(X,Y)联合密度函数为p(x,y),如果函数{u=g1(x,y)\v=g2(x,y),有连续偏导数,且存在唯一的反函数。{x=x(u,v)\y=y(u,v),其变换的雅可比行列式J。
则(U,V)的联合密度函数为:p(u,v)=p(x(u,v),y(u,v))|J|
多元雅可比行列式
|J|n×n
J=|\part(h1,h2,…,hn)\part(y1,y2,…,yn)|=|\parthi\partyj|,省去了转制
此时多元的密度相同,把反函数带进去再求雅可比行列式。
例子:书上例3.3.10
X和Y是i.i.d.
正态验证独立的另一种思路,先验证独立性再求边际要好求很多。
条件分布与条件期望
联合密度和边际密度的关系
定义
remarks
连续场合的全概率公式和贝叶斯公式
贝叶斯公式并不一定意味着贝叶斯学派。
即贝叶斯公式很counts.贝叶斯是利用已知信息对未知信息进行推断。
p(y|x)=p(x,y)p(x)
全概率公式:利用某一个分割来求一个事件的概率(加权来算)
连续:加权求和->求积分
连续贝叶斯公式
联合正态,边际正态,条件正态
条件期望
核心:E(Y|X=x)=∫y·p(y|x)dy
remarks:
E[Y|X=x]是x的函数
E(Y|X)是一个变量X的函数,它一定是随机变量。它自己也有期望。
EX(EY(Y|X))=E(X),重期望定理。
平均成绩:w1✖️男生均分+w2✖️女生均分=全班均分
例题:经典例题:3.5.7
随机个随机变量的和也可以通过重期望公式去解(书上例题)。
冲期望的重要性质,书上习题:
E(g(X)·Y|X)=g(X)·E(Y|X),在线性模型的推导比较有用。
P185-15
概率不等式
- 马尔可夫不等式(tailProb)
- 切比雪夫不等式(tailProb)
尾概率控制风险
柯西-施瓦滋不等式:二阶内积小于二阶平方
(Cov(X,Y))2≤Var(X)Var(Y)
证明Cov是在[-1,1]区间的
琴生不等式f是凸函数
f(E(X))≤E(f(X))
凸函数:二阶导
证明EM算法的收敛性
三种收敛性
定义4.1.2
X1,X2,…,Xn是一系列的随机变量,Fi(X)
X一个r,v是F(X)
弱收敛
应用:CLT的定义
依概率收敛
书上缺乏:下周统计推断公式有用:以概率1收敛
P(lim X_n=X)=1
三种收敛关系之间有强弱之分
以概率1收敛>依概率收敛>弱收敛(按分布收敛)(general)
有时,收依概率收敛于某一常数是有反向符号的
大数定律(LLN)和中心极限定理(CLT)
大数定律
大数定律:用频率,样本均值真的很好用!估计概率
CLT:独立同分布的CLT和独立不同分布的CLT。
和的某一倍数或线形组合,受到正态分布的控制。
收敛到真值且不会太远,LLN度量的误差是可以被控制的
期望存在,方差一定存在。反之不一定成立。
但如果方差不存在,还有中心极限定理嘛?
在现代,基于鞅Martingale的提出,对CLT的独立性也放宽到相关性。[left to do ]
重点
变量变换,条件,条件密度与重期望公式,LLN和CLT到底在说啥。