概率论(2)
多项分布:一个骰子被投掷10次,6朝上次数的概率。
统计课讨论pdf
n元正态分布
2.n元正态分布
设X=(x1\x2\x3\xn)为n维随机变量,其期望→μ(μ1mu2mu3mun)
其方差-协方差矩阵Σ= { σij }n×n=Cov{xi,xj}
记实向量X=(x1\x2\x3\xn),如果→X的pdf为P(X=x)=(2π)n2|Σ|−12exp(−12(x−μ)TΣ−1(x−μ))
那么,称X服从n元正态分布,记X~Np(→μ,Σ)
Special Case
当是二元向量时:N(μ1,μ2,σ21,σ22)
μ=(μ1,μ2)T,Σ=(σ21ρσ1σ2rhoσ1σ2σ21)
3.指数分布族
分布族理解,是一个分布的集合。
定义
设一个随机变量/向量X,其分布列/密度函数(pdf)
为p(x)=h(x)exp(η(θ)TT(x)−F(θ)),那么称这个随机变量来自于指数分布族。这里F(θ)是θ的函数变换。
这里都是向量。
- 参数θ∈参数空间∈Rd,参数向量
- η(θ):参数空间−>Rp映射,做完变换,p维横向量,与后面的T(x)做内积。
- T(x)是一个p维列向量。(使内积可以计算),可理解为随机向量。
随机性概念的理解。
- F(θ)是一个一维/实值函数
向量的例子
验证是不是指数分布族
Exa.1
p(x)=px(1−p)1−x为二点分布。
p(x)=exp(ln(px(1−p)1−x))=expexp(ln(px(1−p)−x)(1−p))=exp(ln(p1−p)x(1−p))
=exp(xln(p1−p)+ln(1−p))
h(x)=1,T(x)=x,θ=p,η(θ)=ln(p1−p)
Exa.2
验证正态分布也属于指数分布族。
将参数与指数分离,写成乘积的形式。
p(x)=1√2π(σ2)−12exp−12(x−μ)2σ2
step1.先讲指数化出来
p(x)=exp(−ln(√2πσ2))exp−12(x−μ)2σ2
=exp(−ln(√2πσ2)+−12(x−μ)2σ2)
=exp(−ln(√2πσ2)−12σ2(x2−2xμ+μ2))
=exp(−12σ2x2+1σ2xμ)+与x无关的参数
所以,对照上面式子的标准形式
h(x)=1,T(→x)=(x2,x)T,η(θ)T=(12σ2,μσ2)
剩下的一堆是与x无关的参数。
−F(θ)=−ln(√2πσ2)−12σ2μ2
由上面的例子,离散和连续随机变量都可能来自于指数分布族,有益于对异构数据处理的统一表达。
4.独立性
A,B为随机事件:
A,B独立表示:P(AB)=P(A)P(B)
称(x1,x2,x3,…,xn)T是random vector,是相互独立的,Fi(x)是其cdf,则
- F(x1,x2,x3,…,xn)=ΠFi(x)=ΠP(Xi≤x)【这里用事件去推理去理解。联合cdf与边际cdf
离散:
联合分布列P(X1=x1,X2=x2,…,Xn=xn)=ΠP(Xi=xi)
连续:
P(X1,X2,…,Xn)=ΠP(Xi)
重要的是学会去用
5.多元的期望和方差的性质
设(X,Y)是二元随机变量
E[X+Y]=E[X]+E[Y];无条件,基于积分的可加性求得。
若X与Y是独立的,则:
有上面独立的联合概率的条件
E[XY]=E[X]E[Y]
Var(X+-Y)=Var(X)+Var(Y)【无论那边是加号还是剪号,我的波动总是增加的!
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
Var(X-Y)=Var(X)+Var(Y)-2Cov(X,Y)【比较有用
因为独立,协方差为0,上边加号是不变的。
Cov(X,Y)=E[XY]-E[X]E[Y]
独立时,协方差为0.
独立性条件强于协方差
Cov(X,Y)=0,表示线性无关。
当(X,Y)服从二元正态的时候,相关性和独立性等价。
ρ=Cov(X,Y)√Var(x)Var(y)
所以正态分布算covariance远比直接推密度函数效率更高。
6.多元随机变量的函数
极值分布(最大值,最小值分布)
x1,x2,x3,…,xn是n个随机变量。
xmax=max(x1,x2,x3,…,xn),xmax是一个多元随机变量的函数。
随机变量的函数一定是一个随机变量,我们一定要用分布去刻画。
xmin=min(x1,x2,x3,…,xn)
这个的最大应用,水位线的最大值,水坝的高度的建设相关。
例1
若X1,X2,..,Xn是相互独立的随机变量
若Y=xmax=max(x1,x2,x3,…,xn),
Xi~Fi(x)
F(y)=F(x1,x2,x3,…,xn≤y)=Πni=1F(x1≤y)
Xi是同分布的
FY(y)=(F(y))n
Xi是连续随机变量,且Xi同分布,p(x)为Xi的概率密度函数。
求Y的pdf
PY(y)=dFY(y)dy=d[(F(y))n]dy
这里堪称一个复合函数求导。
=nF(y)n−1p(y)
模型v.s.结论
Xi~Exp(λ)
p(X)=λexp(−λx),x≥0;
F(X)=1−exp(−λx),x≥0
Y的密度函数,PY(y)=n(1−exp(−λy))λexp(−λy),y≥0,0,otherwised
例2
若X1,X2,..,Xn是相互独立的随机变量
若Z=xmin=min(x1,x2,x3,…,xn),
FZ(z)=P(Z≤z)=1−P(Z>z)=1−ΠP(X1>z)=1−Πni=1(1−Fi(z))
Xi是同分布的:
FZ(z)=1−(1−F(z))n
求Z的概率密度函数:
PZ(z)=−n(1−FZ(z))n−1(−pZ(z))
Xi~Exp(λ)
pZ(z)=n(1−1−exp(−λz))n−1λexp(−λz)
=nλ(−exp(−λz))n−1+1,z≥0
注意这里,Z还是一个服从于nλ的exp分布
pdf最重要的性质是非负性,要以此检查我的计算的正确性。
卷积公式
核心概念
X和Yiid(一般只要求独立,不要求同分布),求X+Y的分布。
重要结论
X1
N(μ1,σ21),X2N(μ2,σ22),X1+X2~N(μ1+μ1,σ21+σ22)
先确定分布,再由期望和方差的关系,不要走密度函数硬推。
n维随机变量独立同分布于正态分布,线性组合也是正态分布
X1
Γ(α1,λ),X2Γ(α2,λ)X+Y~Γ(α1+α2,λ)
指数分布Γ(1,λ)相加不是指数分布
卡方分布,Γ(n2,12),卡方分布相加还是卡方分布。