如何将样本空间与数据和事件联系起来呢?
- 将随机变量理解为映射,是样本空间到实数集的映射。
- 累计分布函数是一个单调增的函数。
- 离散型概率质量函数
常用的一维离散型概率质量函数:
- 单点分布
- 离散均匀分布
- 伯努利:逻辑回归中假设数据服从伯努利分布
- 二项分布:假设从若干影视评论中有放回的抽取n次。
- 几何分布:不放回的影评的抽取。
- 泊松分布:罕见事件:交通事故/放射性元素。
连续概率密度函数
机器学习:模拟采样
深度学习:初始化神经网络参数
高斯分布
标准正态分布
很多自然现象应用正态分布来近似,如男性身高。
深度学习:参数初始化方法
多维随机变量
使用多维随机变量,即一个随机变量不同维度是一个人的特征。
n维与2维相似。
联合分布函数
性质
变量x,y的单增函数;
固定其中一个变量时也是如此,即也可以看成单个变量的单增函数
对x右连续
对y右连续
性质应用于概率命题的证明。
多维离散型分布函数
“可列个值” countable but infinite
边缘概率质量函数
二维连续型随机变量
二重积分为1.
协方差
边缘分布
分布的混合
组合简单概率分布定义新的分布
混合分布:组件分布,从哪个组件产生取决于多元伯努利分布采样的结果。
多元高斯混合分布
概率密度的万能近似器
实际假设高斯分布的组件有相同的方差。
李宏毅宝可梦generative model中那个分布有相同的方差。
分布时描述数据的不确定性,数据科学:估计分布的参数。