随机变量
随机变量$X$是有限或无限可数样本空间$S$到实数的函数
对于随机变量$X$和实数$x$,定义事件$X=x$为${s\in S,X(s)=x}$,因此
we will use upper case characters to denote random variables, and lower case characters to denote real numbers such as the numerical values of a random variable.
对于随机变量,函数$p_X(x)=\Pr{X=x}$为$X$的概率质量函数PMF
特别的,对于连续随机变量也称为概率密度函数PDF
归一化条件为
所以$f_X(x)$可以看成单位长度的概率
可以把这两种函数整合成一个函数
即为累积分布函数CDF(cumulative distribution function)
可以类比积分上限函数,通过差分和求导可以还原
若有若干个随机变量,即为多维随机变量
则有联合PMF
为$X$与$Y$的联合概率密度函数,性质同理,
如边缘$\rm PMF$
函数
边缘函数
设$(X,Y)$的联合分布为$F(X,Y)$则
为随机变量$X$的边缘分布函数
为边缘密度函数
利用定义可以求$Z=g(X,Y)$的分布
从而有
随机变量的期望值
对于连续的随机变量
期望的线性性质
若相互独立,使用期望的定义得
方差
对于连续的随机变量
若相互独立
标准差
矩
随机变量使用概率密度函数描述,概率密度函数具有一个特性,称为 矩 Moment,矩是随机变量幂的期望。我们重点关注两种矩:
- $k$阶原点矩,$\text E\left[ X^{k} \right]$
- $k$阶中心距,$\text E\left[ (X-\text E[x]) \right]^{k}$
随机矩阵
对于矩阵$\tilde{X}(d_1,d_2)$,其均值为
线性性质
独立
若对于一切$x,y$
则称两随机变量相互独立
卷积
则有
协方差
类比有
相关系数
条件
conditional PMF
可以将A推广为一个随机变量
分布
离散
几何分布
前面一直没有成功直到第n次才成功
二项分布
区别于国内表达,组合数记为
读作$n$取$k$
泊松分布
在某段时间内事件发生的概率为
则$t=0\to1$发生的次数可以表示为
连续
均匀分布
记为$X\sim U(a,b)$
则可以写出分布的期望和方差
指数分布
记为$X\sim E(\lambda)$
其中$\lambda$是参数可以用来调控均值,这个模型用途很广
类似与几何分布的情况,只不过用到了泊松分布的假设
正态分布
自然界许多现象都遵循 正态分布 Normal Distribution。正态分布又称为 高斯分布 Gaussian Distribution (纪念著名数学家卡尔·弗莱德利希·高斯),其表达式如下:
记为$X\sim N(\mu,\sigma^2)$,若$\mu=\sigma=1$则为标准正态分布
可以利用标准正态分布函数来计算概率
可加性
分位数
则称$u_p$为标准正态分布的$p$分位数
最值
$X_i$服从同一分布,则
数字特征
偏度
$\beta_s(X)<0$为左偏,左侧有较长的尾部,反之同理
峰度
峰度和正态分布比较
变异系数
用均值标准化
中心极限定理
切比雪夫不等式,若$E(X^2)<+\infty$
马尔可夫不等式,若$E(|X|^p)<+\infty$
样本均值
或者
$\chi ^2$分布
若$X_i$服从标准正态,则$U$服从自由度为$n$的$\chi ^2$分布
样本方差
$\overline X$和$S^2$相互独立
可加性
$t$分布
若$X\sim N(0,1),Y\sim \chi^2(n)$
F分布
参数估计
矩估计
用样本矩来估计总体矩
最大似然估计
最大化
评选标准
无偏
渐近无偏
相合
无偏或渐近无偏且
置信区间
枢轴变量
若方差已知,双侧
单侧
方差未知,用样本来估计
方差置信区间
可得
若方差未知则