大一/概率论/随机变量

随机变量

随机变量$X$是有限或无限可数样本空间$S$到实数的函数

image-20230209133135226

对于随机变量$X$和实数$x$,定义事件$X=x$为${s\in S,X(s)=x}$,因此

we will use upper case characters to denote random variables, and lower case characters to denote real numbers such as the numerical values of a random variable.

对于随机变量,函数$p_X(x)=\Pr{X=x}$为$X$的概率质量函数PMF

PDF

特别的,对于连续随机变量也称为概率密度函数PDF

归一化条件为

所以$f_X(x)$可以看成单位长度的概率

可以把这两种函数整合成一个函数

即为累积分布函数CDF(cumulative distribution function)

image-20230209223350322

image-20230209223424967

可以类比积分上限函数,通过差分和求导可以还原

若有若干个随机变量,即为多维随机变量

则有联合PMF

为$X$与$Y$的联合概率密度函数,性质同理,

如边缘$\rm PMF$

函数

image-20230209180813949

边缘函数

设$(X,Y)$的联合分布为$F(X,Y)$则

为随机变量$X$的边缘分布函数

为边缘密度函数

利用定义可以求$Z=g(X,Y)$的分布

从而有

随机变量的期望值

对于连续的随机变量

期望的线性性质

若相互独立,使用期望的定义得

方差

对于连续的随机变量

若相互独立

标准差

随机变量使用概率密度函数描述,概率密度函数具有一个特性,称为 矩 Moment,矩是随机变量幂的期望。我们重点关注两种矩:

  • $k$阶原点矩,$\text E\left[ X^{k} \right]$
  • $k$阶中心距,$\text E\left[ (X-\text E[x]) \right]^{k}$

随机矩阵

对于矩阵$\tilde{X}(d_1,d_2)$,其均值为

线性性质

独立

若对于一切$x,y$

则称两随机变量相互独立

卷积

则有

协方差

类比有

相关系数

条件

conditional PMF

image-20230209195032570

可以将A推广为一个随机变量

image-20230209195505072

分布

离散

几何分布

前面一直没有成功直到第n次才成功

image-20230209135132169

二项分布

区别于国内表达,组合数记为

读作$n$取$k$

泊松分布

在某段时间内事件发生的概率为

则$t=0\to1$发生的次数可以表示为

image-20240129160556102

连续

均匀分布

image-20240628110619661

记为$X\sim U(a,b)$

则可以写出分布的期望和方差

指数分布

记为$X\sim E(\lambda)$

其中$\lambda$是参数可以用来调控均值,这个模型用途很广

image-20240129222957601

类似与几何分布的情况,只不过用到了泊松分布的假设

正态分布

自然界许多现象都遵循 正态分布 Normal Distribution。正态分布又称为 高斯分布 Gaussian Distribution (纪念著名数学家卡尔·弗莱德利希·高斯),其表达式如下:

image-20240123220759348

记为$X\sim N(\mu,\sigma^2)$,若$\mu=\sigma=1$则为标准正态分布

可以利用标准正态分布函数来计算概率

可加性

分位数

则称$u_p$为标准正态分布的$p$分位数

最值

$X_i$服从同一分布,则

数字特征

偏度

$\beta_s(X)<0$为左偏,左侧有较长的尾部,反之同理

峰度

峰度和正态分布比较

变异系数

用均值标准化

中心极限定理

切比雪夫不等式,若$E(X^2)<+\infty$

马尔可夫不等式,若$E(|X|^p)<+\infty$

样本均值

或者

$\chi ^2$分布

若$X_i$服从标准正态,则$U$服从自由度为$n$的$\chi ^2$分布

样本方差

$\overline X$和$S^2$相互独立

可加性

$t$分布

若$X\sim N(0,1),Y\sim \chi^2(n)$

F分布

参数估计

矩估计

用样本矩来估计总体矩

最大似然估计

最大化

评选标准

无偏

渐近无偏

相合

无偏或渐近无偏且

置信区间

枢轴变量

若方差已知,双侧

单侧

方差未知,用样本来估计

方差置信区间

可得

若方差未知则