首先厘清题意明确情形
对图形进行全面有序的分析
找出所求目标(正确或错误)
分析问题将题给条件进行转换
在空白处写出关键条件
对照原题标出数据
在草稿纸上进行化简计算
对照选项进行验证
若非常有把握就直接过
有困难就排除分析
首先厘清题意明确情形
对图形进行全面有序的分析
找出所求目标(正确或错误)
分析问题将题给条件进行转换
在空白处写出关键条件
对照原题标出数据
在草稿纸上进行化简计算
对照选项进行验证
若非常有把握就直接过
有困难就排除分析
我们说样本空间是无限可数的意味着其中的元素可以与正整数一一对应
样本空间$S$上的概率分布$\rm {Pr{}}$是一个从事件到实数的映射
将事件$\text{Pr}({A})$简记为$\text{Pr}{A}$
事件可能有无数个,如掷硬币n次H
$\forall 事件A,\text {Pr}{A}\ge0$
$\text {Pr}{S}=1$
对两两互斥的事件,有
对于一个序列型的事件,可以用以下方式描述
为了构建模型,我们需要考虑多个因素
The choice of a model often involves a tradeof be-tween accuracy, simplicity,and tractability.
但是不论多复杂的模型,对于某个特定的事件都有确定的概率
All conceivable questions have precise answers and it is only a matter of developing the skill to arrive at them.
对于多个等概率事件
样本空间可以用图形来表示
对于样本空间为
对于某一个值,概率为0,只有考虑长度才有意义
由德摩根律
概率分布在有限或无限可数的样本空间,则该概率分布是离散的
若基本事件$s\in S$的概率为
则称为$S$上的的均匀概率分布
已知事件 $B$发生$\text {Pr}{B}\ne 0$,事件$A$的条件概率定义为
需要从直观角度上理解
若
则称事件$A$和$B$是独立的,若$\text {Pr}{B}\ne 0$,则等价于
若对于所有$1\le i < j\le n$,有
则称事件$A_1,A_2,\cdots,A_n$两两独立
若对这些事件的每一个$k$子集${ A{i_1},A{i2},\cdots,A{i_k}}$,其中$2\le k\le n$且$1\le {i_1}< {i_2}< \cdots< {i_k}\le n $,有
则称这些事件相互独立
In words, this relation states that if is known to have occurred,the additional knowledge that B also occurred does not change the probability of A.
考虑事件A为第一次掷为H,B为第二次H,C为两次结果不同
所以独立不代表条件独立
则A,B两个独立事件不条件独立
将样本空间$\Omega$划分为两两独立的$n$个事件,且
则
由
得
对于$\Pr{B}$,因为可以划分,故
所
贝叶斯定理常常用来由果导因,如抗原阳性是否代表感染新冠
其中$\Pr{A_i|B}$为后验概率,$\Pr{A_i}$是先验概率
分类加法计数原理,同一个阶段的不同方法可以相加
有N个阶段每个阶段有$n_i$个方式,则总方式为
将n个元素分为$k$类,其中各为$n_i$个
随机变量$X$是有限或无限可数样本空间$S$到实数的函数
对于随机变量$X$和实数$x$,定义事件$X=x$为${s\in S,X(s)=x}$,因此
we will use upper case characters to denote random variables, and lower case characters to denote real numbers such as the numerical values of a random variable.
对于随机变量,函数$p_X(x)=\Pr{X=x}$为$X$的概率质量函数PMF
特别的,对于连续随机变量也称为概率密度函数PDF
归一化条件为
所以$f_X(x)$可以看成单位长度的概率
可以把这两种函数整合成一个函数
即为累积分布函数CDF(cumulative distribution function)
可以类比积分上限函数,通过差分和求导可以还原
若有若干个随机变量,即为多维随机变量
则有联合PMF
为$X$与$Y$的联合概率密度函数,性质同理,
如边缘$\rm PMF$
设$(X,Y)$的联合分布为$F(X,Y)$则
为随机变量$X$的边缘分布函数
为边缘密度函数
利用定义可以求$Z=g(X,Y)$的分布
从而有
对于连续的随机变量
期望的线性性质
若相互独立,使用期望的定义得
对于连续的随机变量
若相互独立
标准差
随机变量使用概率密度函数描述,概率密度函数具有一个特性,称为 矩 Moment,矩是随机变量幂的期望。我们重点关注两种矩:
对于矩阵$\tilde{X}(d_1,d_2)$,其均值为
线性性质
若对于一切$x,y$
则称两随机变量相互独立
则有
类比有
相关系数
conditional PMF
可以将A推广为一个随机变量
前面一直没有成功直到第n次才成功
区别于国内表达,组合数记为
读作$n$取$k$
在某段时间内事件发生的概率为
则$t=0\to1$发生的次数可以表示为
记为$X\sim U(a,b)$
则可以写出分布的期望和方差
记为$X\sim E(\lambda)$
其中$\lambda$是参数可以用来调控均值,这个模型用途很广
类似与几何分布的情况,只不过用到了泊松分布的假设
自然界许多现象都遵循 正态分布 Normal Distribution。正态分布又称为 高斯分布 Gaussian Distribution (纪念著名数学家卡尔·弗莱德利希·高斯),其表达式如下:
记为$X\sim N(\mu,\sigma^2)$,若$\mu=\sigma=1$则为标准正态分布
可以利用标准正态分布函数来计算概率
可加性
则称$u_p$为标准正态分布的$p$分位数
$X_i$服从同一分布,则
$\beta_s(X)<0$为左偏,左侧有较长的尾部,反之同理
峰度和正态分布比较
用均值标准化
切比雪夫不等式,若$E(X^2)<+\infty$
马尔可夫不等式,若$E(|X|^p)<+\infty$
样本均值
或者
若$X_i$服从标准正态,则$U$服从自由度为$n$的$\chi ^2$分布
样本方差
$\overline X$和$S^2$相互独立
可加性
若$X\sim N(0,1),Y\sim \chi^2(n)$
用样本矩来估计总体矩
最大化
无偏
渐近无偏
相合
无偏或渐近无偏且
枢轴变量
若方差已知,双侧
单侧
方差未知,用样本来估计
方差置信区间
可得
若方差未知则