行列式
定义
由小到大为标准次序,$p_1p_2\cdots p_n$为排列,则比$p_i$大且排在其前的元素有$t_i$个,就说这个元素的逆序数是$t_i$
排列逆序数
则行列式
余子式
去掉$i$行$j$列得到的子行列式$M_{ij}$
代数余子式
则行列式可以按$i$行展开
性质
- 对换行列式的两行或者两列(不需相邻)行列式变号
- 行列式与它的转置行列式相等
- 行列式中的某一行/列中所有元素乘以同一数$k$等于用数$k$乘以行列式
- 行列式中如果有两行/列成比例则行列式为零
- 把某一行/列的各元素同乘一个数然后加到另一行/列上行列式不变
范德蒙德行列式
爪形
用对角线去消第一行/列
三对角线行列式递推求解
观察并灵活利用拆行 求和 换序 加边升阶等方法
运算
矩阵
矩形的数组,如
是一个$2\times3$的矩阵$A=(a_{ij})$其中$i=1,2;j=1,2,3$
矩阵中第$i$行第$j$列的元素表示为$a_{ij}$(大写矩阵,小写元素)
向量
向量是一维数组($1D$ ,如只有一行或一列),如
把长度为$n$的向量称为$n$向量,通常用小写字母来表示向量
$x_i$表示向量中第$i$个元素
向量的标准形式为列向量($n\times1$)
特殊的矩阵
零矩阵
所有元素均为$0$的矩阵,矩阵大小需要从上下文中推测
方阵
方阵为$n\times n$矩阵
对角矩阵
对角线($\text {diagnoal}$),其中对于任意$i\ne j,a_{ij}=0$,故只需列出对角线上的元素就可以表示出这个矩阵
单位矩阵
逆矩阵
伴随矩阵
故
二阶矩阵
三对角矩阵
对$|i-j|>1,a_{ij}=0$,即矩阵中不为$0$的项只出现在对角线或上下,$i-j$相当于偏移量,类似八皇后问题
上三角矩阵
若$i>j,a_{ij}=0$,其对角线以下的元素为$0$
同理下三角矩阵$L$对角线以上的元素为$0$
若非零项均为$1$,则为单位三角矩阵
排列矩阵
每行每列只有一个1,其余都为0,可以重新排列向量中的元素
对称矩阵
若矩阵$A$满足$A=A^{\text T}$,则矩阵的元素关于对角线对称
性质$a{ij}=a{ji}$
反对称$a{ij}=-a{ji}$
正交矩阵
分块矩阵
对角线
矩阵的基本操作
加法
若矩阵$A,B$大小相同,则$C=A+B$为相同大小
数乘
$\lambda$称为矩阵的一个标量倍数,矩阵的负为$-A(\lambda=-1)$
故减法$A-B=A+(-B)$
乘法
给定两个相容的矩阵$A,B(A的列数=B的行数)$
设$A$为$m\times p$的矩阵,$B$为$p\times n$的矩阵
则 $C=AB$为$m\times n$的矩阵
矩阵乘法满足结合律,分配律
==$A,B,C$必须是相容的==
意义
对于方阵
而有又有向量的分解不难看出
变换
从而很容易理解旋转矩阵
其中旋转矩阵为正交矩阵
对于转轴$u$
对于直线
如果$M\vec{AR}=0$成立,则变化将直线变为一个点
若两个变换后的基向量共线则该变换结果为一维空间(线)
对于变换
1 | x0=1 |
将直线变化为了一个点,整个平面变换成了$y=0$
一般的,如果一个条直线上的任意$2$个不同的点经过变换后重合
则该变换为不可逆矩阵
缩放
对每个分量乘上比例因子
转置
交换$A$行和列获得的矩阵为$A$的转置$A^{\text T}$(第几行变为第几列)
观察矩阵的形状
逆
定义
若没有逆矩阵则称为奇异的
由共线和或叉乘得
若面积为$0$则为奇异矩阵
简单情况下,对基向量进行研究,通过初等变换矩阵的乘积来得到逆矩阵
一般情况
对线性方程组$Mx=\alpha$,得
对$M=\begin{bmatrix}a&b\c&d\end{bmatrix}$
性质
范数
$\rm frobennius$范数
特征向量
表示变换$A$对于$x$构成的张成空间没有影响,$\lambda$称为特征值
例如三维旋转矩阵的特征向量和旋转轴共线并且特征值为$1$
对称矩阵总可以找到特征向量
若$\det A\ne 0$,$x=0$舍去
$\det A= 0$,则空间压缩成一条线
总有一个向量经过变换后得到零向量
解出特征值后可以解出特征向量(可能有很多如缩放)
特征基
利用特征向量可以将矩阵乘法转化为数乘
若将基向量变换为$2$个不共线的特征向量来表示
则有非常好的性质
再转换回去即可得到结果
应用
对于一个决策行为,定义收益函数$q(d,h)$
对于每一种策略,在某个随机变量的影响下都有相应的概率获得不同的收益
| $h$ | $h_1$ | $h_2$ | $h_3$ |
| :——: | :—-: | :—-: | :—-: |
| $p(h)$ | $p_1$ | $p_2$ | $p_3$ |
对于每一种决定$d$
写成矩阵形式
决策树
马尔可夫链
其中
你们将$p_{ij}$称为转移概率
称为状态转移矩阵,$(p_1^{(n)},p_2^{(n)})$这样的行向量称为该瓦尔科夫链在时刻$n$的分布
再乘上收益矩阵即可得到两种决策的收益
考虑短期过程,观察平均收益
对于长期过程,有平稳分布
类比不动点,可以使用特征向量得到