大一/线性代数/矩阵与行列式

行列式

定义

由小到大为标准次序,$p_1p_2\cdots p_n$为排列,则比$p_i$大且排在其前的元素有$t_i$个,就说这个元素的逆序数是$t_i$

排列逆序数

则行列式

余子式

去掉$i$行$j$列得到的子行列式$M_{ij}$

代数余子式

则行列式可以按$i$行展开

性质

  • 对换行列式的两行或者两列(不需相邻)行列式变号
  • 行列式与它的转置行列式相等
  • 行列式中的某一行/列中所有元素乘以同一数$k$等于用数$k$乘以行列式
  • 行列式中如果有两行/列成比例则行列式为零
  • 把某一行/列的各元素同乘一个数然后加到另一行/列上行列式不变

范德蒙德行列式

爪形

用对角线去消第一行/列

三对角线行列式递推求解

观察并灵活利用拆行 求和 换序 加边升阶等方法

运算

矩阵

矩形的数组,如

是一个$2\times3$的矩阵$A=(a_{ij})$其中$i=1,2;j=1,2,3$

矩阵中第$i$行第$j$列的元素表示为$a_{ij}$(大写矩阵,小写元素)

向量

向量是一维数组($1D$ ,如只有一行或一列),如

把长度为$n$的向量称为$n$向量,通常用小写字母来表示向量

$x_i$表示向量中第$i$个元素

向量的标准形式为列向量($n\times1$)

特殊的矩阵

零矩阵

所有元素均为$0$的矩阵,矩阵大小需要从上下文中推测

方阵

方阵为$n\times n$矩阵

对角矩阵

对角线($\text {diagnoal}$),其中对于任意$i\ne j,a_{ij}=0$,故只需列出对角线上的元素就可以表示出这个矩阵

单位矩阵

逆矩阵

伴随矩阵

二阶矩阵

三对角矩阵

对$|i-j|>1,a_{ij}=0$,即矩阵中不为$0$的项只出现在对角线或上下,$i-j$相当于偏移量,类似八皇后问题

上三角矩阵

若$i>j,a_{ij}=0$,其对角线以下的元素为$0$

同理下三角矩阵$L$对角线以上的元素为$0$

若非零项均为$1$,则为单位三角矩阵

排列矩阵

每行每列只有一个1,其余都为0,可以重新排列向量中的元素

对称矩阵

若矩阵$A$满足$A=A^{\text T}$,则矩阵的元素关于对角线对称

性质$a{ij}=a{ji}$

反对称$a{ij}=-a{ji}$

正交矩阵

分块矩阵

对角线

矩阵的基本操作

加法

若矩阵$A,B$大小相同,则$C=A+B$为相同大小

数乘

$\lambda$称为矩阵的一个标量倍数,矩阵的负为$-A(\lambda=-1)$

故减法$A-B=A+(-B)$

乘法

给定两个相容的矩阵$A,B(A的列数=B的行数)$

设$A$为$m\times p$的矩阵,$B$为$p\times n$的矩阵

则 $C=AB$为$m\times n$的矩阵

矩阵乘法满足结合律,分配律

==$A,B,C$必须是相容的==

意义

对于方阵

而有又有向量的分解不难看出

image-20221230133843315

变换

从而很容易理解旋转矩阵

image-20221230134433897

其中旋转矩阵为正交矩阵

对于转轴$u$

对于直线

如果$M\vec{AR}=0$成立,则变化将直线变为一个点

image-20221230135131766

若两个变换后的基向量共线则该变换结果为一维空间(线)

对于变换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
x0=1
y0=1
v1=0
v2=1
t0=-3
t1=1
T=np.linspace(t0,t1,100)
X=x0+v1*T
Y=y0+v2*T
M=np.array([[1,0],[0,0]])
L=np.matmul(M,np.array([X,Y]))

fig=go.Figure()
fig.add_trace(go.Scatter(x=X,y=Y,name=f'原直线'))
fig.add_trace(go.Scatter(x=L[0],y=L[1],name=f'变换后'))
fig.update_layout(title='线性变换',
xaxis_title='x',yaxis_title='y',xaxis_range=[0,2],yaxis_range=[-3,3])

image-20221230154855424

将直线变化为了一个点,整个平面变换成了$y=0$

一般的,如果一个条直线上的任意$2$个不同的点经过变换后重合

则该变换为不可逆矩阵

缩放

对每个分量乘上比例因子

转置

交换$A$行和列获得的矩阵为$A$的转置$A^{\text T}$(第几行变为第几列)

观察矩阵的形状

定义

若没有逆矩阵则称为奇异的

由共线和或叉乘得

若面积为$0$则为奇异矩阵

简单情况下,对基向量进行研究,通过初等变换矩阵的乘积来得到逆矩阵

一般情况

对线性方程组$Mx=\alpha$,得

对$M=\begin{bmatrix}a&b\c&d\end{bmatrix}$

性质

范数

$\rm frobennius$范数

特征向量

表示变换$A$对于$x$构成的张成空间没有影响,$\lambda$称为特征值

例如三维旋转矩阵的特征向量和旋转轴共线并且特征值为$1$

对称矩阵总可以找到特征向量

若$\det A\ne 0$,$x=0$舍去

$\det A= 0$,则空间压缩成一条线

总有一个向量经过变换后得到零向量

解出特征值后可以解出特征向量(可能有很多如缩放)

特征基

利用特征向量可以将矩阵乘法转化为数乘

若将基向量变换为$2$个不共线的特征向量来表示

则有非常好的性质

再转换回去即可得到结果

应用

对于一个决策行为,定义收益函数$q(d,h)$

对于每一种策略,在某个随机变量的影响下都有相应的概率获得不同的收益
| $h$ | $h_1$ | $h_2$ | $h_3$ |
| :——: | :—-: | :—-: | :—-: |
| $p(h)$ | $p_1$ | $p_2$ | $p_3$ |

对于每一种决定$d$

写成矩阵形式

决策树

image-20221230182812507

马尔可夫链

其中

你们将$p_{ij}$称为转移概率

称为状态转移矩阵,$(p_1^{(n)},p_2^{(n)})$这样的行向量称为该瓦尔科夫链在时刻$n$的分布

再乘上收益矩阵即可得到两种决策的收益

考虑短期过程,观察平均收益

对于长期过程,有平稳分布

类比不动点,可以使用特征向量得到