线代绝艺总纲
本文中使用符号 $I$ 表示单位矩阵
考研数学线性代数
考研数学线性代数部分包含
如果没有特殊说明
一共是 3 填空 1 选择 1 简答 = 32 分 / 150 分
行列式
行列式
按行或列展开行列式
以 $3$ 阶行列式为例
余子式 $M_{ij}$ 是将 $A$ 中第 $i$ 行第 $j$ 列元素划去后
代数余子式 $A_{ij} = (-1)^{i + j} M_{ij}$
行列式可以按行或列展开
如果行列式中某一行
另外
伴随矩阵
将矩阵 $A$ 的所有代数余子式按原先位置的转置排列为新的矩阵
伴随矩阵的意义是 $A^\star A = \det(A) I$
行列式的计算
- 对具体的行列式
通过行列式的性质进行计算, 即, 互换: 倍乘、 分拆、 倍加性质、 - 爪形行列式的计算
可以设法化为对角线上的三角行列式: 。 - 主对角线上的三角行列式
$\begin{vmatrix} a_{11} & \dots & a_{1n} \\ & \diagdown & \vdots \\ & & a_{nn} \end{vmatrix} = \begin{vmatrix} a_{11} & \\ \vdots & \diagdown & \\ a_{n_1} & \dots & a_{nn} \end{vmatrix} = a_{11} a_{22} \dots a_{nn}$: - 副对角线上的三角行列式
$\begin{vmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \diagup & \\ a_{n1} & & \end{vmatrix} = \begin{vmatrix} & & a_{1n} \\ & \diagup & \vdots \\ a_{n1} & \dots & a_{nn} \end{vmatrix} = (-1)^{\textstyle\frac{n(n-1)}{2}} a_{1n} a_{2(n-1)} \dots a_{n1}$: - 以上两个性质在分块矩阵中的推广
: - $\begin{vmatrix} A & O \\ \star & B \end{vmatrix} = \begin{vmatrix} A & O \\ \star & B \end{vmatrix} = \det(A) \det(B)$
- $\begin{vmatrix} O & A \\ B & \star \end{vmatrix} = \begin{vmatrix} \star & A \\ B & O \end{vmatrix} = (-1)^{mn}\det(A) \det(B)$
$A \in \mathbb{P}^{n\times n}$, $B \in \mathbb{P}^{m \times m}$,
- 准对角矩阵行列式
$\displaystyle \begin{vmatrix}A_1 & & & \\ & A_2 & & \\ & & \ddots & \\ & & & A_n\end{vmatrix} = \prod_{i = 1}^n \det(A_i)$: - 范德蒙行列式
$\displaystyle \begin{vmatrix} 1 & x_1^1 & x_1^2 & \dots & x_1^{n-1} \\ 1 & x_2^1 & x_2^2 & \dots & x_2^{n-1} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_n^1 & x_n^2 & \dots & x_n^{n-1} \end{vmatrix} = \prod_{1 \leq i < j \leq n} (x_j - x_i)$:
矩阵运算对行列式的影响
- $\det(kA) = k^n \det(A)$
- $\det(AB) = \det(A) \det(B)$
- $\det(A^T) = \det(A)$
- $A^\star A = \det(A) I$
- $\displaystyle \det(A^{-1}) = \frac{1}{\det(A)}$
- $\det(A^\star) = \det(A)^{n-1}$
克莱姆法则
线性方程组 $AX = b$
矩阵
矩阵的运算
矩阵乘法不服从交换律
由于矩阵乘法满足分配律
在矩阵的乘法中
关于零矩阵
- $AA = O$ $\nRightarrow$ $A = O$
反例。 $\begin{bmatrix} 0 & a \\ 0 & 0 \end{bmatrix}$: 。 - $AB = O$ $\nRightarrow$ $A = O$ 或 $B = O$
这是上面的弱化版本。 。 - $A^T A = O$ $\Rightarrow$ $A = O$
在实数域上成立, 复数域上不成立, 。
矩阵的转置
矩阵运算对转置的影响
- $(A^T)^T = A$
- $(A + B)^T = A^T + B^T$
- $(kA)^T = kA^T$
- $(AB)^T = B^T A^T$
- $(A^{-1})^T = (A^T)^{-1}$
分块矩阵及其运算
以下运算律默认出现的所有矩阵运算都是合法的
- $\begin{bmatrix} A_{11} & \dots & A_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} & \dots & A_{mn} \end{bmatrix} \pm \begin{bmatrix} B_{11} & \dots & B_{1n} \\ \vdots & \ddots & \vdots \\ B_{m1} & \dots & B_{mn} \end{bmatrix} = \begin{bmatrix} A_{11} \pm B_{11} & \dots & A_{1n} \pm B_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} \pm B_{m1} & \dots & A_{mn} \pm B_{mn} \end{bmatrix}$
- $\begin{bmatrix} A_{11} & \dots & A_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} & \dots & A_{mn} \end{bmatrix} \begin{bmatrix} B_{11} & \dots & B_{1n} \\ \vdots & \ddots & \vdots \\ B_{m1} & \dots & B_{mn} \end{bmatrix} = \begin{bmatrix} C_{11} & \dots & C_{1n} \\ \vdots & \ddots & \vdots \\ C_{m1} & \dots & C_{mn} \end{bmatrix}$
其中 $C_{ij} = \displaystyle \sum_{k = 1}^n A_{ik} B_{kj}$, 与矩阵元素为数时的矩阵乘法一致, 。
对分块矩阵
矩阵的秩
矩阵的秩的若干个等价的定义
- 线性无关的行或列的最大个数
; - 列向量或行向量的极大线性无关组的向量个数
; - 矩阵的非零子式的最大阶数
。
矩阵的秩的性质
- 矩阵的秩是初等变换中的不变量
初等行变换不改变矩阵的秩: 初等列变换不改变矩阵的秩, - 推论
如果 $P, Q$ 都是可逆矩阵: 那么 $r(A) = r(PA) = r(AQ) = r(PAQ)$,
- 推论
- $r(A) = n$ $\Leftrightarrow$ $A$ 可逆 $\Leftrightarrow$ $\det(A) \neq 0$
- $r(A) = 0$ $\Leftrightarrow$ $A = O$
- $r(A) = 1$ $\Leftrightarrow$ $A$ 的列向量是同一个向量的不同倍
即 $\exists \mathbf{a}, \mathbf{b} \neq \mathbf{0}$ 使得 $A = \mathbf{a} \mathbf{b}^T$,
矩阵运算对秩的影响
- $r(A) = r(A^T) = r(A^T A) = r(A A^T)$
- $r(A)$ 或 $r(B) \leq r(\begin{bmatrix} A & B \end{bmatrix}) \leq r(A) + r(B)$
- $r(\begin{bmatrix} A & O \\ O & B \end{bmatrix}) = r(A) + r(B)$
- $r(A + B) \leq r(A) + r(B)$
- 如果 $P, Q$ 都是可逆矩阵
那么 $r(A) = r(PA) = r(AQ) = r(PAQ)$, - 如果 $P$ 是列满秩的矩阵
那么 $r(A) = r(PA)$, 以 $P$ 作为新的基( ) - 如果 $Q$ 是行满秩的矩阵
那么 $r(A) = r(AQ)$, 上面的结论转置即得( ) - $r(AB) \leq \min\{r(A), r(B)\}$
- $r(AB) \geq r(A) + r(B) - n$
Sylvester 不等式( 要求 $A, B$ 均为方阵, ) - $A^{m\times n}, B^{n\times s}$
如果 $AB = O$, 那么 $r(A) + r(B) \leq n$, - $r(A^\star) = \begin{cases} n & \text{if } r(A) = n \\ 1 & \text{if } r(A) = n - 1 \\ 0 & \text{if } r (A) \leq n - 2 \end{cases}$
矩阵的相抵
通过秩来划分所有的矩阵
矩阵的逆
$A A^{-1} = A^{-1} A = I$
矩阵可逆的判断
矩阵 $A$ 可逆的充要条件
- $r(A) = n$
; - $\det(A) \neq 0$
; - 矩阵 $A$ 表示为若干初等矩阵的乘积
可逆的判断2
求逆矩阵
两种主要方法
伴随矩阵法
初等变换法
分块矩阵求逆
使用待定系数法列方程组求解逆矩阵
例. 如果 $A$
$\begin{vmatrix} A & O \\ C & D \end{vmatrix}^{-1} = \det(A) \det(D) \neq 0$
设 $\begin{bmatrix} A & O \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} X & Y \\ Z & W \end{bmatrix}$
从而有 $\begin{cases}AX = I \\AY = O \\CX + DZ = O \\CY + DW = I\end{cases}$
从而 $\begin{bmatrix} A & O \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} A^{-1} & O \\ -D^{-1}CA^{-1} & D^{-1} \end{bmatrix}$
矩阵运算对逆的影响
- $(A^{-1})^{-1} = A$
- $(kA)^{-1} = \displaystyle \frac{1}{k} A^{-1}$
- $(AB)^{-1} = B^{-1} A^{-1}$
矩阵的初等变换
用变换矩阵的乘法表示矩阵的初等变换
矩阵的初等变换包括
- 交换两行
列( 的变换) $E_{ij}$ $:=$ 在 $I$ 中交换对应的两行: 列( ) $\det(E_{ij}) = -1$。 由实际意义可知 $E_{ij}^{-1} = E_{ij}$, ; - 倍乘一行
列( 的变换) $E_{i, c}$ $:=$ 在 $I$ 中第 $i$ 行: 列( $\times c$) $\det(E_{i, c}) = c$。 由实际意义可知 $E_{i, c}^{-1} = E_{i, 1/c}$, ; - 某一行
列( 倍乘后加到另一行) 列( 的变换) $E_{ij, c}$ $:=$ 在 $I$ 中第 $i$ 行: 列( 乘 $c$ 后加到第 $j$ 行) 列( ) $\det(E_{ij, c}) = 1$。 $E_{ij, c}^{-1} = E_{ij, -c}$, 。
问题
向量
将线性方程组 $A\mathbf{x} = \mathbf{b}$ 看作 $x_1 \mathbf{\alpha}_1 + x_2 \mathbf{\alpha}_2 + \dots + x_n \mathbf{\alpha}_n = \mathbf{b}$
线性相关与线性表出
为方便表记
向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 是线性相关的
向量 $\mathbf{\beta}$ 可以由向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示
向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性相关 $\Leftrightarrow$ $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 中至少有一个向量可以由其他向量线性表示
向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性无关 $\Leftrightarrow$ $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 中任何一个向量都不能由其他向量线性表示
往向量组中添加向量对线性相关性的影响
(Base Case) 由单个非零向量组成的向量组是线性无关的
(Inductive Case) 往线性无关组中添加向量
往向量组中添加向量
往向量组中添加维数
如果 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 非零且两两正交
向量组的等价
对于向量组 $I : \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 和 $II: \mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$
- 如果每一个 $II$ 中的向量 $\mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$ 都可以由向量组 $I$ 线性表示
那么称向量组 $II$ 可由 $I$ 线性表示, ; - 如果每一个 $I$ 中的向量 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 都可以由向量组 $II$ 线性表示
那么称向量组 $I$ 可由 $II$ 线性表示, ;
如果向量组 $I$ 可由向量组 $II$ 线性表示
极大线性无关组与向量组的秩
极大线性无关组
向量组的秩
寻找极大线性无关组
使用下面的方法寻找所有可能的极大线性无关组
- 通过初等行变换将矩阵化为行阶梯形矩阵
确定向量组的秩, 三秩相等( ) ; - 选取非零的 $r$ 阶子式
将其对应的列向量组成的向量组就是极大线性无关组, 行变换不改变列向量的相对位置( 不改变矩阵的秩, ) 。
将第 2 步简化为寻找每行第一个非 $0$ 的数所在的列
极大线性无关组与向量组的秩的性质
- 向量组与其对应的极大线性无关组是等价的
- 向量组的极大线性无关组不一定唯一
- 如果 $I: \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$
$II: \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n, \mathbf{\beta}$, : - $r(I) = r(II)$ 当且仅当 $\mathbf{\beta}$ 可由 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示
- $r(I) = r(II) + 1$ 当且仅当 $\mathbf{\beta}$ 不能由 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示
- 对于向量组 $I : \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 和 $II: \mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$
: - 如果 $I$ 可由 $II$ 线性表示
那么 $r(I) \leq r(II)$, 。 - 如果 $I$ 可由 $II$ 线性表示
而 $II$ 不能由 $I$ 线性表示, 那么 $r(I) < r(II)$, 。 - 如果 $I$ 和 $II$ 等价
那么 $r(I) = r(II)$, 。 - 如果 $n = m$
两个向量组有相同个数的向量( ) 那么如果 $I$ 和 $II$ 等价, 则它们对应的矩阵也有相同的秩, 。 - 如果 $r(I) = r(II)$
并且 $I$ 可由 $II$ 线性表示, 那么 $I$ 和 $II$ 等价, 。
- 如果 $I$ 可由 $II$ 线性表示
向量组的秩、 矩阵的行秩和列秩
由矩阵的行向量组成的向量组的秩称为矩阵的行秩
矩阵的行秩
非齐次线性方程组解的结构
通过向量理论研究线性方程组
$A\mathbf{x} = \mathbf{b}$ 有解当且仅当 $r(A) = r(\begin{bmatrix} A & \mathbf{b} \end{bmatrix})$
$A\mathbf{x} = \mathbf{b}$ 无解当且仅当 $r(A) < r(\begin{bmatrix} A & \mathbf{b} \end{bmatrix}) = r(A) + 1$
线性方程组
线性方程组解的结构
秩 $r(A)$
对于齐次方程组 $A\mathbf{x} = \mathbf{0}$
对于齐次方程组 $A\mathbf{x} = \mathbf{0}$
对于非齐次方程组 $A\mathbf{x} = \mathbf{b}$
任意两个非齐次的解之差是对应齐次方程组的解
解空间
基础解系
线性方程组的一般求解法
矩阵运算对线性方程组的影响
- 如果 $A^{m \times n}$
$B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \mathbf{\beta}_2 & \dots & \mathbf{\beta}_s \end{bmatrix}$, 并且 $AB = 0$, 那么 $\beta_1, \beta_2, \dots, \beta_s$ 是 $A\mathbf{x} = \mathbf{0}$ 的解, - 如果 $A\mathbf{x} = \mathbf{0}$ 与 $B\mathbf{x} = \mathbf{0}$ 同解
那么 $r(A) = r(B)$, - 如果 $A\mathbf{x} = \mathbf{b}$ 与 $B\mathbf{x} = \mathbf{b}$ 同解
那么 $r(A) = r(B)$, - 设 $I: A\mathbf{x} = \mathbf{0}$
$II: B\mathbf{x} = \mathbf{0}$, $III: \begin{bmatrix} A \\ B \end{bmatrix}\mathbf{x} = \mathbf{0}$, 则 $III$ 的解空间是 $I$ 和 $II$ 的解空间的并集。 。 还原成方程组的形式( 这个结论是显然的, )
求解两个方程组的公共解
设 $I: A\mathbf{x} = \mathbf{0}$
并设 $I$ 的基础解系为 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$
假设 $\mathbf{\gamma}$ 是 $I$ 和 $II$ 的公共解
存在 $x_1, x_2, \dots, x_n$
原问题转化为求解线性方程组
将该线性方程组的解中的 $x_1, x_2, \dots, x_n$ 或者 $y_1, y_2, \dots, y_l$ 代入到 $\mathbf{\gamma}$ 中
两个方程组同解的条件
一般是已知两个方程组同解
两个线性方程组同解
通过秩相等以及其他条件进行推理
抽象的方程组同解问题
线性方程组理论的应用
利用两个方程组同解证明秩相等
可以利用线性方程组的理论证明
- $r(AA^T) = r(A)$
$r(A^TA) = r(A)$、 ; - 如果 $A$ 列满秩
那么 $r(AB) = r(B)$, 。
特征值理论
特征值是针对方阵而言的
特征值与特征向量
如果 $A\mathbf{v} = \lambda \mathbf{v}$
用定义求解特征向量
矩阵的特征多项式
特征值与特征向量的性质
- $\displaystyle \sum \lambda_i = tr(A)$
- $\displaystyle \prod \lambda_i = \det(A)$
- 属于不同特征值的特征向量线性无关
- $k$ 重特征值至多有 $k$ 个线性无关的特征向量
即 $\dim V_{\lambda} \leq k$, - 如果 $r(A) = 1$
那么其特征多项式 $\displaystyle \det(A - \lambda I) = \lambda^n - \left( \sum_{i = 0}^n a_{ii} \right) \lambda^{n - 1}$, 从而 $\lambda_1 = \lambda_2 = \dots = \lambda_{n-1} = 0$, $\lambda_n = tr(A)$, - 一眼就能看出 $r(A) = 1$ 的矩阵
$\alpha \beta^T$: $\alpha, \beta \neq \mathbf{0}$( ) 并且对于这样的矩阵, $tr(A) = \alpha^T \beta = <\alpha, \beta>$,
- 一眼就能看出 $r(A) = 1$ 的矩阵
- $A^{n \times n}$
如果 $A$ 是上三角矩阵 $\begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ 0 & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} \end{bmatrix}$, 那么 $A$ 的特征值是对角线上的元素 $a_{11}, a_{22}, \dots, a_{nn}$, - 上三角行列式的计算
$\displaystyle \begin{vmatrix} a_{11} - \lambda & a_{12} & \dots & a_{1n} \\ 0 & a_{22} - \lambda & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} - \lambda \end{vmatrix} = \prod_{i = 1}^n (a_{ii} - \lambda)$:
- 上三角行列式的计算
- 如果 $\alpha$
$\beta$ 是 $A$ 关于特征值 $\lambda$ 的特征向量, 那么 $k_1\alpha + k_2\beta$ 也是 $A$ 关于特征值 $\lambda$ 的特征向量, - 如果 $\alpha$
$\beta$ 是 $A$ 关于不同特征值的特征向量, 那么 $\alpha + \beta$ 不是 $A$ 的特征向量, - 设 $f(x)$ 为矩阵 $A$ 的特征多项式
则有 $f(A) = O$, Hamilton-Cayley 定理( )
矩阵运算对特征值、 特征向量的影响
已知矩阵 $A$ 的特征值 $\lambda$ 和其对应的特征向量 $\mathbf{v}$
- $\det(\lambda I - A^T) = \det(\lambda I - A) = 0$
即 $\lambda$ 是 $A^T$ 的特征值, ; - $\displaystyle A^{-1}\mathbf{v} = \frac{1}{\lambda} \mathbf{v}$
$\displaystyle \frac{1}{\lambda}$ 是 $A^{-1}$ 的特征值, $\mathbf{v}$ 是 $A^{-1}$ 的特征向量, ; - $A^k \mathbf{v} = \lambda^k \mathbf{v}$
$\lambda^k$ 是 $A^k$ 的特征值, $\mathbf{v}$ 是 $A^k$ 的特征向量, ; - $(A + kI) \mathbf{v} = (\lambda + k) \mathbf{v}$
$\lambda + k$ 是 $A + kI$ 的特征值, $\mathbf{v}$ 是 $A + kI$ 的特征向量, ; - 对于任意多项式 $g()$
$g(A)\mathbf{v} = g(\lambda) \mathbf{v}$, 即 $g(\lambda)$ 是 $g(A)$ 的特征值, $\mathbf{v}$ 是 $g(A)$ 的特征向量, 。 - $\displaystyle A^\star \mathbf{v} = \det(A) \frac{1}{\lambda} \mathbf{v}$
$\displaystyle \frac{\det(A)}{\lambda}$ 是 $A^\star$ 的特征值, $\mathbf{v}$ 是 $A^\star$ 的特征向量, 。
注意
如果追加条件 $P^{-1}AP = B$
- $B(P^{-1}\mathbf{v}) = \lambda (P^{-1}\mathbf{v})$
$P^{-1}\mathbf{v}$ 是 $B$ 的特征向量, $\lambda$ 是 $B$ 的特征值, 。
如果追加条件 $A = P^{-1}BP$
- $A(P\mathbf{v}) = \lambda (P\mathbf{v})$
$P\mathbf{v}$ 是 $A$ 的特征向量, $\lambda$ 是 $A$ 的特征值, 。
特征值与线性方程组的联系
例. 已知 $A\mathbf{x} = \mathbf{b}$ 的解是 $5\mathbf{b} + k_1 \mathbf{\alpha}_1 + k_2 \mathbf{\alpha}_2$
解. 由解的结构
矩阵的相似性
如果存在可逆矩阵 $P$ 使得 $P^{-1}AP = B$
相似是等价关系
矩阵运算对相似性的影响
若 $A = P^{-1}BP$ 则有
- $(A + kI) = P^{-1} (B + kI) P$
即 $(A + kI) \sim (B + kI)$, ; - $A^k = P^{-1} B^k P$
即 $A^k \sim B^k$, ; - $A^{-1} = P^{-1} B^{-1} P$
即 $A^{-1} \sim B^{-1}$, ; - $A^T = ({P^T})^{-1} B^T P^T$
即 $A^T \sim B^T$, 。
矩阵的相似对角化
相似对角化
解方程组 $A\begin{bmatrix} \mathbf{\gamma}_{1} & \dots & \mathbf{\gamma}_{n} \end{bmatrix} = \begin{bmatrix} \mathbf{\gamma}_{1} & \dots & \mathbf{\gamma}_{n} \end{bmatrix} \begin{bmatrix} d_1 & & \\ & \ddots & \\ & & d_n\end{bmatrix}$
$P^{-1} = \begin{bmatrix} \mathbf{v}_{11} \mathbf{v}_{12} \dots \mathbf{v}_{1k_1} \mathbf{v}_{21} \mathbf{v}_{22} \dots \mathbf{v}_{2k_2} \dots \mathbf{v}_{s1} \mathbf{v}_{s2} \dots \mathbf{v}_{sk_s} \end{bmatrix}$
这个过程还可以说明
相似的一个意义
关于矩阵的相似对角化
- 矩阵 $A^{n \times n}$ 可对角化
- $A$ 有 $n$ 个线性无关的特征向量
- $A$ 的每个特征值的特征子空间的维数等于特征值的重数
即 $\dim V_{\lambda_i} = k_i$, - $A$ 的特征子空间的维数之和等于 $n$
即 $\dim V_{\lambda_1} + \dim V_{\lambda_2} + \dots + \dim V_{\lambda_s} = n$,
判断是否可以相似对角化:
- 实对称矩阵一定可以相似对角化
- 有 $n$ 个不同的特征值的矩阵一定可以相似对角化
- 以上两个条件都不满足
计算重数大于 $1$ 的特征值的特征子空间的维数, 即计算 $\dim V_{\lambda_i} = n - r(A - \lambda_i I)$, 如果所有的 $\dim V_{\lambda_i} = k_i$, 则可以相似对角化, 。 先算特征值( 再算 $A - \lambda_i I$ 的秩, )
实对称矩阵
实对称矩阵一定可以相似对角化
实对称矩阵的特征值都是实数
实对称矩阵可以使用正交矩阵相似对角化
为了表述方便
求满足 $Q^{T}AQ = Q^{-1}AQ = \Lambda$ 的正交矩阵 $Q$
- 求特征值
特征向量、 ; - 改造特征向量使之正交化
: - 如果特征值不同
由于实对称矩阵属于不同特征值的特征向量相互正交, 只需要单位化这些特征向量, ; - 需要单位化的原因
$A^T A$ 的各元素是 $A$ 的列向量的内积: 而正交矩阵要求 $A^T A = I$, 从而要求 $A$ 的列向量正交, 并且模长为 $1$,
- 需要单位化的原因
- 如果特征值代数重数大于 $1$
对应的特征向量不正交, 需要进行 Schmidt 正交化, 然后单位化, 。
- 如果特征值不同
Schmidt 正交化
设 $\alpha_1, \alpha_2, \dots \alpha_n$ 线性无关
- $\displaystyle \beta_1 = \alpha_1$
; - $\displaystyle \beta_2 = \alpha_2 - \frac{\alpha_2 \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1$
; - $\displaystyle \beta_3 = \alpha_3 - \frac{\alpha_3 \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1 - \frac{\alpha_3 \cdot \beta_2}{\beta_2 \cdot \beta_2} \beta_2$
; - …
; - $\displaystyle \beta_n = \alpha_n - \frac{\alpha_n \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1 - \frac{\alpha_n \cdot \beta_2}{\beta_2 \cdot \beta_2} \beta_2 - \dots - \frac{\alpha_n \cdot \beta_{n - 1}}{\beta_{n - 1} \cdot \beta_{n - 1}} \beta_{n - 1}$
。
Schmidt 正交化的几何直观
判断矩阵的相似性
如果 $A \sim B$
- $\det(A) = \det(B)$
- $tr(A) = tr(B)$
- $A \sim \Lambda$
$B \sim \Lambda$ $\Rightarrow$ $r(A) = r(B)$, - $\det(A - \lambda I) = \det(B - \lambda I)$ $\Rightarrow$ $\lambda_A = \lambda_B$
满足上面的条件
判断矩阵的相似性的充分条件
判断两个不可相似对角化的矩阵是否相似
任意系数域为 $\mathbb{K}$ 的矩阵 $A$
使用相似的传递性
下面简要介绍 Jordan 标准型的计算方法
Jordan 标准型块
Jordan 标准型
- 求出矩阵 $A$ 的特征值 $\lambda_1, \lambda_2, \dots, \lambda_s$
; - 对于每个特征值 $\lambda_i$
求出其代数重数 $a_i$ 和几何重数 $g_i$, ; - 当 $g_i = a_i = k$ 时
特征值 $\lambda_i$ 对应 $k$ 个 $J_{\lambda_i, 1} = \begin{bmatrix} \lambda_i \end{bmatrix}$ 块, ; - 当 $g_i < a_i$ 时
特征值 $\lambda_i$ 对应 $g_i$ 个 Jordan 标准型块, 并且所有 Jordan 标准型块的大小之和等于 $a_i$, Jordan 标准型块的最大大小是使得 $\dim \ker(A - \lambda_i I)^k = \dim \ker(A - \lambda_i I)^{k + 1}$ 成立的最小正整数 $k$。 。 - 二重特征值
当几何重数不等于代数重数时, 几何重数只可能是 $1$, 即 Jordan 标准型块一定是 $\begin{bmatrix} \lambda_i & 1 \\ 0 & \lambda_i \end{bmatrix}$, - 三重特征值
当几何重数不等于代数重数时, 几何重数只可能是 $1$ 或者 $2$, 分别对应 Jordan 标准型块 $\begin{bmatrix} J_{\lambda_i, 3} \end{bmatrix}$ 和 $\begin{bmatrix} J_{\lambda_i, 2} & 0 \\ 0 & J_{\lambda_i, 1} \end{bmatrix}$,
- 二重特征值
由此可知
二次型
为简便起见
二次型与二次型矩阵
二次型是关于 $n$ 个变量 $x_1, x_2, \dots, x_n$ 的二次齐次多项式
二次型可以写为矩阵乘法的形式
对称矩阵 $A$ 称为二次型 $f(\mathbf{x})$ 的二次型矩阵
二次型的秩
二次型 $\mathbf{x}^T A \mathbf{x}$ 的秩被定义为二次型矩阵 $A$ 的秩
坐标变换
令 $\begin{cases}x_1 = c_{11}y_1 + c_{12}y_2 + c_{13}y_3 \\ x_2 = c_{21}y_1 + c_{22}y_2 + c_{23}y_3 \\ x_3 = c_{31}y_1 + c_{32}y_2 + c_{33}y_3 \end{cases}$
如果有矩阵 $C$ 是可逆矩阵
对于二次型 $\mathbf{x}^T A \mathbf{x}$
合同矩阵
如果存在可逆矩阵 $Q$
注意
当 $Q^T \neq Q^{-1}$ 时
合同关系是一种等价关系
合同矩阵的判定
通过标准型的正惯性指数 $p$ 和负惯性指数 $q$ 来判定两个矩阵是否合同
对于实对称矩阵
对于两个不可相似对角化的矩阵
定理. 如果矩阵 $A$ 与 $B$ 合同
定理. 如果矩阵 $A$ 与 $B$ 合同
二次型的标准型
如果二次型中仅有平方项
定理. 任何二次型都存在某一个合适的坐标变换 $C$ 将其化为标准型
二次型有两种方法化为标准型
配方法化二次型为标准型
例. 将二次型 $f = 1x_1^2 + 1x_2^2 + 4x_3^2 + 5x_1x_2 + 1x_1x_3 + 4x_2x_3$ 化为标准型
令 $\begin{cases} \displaystyle y_1 = 2x_1 + 5x_2 + x_3 \\ \displaystyle y_2 = 7x_2 - x_3 \\ \displaystyle y_3 = x_3 \end{cases}$
对于不含平方项的二次型
例. 将二次型 $f = 2x_1x_2 - 4x_1x_3$ 化为标准型
令 $\begin{cases} x_1 = y_1 + y_2 \\ x_2 = y_1 - y_2 \\ x_3 = y_3 \end{cases}$
令 $\begin{cases} z_1 = y_1 - y_3 \\ z_2 = y_2 + y_3 \\ z_3 = y_3 \end{cases}$
正交变换法化二次型为标准型
实对称矩阵必可使用正交矩阵相似对角化
作坐标变换 $\mathbf{x} = U \mathbf{y}$
二次型的规范型
如果标准型中的系数只有 $1$ 和 $-1$
使用坐标的伸缩变换将标准型化为规范型
例. 将 $f = 11 x_1^2 + 45 x_2^2 + 14 x^3_2$ 化为规范型
令 $\begin{cases} x_1 = \sqrt{11} y_1 \\ x_2 = \sqrt{45} y_2 \\ x_3 = \sqrt{14} y_3 \end{cases}$
惯性指数
正惯性指数 $p=$ 标准型/规范型中正平方项的个数
负惯性指数 $q=$ 标准型/规范型中负平方项的个数
定理.
使用上面的定理时
并不是每一个线性变换 $A' = AP$ 都能拆成 $A' = C^T A C$ 的形式
正定矩阵
正定矩阵是针对二次型矩阵而言的
定义
正定矩阵的判定
- 平方项系数都是正数
; 必要条件( ) - 正惯性指数 $p = n$
; 充要条件( ) - 与单位矩阵合同
; 充要条件( ) - 对于实对称矩阵
所有的特征值都是正数, ; 充要条件( ) - 顺序主子式都是正数
; 充要条件( ) - 存在可逆的 $P$ 使得 $A = P^T P$
。 充要条件( )
正定矩阵的应用
实对称矩阵正定
负定矩阵的判定
矩阵负定的一个充要条件为
线性代数的几何意义
本节参考 3B1B
目前本章的内容较为散乱
相关证明
占位符
本章留作在前文中提到的定理的补充证明
$r(A) = r(A^T) = r(A^T A) = r(A A^T)$
通过证明 $A\mathbf{x} = \mathbf{0}$ 与 $A^T A\mathbf{x} = \mathbf{0}$ 的解空间相同
这个结论仅仅在实数域内成立
在复数域内
关于 $r(A^\star)$ 的取值
有
证明.
(1) $AA^\star = \det(A) I$
(2) 如果 $r(A) = n - 1$
(3) 如果 $r(A) \leq n - 2$
如果 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 非零且两两正交, 那么 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 一定线性无关
令 $\displaystyle \sum_{i = 1}^n x_i \mathbf{\alpha}_i = \mathbf{0}$
$\forall j \in \{1, 2, \dots, n\}$
矩阵的秩等于其列向量组的秩等于其行向量组的秩
首先证明两个引理
- 初等行变换不改变矩阵的行秩
也不改变矩阵的列秩、 ; - 初等列变换不改变矩阵的列秩
也不改变矩阵的行秩、 。
第二个引理可以通过对矩阵进行转置
将矩阵通过初等变换
以下是对引理 1 的简要证明
假设矩阵 $A$ 通过初等行变换变为 $B$
对于矩阵的行秩
对于矩阵的列秩
如果 $A^{m \times n}$, $B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \dots & \mathbf{\beta}_s \end{bmatrix}$, 并且 $AB = O$, 那么 $\beta_1, \dots, \beta_s$ 是 $A\mathbf{x} = \mathbf{0}$ 的解
如果 $AB = O$
使用这个结论
特征值的几何重数小于等于代数重数( $k$ 重特征值至多有 $k$ 个线性无关的特征向量)
假设矩阵 $A^{n \times n}$ 的特征值 $\lambda_0$ 对应的特征向量有 $\xi_1, \xi_2, \dots, \xi_k$
令 $B = \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix}$
显然 $B$ 可逆
从而特征值 $\lambda_0$ 的代数重数大于等于 $k$
反之
实对称矩阵属于不同特征值的特征向量相互正交
设 $A$ 是实对称矩阵
考察内积 $\mathbf{v}_1 \cdot \mathbf{v}_2$
由于 $\lambda_1 \neq \lambda_2$
矩阵 $A$ 正定, 当且仅当存在可逆矩阵 $P$ 使得 $A = P^{T}P$
(i) 必要性
证明.
对矩阵 $A$ 作相似对角化
由于 $A$ 正定
显然
(ii) 充分性
证明.
对任意的 $\mathbf{x} \neq \mathbf{0}$
而由于矩阵 $P$ 可逆
从而 $\lVert P \mathbf{x} \rVert^{2} > 0$