线性代数

Tabula Contentorum

  1. 1. 考研数学线性代数
    1. 1.1. 行列式
      1. 1.1.1. 按行或列展开行列式
      2. 1.1.2. 伴随矩阵
      3. 1.1.3. 行列式的计算
      4. 1.1.4. 矩阵运算对行列式的影响
      5. 1.1.5. 克莱姆法则
    2. 1.2. 矩阵
      1. 1.2.1. 矩阵的运算
        1. 1.2.1.1. 关于零矩阵
      2. 1.2.2. 矩阵的转置
        1. 1.2.2.1. 矩阵运算对转置的影响
      3. 1.2.3. 分块矩阵及其运算
      4. 1.2.4. 矩阵的秩
        1. 1.2.4.1. 矩阵的秩的性质
        2. 1.2.4.2. 矩阵运算对秩的影响
      5. 1.2.5. 矩阵的相抵
      6. 1.2.6. 矩阵的逆
        1. 1.2.6.1. 矩阵可逆的判断
        2. 1.2.6.2. 求逆矩阵
        3. 1.2.6.3. 分块矩阵求逆
        4. 1.2.6.4. 矩阵运算对逆的影响
      7. 1.2.7. 矩阵的初等变换
    3. 1.3. 向量
      1. 1.3.1. 线性相关与线性表出
        1. 1.3.1.1. 往向量组中添加向量对线性相关性的影响
      2. 1.3.2. 向量组的等价
      3. 1.3.3. 极大线性无关组与向量组的秩
        1. 1.3.3.1. 寻找极大线性无关组
        2. 1.3.3.2. 极大线性无关组与向量组的秩的性质
        3. 1.3.3.3. 向量组的秩、矩阵的行秩和列秩
      4. 1.3.4. 非齐次线性方程组解的结构
    4. 1.4. 线性方程组
      1. 1.4.1. 线性方程组解的结构
      2. 1.4.2. 线性方程组的一般求解法
      3. 1.4.3. 矩阵运算对线性方程组的影响
      4. 1.4.4. 求解两个方程组的公共解
      5. 1.4.5. 两个方程组同解的条件
      6. 1.4.6. 线性方程组理论的应用
        1. 1.4.6.1. 利用两个方程组同解证明秩相等
    5. 1.5. 特征值理论
      1. 1.5.1. 特征值与特征向量
      2. 1.5.2. 特征值与特征向量的性质
      3. 1.5.3. 矩阵运算对特征值、特征向量的影响
      4. 1.5.4. 特征值与线性方程组的联系
      5. 1.5.5. 矩阵的相似性
        1. 1.5.5.1. 矩阵运算对相似性的影响
      6. 1.5.6. 矩阵的相似对角化
        1. 1.5.6.1. 判断是否可以相似对角化:
      7. 1.5.7. 实对称矩阵
      8. 1.5.8. Schmidt 正交化
      9. 1.5.9. 判断矩阵的相似性
        1. 1.5.9.1. 判断两个不可相似对角化的矩阵是否相似
    6. 1.6. 二次型
      1. 1.6.1. 二次型与二次型矩阵
      2. 1.6.2. 二次型的秩
      3. 1.6.3. 坐标变换
      4. 1.6.4. 合同矩阵
        1. 1.6.4.1. 合同矩阵的判定
      5. 1.6.5. 二次型的标准型
        1. 1.6.5.1. 配方法化二次型为标准型
        2. 1.6.5.2. 正交变换法化二次型为标准型
      6. 1.6.6. 二次型的规范型
      7. 1.6.7. 惯性指数
      8. 1.6.8. 正定矩阵
        1. 1.6.8.1. 正定矩阵的判定
        2. 1.6.8.2. 正定矩阵的应用
        3. 1.6.8.3. 负定矩阵的判定
  2. 2. 线性代数的几何意义
  3. 3. 相关证明
    1. 3.1. 占位符
      1. 3.1.1. $r(A) = r(A^T) = r(A^T A) = r(A A^T)$
      2. 3.1.2. 关于 $r(A^\star)$ 的取值
      3. 3.1.3. 如果 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 非零且两两正交,那么 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 一定线性无关
      4. 3.1.4. 矩阵的秩等于其列向量组的秩等于其行向量组的秩
      5. 3.1.5. 如果 $A^{m \times n}$,$B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \dots & \mathbf{\beta}_s \end{bmatrix}$,并且 $AB = O$,那么 $\beta_1, \dots, \beta_s$ 是 $A\mathbf{x} = \mathbf{0}$ 的解
      6. 3.1.6. 特征值的几何重数小于等于代数重数($k$ 重特征值至多有 $k$ 个线性无关的特征向量)
      7. 3.1.7. 实对称矩阵属于不同特征值的特征向量相互正交
      8. 3.1.8. 矩阵 $A$ 正定,当且仅当存在可逆矩阵 $P$ 使得 $A = P^{T}P$

线代绝艺总纲考研数学篇

本文中使用符号 $I$ 表示单位矩阵$O$ 表示零矩阵

考研数学线性代数

考研数学线性代数部分包含行列式矩阵向量线性方程组特征值与特征向量二次型

如果没有特殊说明本文主要讨论的矩阵是实数域上的矩阵

一共是 3 填空 1 选择 1 简答 = 32 分 / 150 分

行列式

行列式不同行不同列元素乘积的代数和$\displaystyle \det(A) = \sum_{j_1j_2\dots j_n} (-1)^{\tau(j_1j_2\dots j_n)} a_{1j_1} a_{2j_2} \dots a_{nj_n}$其中 $\tau(j_1j_2\dots j_n)$$j_1j_2\dots j_n$ 的逆序数即序列 $j_1j_2\dots j_n$ 中逆序对的个数$4$ 阶及以上的行列式不能使用主对角线-副对角线法则计算

按行或列展开行列式

$3$ 阶行列式为例$A = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix}$

余子式 $M_{ij}$ 是将 $A$ 中第 $i$ 行第 $j$ 列元素划去后剩下的元素按原来的顺序排成行列式例如 $M_{11} = \begin{vmatrix} a_{22} & a_{23} \\ a_{32} & a_{33} \end{vmatrix}$

代数余子式 $A_{ij} = (-1)^{i + j} M_{ij}$例如 $A_{11} = (-1)^{1+1}\begin{vmatrix} a_{22} & a_{23} \\ a_{32} & a_{33} \end{vmatrix}$

行列式可以按行或列展开$\displaystyle \det(A) = \sum_{i = 1}^n a_{ij} A_{ij} = \sum_{j = 1}^n a_{ij} A_{ij}$

如果行列式中某一行的元素与另一行的代数余子式相乘后累加会得到 $0$即当 $i \neq j$ $\displaystyle \sum_{k = 1}^n a_{ik} A_{jk} = 0$

另外可以按多行展开行列式拉普拉斯定理

伴随矩阵

将矩阵 $A$ 的所有代数余子式按原先位置的转置排列为新的矩阵这个矩阵就是 $A$ 的伴随矩阵记作 $A^\star$

$$A^\star = \begin{bmatrix} A_{11} & A_{21} & \dots & A_{n1} \\ A_{12} & A_{22} & \dots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \dots & A_{nn} \end{bmatrix} $$

伴随矩阵的意义是 $A^\star A = \det(A) I$即如果 $A$ 可逆那么 $\displaystyle A^{-1} = \frac{1}{\det(A)} A^\star$

行列式的计算

  1. 对具体的行列式通过行列式的性质进行计算互换倍乘分拆倍加性质
  2. 爪形行列式的计算可以设法化为对角线上的三角行列式
  3. 主对角线上的三角行列式$\begin{vmatrix} a_{11} & \dots & a_{1n} \\ & \diagdown & \vdots \\ & & a_{nn} \end{vmatrix} = \begin{vmatrix} a_{11} & \\ \vdots & \diagdown & \\ a_{n_1} & \dots & a_{nn} \end{vmatrix} = a_{11} a_{22} \dots a_{nn}$
  4. 副对角线上的三角行列式$\begin{vmatrix} a_{11} & \dots & a_{1n} \\ \vdots & \diagup & \\ a_{n1} & & \end{vmatrix} = \begin{vmatrix} & & a_{1n} \\ & \diagup & \vdots \\ a_{n1} & \dots & a_{nn} \end{vmatrix} = (-1)^{\textstyle\frac{n(n-1)}{2}} a_{1n} a_{2(n-1)} \dots a_{n1}$
  5. 以上两个性质在分块矩阵中的推广
    1. $\begin{vmatrix} A & O \\ \star & B \end{vmatrix} = \begin{vmatrix} A & O \\ \star & B \end{vmatrix} = \det(A) \det(B)$
    2. $\begin{vmatrix} O & A \\ B & \star \end{vmatrix} = \begin{vmatrix} \star & A \\ B & O \end{vmatrix} = (-1)^{mn}\det(A) \det(B)$$A \in \mathbb{P}^{n\times n}$$B \in \mathbb{P}^{m \times m}$
  6. 准对角矩阵行列式$\displaystyle \begin{vmatrix}A_1 & & & \\ & A_2 & & \\ & & \ddots & \\ & & & A_n\end{vmatrix} = \prod_{i = 1}^n \det(A_i)$
  7. 范德蒙行列式$\displaystyle \begin{vmatrix} 1 & x_1^1 & x_1^2 & \dots & x_1^{n-1} \\ 1 & x_2^1 & x_2^2 & \dots & x_2^{n-1} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_n^1 & x_n^2 & \dots & x_n^{n-1} \end{vmatrix} = \prod_{1 \leq i < j \leq n} (x_j - x_i)$

矩阵运算对行列式的影响

  1. $\det(kA) = k^n \det(A)$
  2. $\det(AB) = \det(A) \det(B)$
  3. $\det(A^T) = \det(A)$
  4. $A^\star A = \det(A) I$
  5. $\displaystyle \det(A^{-1}) = \frac{1}{\det(A)}$
  6. $\det(A^\star) = \det(A)^{n-1}$

克莱姆法则

线性方程组 $AX = b$如果 $\det(A) \neq 0$则有且只有唯一解 $x_1 = \displaystyle \frac{\det(A_1)}{\det(A)}$$x_2 = \displaystyle \frac{\det(A_2)}{\det(A)}$$\dots$$x_n = \displaystyle \frac{\det(A_n)}{\det(A)}$其中 $A_i$ 是将 $A$ 的第 $i$ 列替换为 $b$ 后的矩阵

矩阵

矩阵的运算

矩阵乘法不服从交换律但是满足结合律和分配律

由于矩阵乘法满足分配律因此可以对矩阵进行因式分解$A(B + C) = AB + AC$

在矩阵的乘法中常用的运算技巧是将矩阵列化为列向量进行计算

$$A \begin{bmatrix} \beta_1 & \beta_2 & \dots & \beta_n \end{bmatrix} = \begin{bmatrix} A \beta_1 & A \beta_2 & \dots & A \beta_n \end{bmatrix} $$

关于零矩阵

  1. $AA = O$ $\nRightarrow$ $A = O$反例$\begin{bmatrix} 0 & a \\ 0 & 0 \end{bmatrix}$
  2. $AB = O$ $\nRightarrow$ $A = O$$B = O$这是上面的弱化版本
  3. $A^T A = O$ $\Rightarrow$ $A = O$在实数域上成立复数域上不成立

矩阵的转置

矩阵运算对转置的影响

  1. $(A^T)^T = A$
  2. $(A + B)^T = A^T + B^T$
  3. $(kA)^T = kA^T$
  4. $(AB)^T = B^T A^T$
  5. $(A^{-1})^T = (A^T)^{-1}$

分块矩阵及其运算

以下运算律默认出现的所有矩阵运算都是合法的

  1. $\begin{bmatrix} A_{11} & \dots & A_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} & \dots & A_{mn} \end{bmatrix} \pm \begin{bmatrix} B_{11} & \dots & B_{1n} \\ \vdots & \ddots & \vdots \\ B_{m1} & \dots & B_{mn} \end{bmatrix} = \begin{bmatrix} A_{11} \pm B_{11} & \dots & A_{1n} \pm B_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} \pm B_{m1} & \dots & A_{mn} \pm B_{mn} \end{bmatrix}$
  2. $\begin{bmatrix} A_{11} & \dots & A_{1n} \\ \vdots & \ddots & \vdots \\ A_{m1} & \dots & A_{mn} \end{bmatrix} \begin{bmatrix} B_{11} & \dots & B_{1n} \\ \vdots & \ddots & \vdots \\ B_{m1} & \dots & B_{mn} \end{bmatrix} = \begin{bmatrix} C_{11} & \dots & C_{1n} \\ \vdots & \ddots & \vdots \\ C_{m1} & \dots & C_{mn} \end{bmatrix}$其中 $C_{ij} = \displaystyle \sum_{k = 1}^n A_{ik} B_{kj}$与矩阵元素为数时的矩阵乘法一致

对分块矩阵如果运算合法例如每一个分块都是规模相等的方阵则同样适用初等变换的结论

矩阵的秩

矩阵的秩的若干个等价的定义

  1. 线性无关的行或列的最大个数
  2. 列向量或行向量的极大线性无关组的向量个数
  3. 矩阵的非零子式的最大阶数

矩阵的秩的性质

  1. 矩阵的秩是初等变换中的不变量初等行变换不改变矩阵的秩初等列变换不改变矩阵的秩
    • 推论如果 $P, Q$ 都是可逆矩阵那么 $r(A) = r(PA) = r(AQ) = r(PAQ)$
  2. $r(A) = n$ $\Leftrightarrow$ $A$ 可逆 $\Leftrightarrow$ $\det(A) \neq 0$
  3. $r(A) = 0$ $\Leftrightarrow$ $A = O$
  4. $r(A) = 1$ $\Leftrightarrow$ $A$ 的列向量是同一个向量的不同倍$\exists \mathbf{a}, \mathbf{b} \neq \mathbf{0}$ 使得 $A = \mathbf{a} \mathbf{b}^T$

矩阵运算对秩的影响

  1. $r(A) = r(A^T) = r(A^T A) = r(A A^T)$
  2. $r(A)$$r(B) \leq r(\begin{bmatrix} A & B \end{bmatrix}) \leq r(A) + r(B)$
  3. $r(\begin{bmatrix} A & O \\ O & B \end{bmatrix}) = r(A) + r(B)$
  4. $r(A + B) \leq r(A) + r(B)$
  5. 如果 $P, Q$ 都是可逆矩阵那么 $r(A) = r(PA) = r(AQ) = r(PAQ)$
  6. 如果 $P$ 是列满秩的矩阵那么 $r(A) = r(PA)$$P$ 作为新的基
  7. 如果 $Q$ 是行满秩的矩阵那么 $r(A) = r(AQ)$上面的结论转置即得
  8. $r(AB) \leq \min\{r(A), r(B)\}$
  9. $r(AB) \geq r(A) + r(B) - n$Sylvester 不等式要求 $A, B$ 均为方阵
  10. $A^{m\times n}, B^{n\times s}$如果 $AB = O$那么 $r(A) + r(B) \leq n$
  11. $r(A^\star) = \begin{cases} n & \text{if } r(A) = n \\ 1 & \text{if } r(A) = n - 1 \\ 0 & \text{if } r (A) \leq n - 2 \end{cases}$

矩阵的相抵

通过秩来划分所有的矩阵如果矩阵 $A$ 通过初等变换可以得到矩阵 $B$$r(A) = r(B)$则称 $A$$B$ 相抵

矩阵的逆

$A A^{-1} = A^{-1} A = I$对于复数域上的矩阵如果 $AB = I$一定可以推出 $BA = I$即左逆一定等于右逆

矩阵可逆的判断

矩阵 $A$ 可逆的充要条件

  1. $r(A) = n$
  2. $\det(A) \neq 0$
  3. 矩阵 $A$ 表示为若干初等矩阵的乘积

可逆的判断2如果 $A$ 可以表示为若干初等矩阵的乘积$A$ 可逆反之亦然成立

求逆矩阵

两种主要方法伴随矩阵法初等变换法

伴随矩阵法$\displaystyle A^{-1} = \frac{1}{\det(A)} A^\star$

初等变换法对矩阵 $\begin{bmatrix} A & I \end{bmatrix}$ 进行初等行变换$A$ 变为单位矩阵此时矩阵将变为 $\begin{bmatrix} I & A^{-1} \end{bmatrix}$ 矩阵的右半部分即 $A$ 的逆矩阵

分块矩阵求逆

使用待定系数法列方程组求解逆矩阵

例. 如果 $A$$D$ 均为可逆矩阵$\begin{bmatrix} A & O \\ C & D \end{bmatrix}^{-1}$

$\begin{vmatrix} A & O \\ C & D \end{vmatrix}^{-1} = \det(A) \det(D) \neq 0$从而矩阵 $\begin{bmatrix} A & O \\ C & D \end{bmatrix}$ 可逆

$\begin{bmatrix} A & O \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} X & Y \\ Z & W \end{bmatrix}$则有 $\begin{bmatrix} A & O \\ C & D \end{bmatrix} \begin{bmatrix} X & Y \\ Z & W \end{bmatrix} = \begin{bmatrix} I & O \\ O & I \end{bmatrix}$

从而有 $\begin{cases}AX = I \\AY = O \\CX + DZ = O \\CY + DW = I\end{cases}$解得 $\begin{cases} X = A^{-1} \\ Y = O \\ Z = -D^{-1}CA^{-1} \\ W = D^{-1} \end{cases}$

从而 $\begin{bmatrix} A & O \\ C & D \end{bmatrix}^{-1} = \begin{bmatrix} A^{-1} & O \\ -D^{-1}CA^{-1} & D^{-1} \end{bmatrix}$

矩阵运算对逆的影响

  1. $(A^{-1})^{-1} = A$
  2. $(kA)^{-1} = \displaystyle \frac{1}{k} A^{-1}$
  3. $(AB)^{-1} = B^{-1} A^{-1}$

矩阵的初等变换

用变换矩阵的乘法表示矩阵的初等变换左乘初等矩阵为行变换右乘初等矩阵为列变换

矩阵的初等变换包括

  1. 交换两行的变换$E_{ij}$ $:=$$I$ 中交换对应的两行$\det(E_{ij}) = -1$由实际意义可知 $E_{ij}^{-1} = E_{ij}$
  2. 倍乘一行的变换$E_{i, c}$ $:=$$I$ 中第 $i$ $\times c$$\det(E_{i, c}) = c$由实际意义可知 $E_{i, c}^{-1} = E_{i, 1/c}$
  3. 某一行倍乘后加到另一行的变换$E_{ij, c}$ $:=$$I$ 中第 $i$$c$ 后加到第 $j$$\det(E_{ij, c}) = 1$$E_{ij, c}^{-1} = E_{ij, -c}$

问题可逆矩阵 $A^{n\times n}$ 是否可以通过有限次初等行变换变为 $E$ —— 与解方程组的过程一致

向量

将线性方程组 $A\mathbf{x} = \mathbf{b}$ 看作 $x_1 \mathbf{\alpha}_1 + x_2 \mathbf{\alpha}_2 + \dots + x_n \mathbf{\alpha}_n = \mathbf{b}$从而得到向量的线性相关性线性无关性线性表示等概念

线性相关与线性表出

为方便表记约定 $A = \begin{bmatrix} \mathbf{\alpha}_1 & \mathbf{\alpha}_2 & \dots & \mathbf{\alpha}_n \end{bmatrix}$$\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}$$\mathbf{b} = \mathbf{\beta}$

向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 是线性相关的当且仅当存在不全为 $0$ 的数 $x_1, x_2, \dots, x_n$ 使得 $x_1 \mathbf{\alpha}_1 + x_2 \mathbf{\alpha}_2 + \dots + x_n \mathbf{\alpha}_n = \mathbf{0}$即方程组 $A\mathbf{x} = \mathbf{0}$ 有非零解

向量 $\mathbf{\beta}$ 可以由向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示当且仅当存在数 $x_1, x_2, \dots, x_n$ 使得 $x_1 \mathbf{\alpha}_1 + x_2 \mathbf{\alpha}_2 + \dots + x_n \mathbf{\alpha}_n = \mathbf{\beta}$即方程组 $A\mathbf{x} = \mathbf{\beta}$ 有解

向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性相关 $\Leftrightarrow$ $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 中至少有一个向量可以由其他向量线性表示

向量组 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性无关 $\Leftrightarrow$ $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 中任何一个向量都不能由其他向量线性表示

往向量组中添加向量对线性相关性的影响

(Base Case) 由单个非零向量组成的向量组是线性无关的

(Inductive Case) 往线性无关组中添加向量如果添加到向量不能用原来组内的向量线性表示那么新的向量组是线性无关的

往向量组中添加向量要么新的向量组变为线性相关的要么向量组保持线性无关添加向量增加了向量组的线性相关性考虑齐次方程组的情形添加越多未知数方程组越可能有不足够的约束条件从而导致齐次方程组有非零解

往向量组中添加维数线性相关性减少同样考虑齐次方程组的情形添加维数相当于增加新的方程这增加了约束条件从而导致齐次方程组有更高的概率只有零解

如果 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 非零且两两正交那么 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 一定线性无关反之未然

向量组的等价

对于向量组 $I : \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$$II: \mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$

  1. 如果每一个 $II$ 中的向量 $\mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$ 都可以由向量组 $I$ 线性表示那么称向量组 $II$ 可由 $I$ 线性表示
  2. 如果每一个 $I$ 中的向量 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 都可以由向量组 $II$ 线性表示那么称向量组 $I$ 可由 $II$ 线性表示

如果向量组 $I$ 可由向量组 $II$ 线性表示且向量组 $II$ 可由向量组 $I$ 线性表示那么称向量组 $I$$II$ 等价

极大线性无关组与向量组的秩

极大线性无关组向量组中的向量组成的子向量组这个子向量组是线性无关的但是再添加任何一个原先向量组中的向量都会使得这个子集线性相关

向量组的秩向量组的极大线性无关组的向量个数

寻找极大线性无关组

使用下面的方法寻找所有可能的极大线性无关组

  1. 通过初等行变换将矩阵化为行阶梯形矩阵确定向量组的秩三秩相等
  2. 选取非零的 $r$ 阶子式将其对应的列向量组成的向量组就是极大线性无关组行变换不改变列向量的相对位置不改变矩阵的秩

将第 2 步简化为寻找每行第一个非 $0$ 的数所在的列能够快速地找到一组极大线性无关组

极大线性无关组与向量组的秩的性质

  1. 向量组与其对应的极大线性无关组是等价的
  2. 向量组的极大线性无关组不一定唯一
  3. 如果 $I: \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$$II: \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n, \mathbf{\beta}$
    1. $r(I) = r(II)$ 当且仅当 $\mathbf{\beta}$ 可由 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示
    2. $r(I) = r(II) + 1$ 当且仅当 $\mathbf{\beta}$ 不能由 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$ 线性表示
  4. 对于向量组 $I : \mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$$II: \mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_m$
    1. 如果 $I$ 可由 $II$ 线性表示那么 $r(I) \leq r(II)$
    2. 如果 $I$ 可由 $II$ 线性表示$II$ 不能由 $I$ 线性表示那么 $r(I) < r(II)$
    3. 如果 $I$$II$ 等价那么 $r(I) = r(II)$
    4. 如果 $n = m$两个向量组有相同个数的向量那么如果 $I$$II$ 等价则它们对应的矩阵也有相同的秩
    5. 如果 $r(I) = r(II)$并且 $I$ 可由 $II$ 线性表示那么 $I$$II$ 等价

向量组的秩矩阵的行秩和列秩

由矩阵的行向量组成的向量组的秩称为矩阵的行秩由矩阵的列向量组成的向量组的秩称为矩阵的列秩

矩阵的行秩列秩矩阵的秩三秩相等

非齐次线性方程组解的结构

通过向量理论研究线性方程组可以自然地得到

$A\mathbf{x} = \mathbf{b}$ 有解当且仅当 $r(A) = r(\begin{bmatrix} A & \mathbf{b} \end{bmatrix})$

$A\mathbf{x} = \mathbf{b}$ 无解当且仅当 $r(A) < r(\begin{bmatrix} A & \mathbf{b} \end{bmatrix}) = r(A) + 1$

线性方程组

线性方程组解的结构

$r(A)$对方程组 $A\mathbf{x} = \mathbf{0}$ 的未知数的约束数量

对于齐次方程组 $A\mathbf{x} = \mathbf{0}$$\dim W_0 = n - r(A)$齐次方程组的解空间是一个 $n - r(A)$ 维的子空间线性映射的维数定理$V, W$$\mathbb{P}$ 上两个线性空间并且 $\dim V$ 有限对线性映射 $\varphi \in \operatorname{Hom}_{\mathbb{P}}(V, W)$$\dim\operatorname{Im}(\varphi) + \dim\operatorname{Ker}(\varphi) = \dim V$

对于齐次方程组 $A\mathbf{x} = \mathbf{0}$如果 $r(A) = n$那么只有零解如果 $r(A) < n$那么有无穷多解

对于非齐次方程组 $A\mathbf{x} = \mathbf{b}$只有当 $r(A) = r(\begin{bmatrix} A & \mathbf{b} \end{bmatrix})$ 时才有解解的结构是特解加上对于的齐次方程组的通解

任意两个非齐次的解之差是对应齐次方程组的解

解空间对于 $A\mathbf{x} = \mathbf{0}$解空间的基是 $n - r(A)$ 个线性无关的解向量对于 $A\mathbf{x} = \mathbf{b}$解空间是特解 + 对应的齐次方程组的解空间

基础解系解向量的最大线性无关组解空间的基

线性方程组的一般求解法

矩阵运算对线性方程组的影响

  1. 如果 $A^{m \times n}$$B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \mathbf{\beta}_2 & \dots & \mathbf{\beta}_s \end{bmatrix}$并且 $AB = 0$那么 $\beta_1, \beta_2, \dots, \beta_s$$A\mathbf{x} = \mathbf{0}$ 的解
  2. 如果 $A\mathbf{x} = \mathbf{0}$$B\mathbf{x} = \mathbf{0}$ 同解那么 $r(A) = r(B)$
  3. 如果 $A\mathbf{x} = \mathbf{b}$$B\mathbf{x} = \mathbf{b}$ 同解那么 $r(A) = r(B)$
  4. $I: A\mathbf{x} = \mathbf{0}$$II: B\mathbf{x} = \mathbf{0}$$III: \begin{bmatrix} A \\ B \end{bmatrix}\mathbf{x} = \mathbf{0}$$III$ 的解空间是 $I$$II$ 的解空间的并集还原成方程组的形式这个结论是显然的

求解两个方程组的公共解

$I: A\mathbf{x} = \mathbf{0}$$II: B\mathbf{x} = \mathbf{0}$求解 $I$$II$ 的公共解

并设 $I$ 的基础解系为 $\mathbf{\alpha}_1, \mathbf{\alpha}_2, \dots, \mathbf{\alpha}_n$$II$ 的基础解系为 $\mathbf{\beta}_1, \mathbf{\beta}_2, \dots, \mathbf{\beta}_l$

假设 $\mathbf{\gamma}$$I$$II$ 的公共解那么 $\mathbf{\gamma}$ 必然能够通过 $A$ 的基础解系线性表出同理$\mathbf{\gamma}$ 必然能够通过 $B$ 的基础解系线性表出那么

存在 $x_1, x_2, \dots, x_n$ $y_1, y_2, \dots, y_l$ 使得

$$x_1 \mathbf{\alpha}_1 + x_2 \mathbf{\alpha}_2 + \dots + x_n \mathbf{\alpha}_n = \mathbf{\gamma} = -(y_1 \mathbf{\beta}_1 + y_2 \mathbf{\beta}_2 + \dots + y_l \mathbf{\beta}_l) $$

原问题转化为求解线性方程组

$$\begin{bmatrix} \mathbf{\alpha}_1 & \mathbf{\alpha}_2 & \dots & \mathbf{\alpha}_n & \mathbf{\beta}_1 & \mathbf{\beta}_2 & \dots & \mathbf{\beta}_l \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ y_1 \\ y_2 \\ \vdots \\ y_l \end{bmatrix} = \mathbf{0} $$

将该线性方程组的解中的 $x_1, x_2, \dots, x_n$ 或者 $y_1, y_2, \dots, y_l$ 代入到 $\mathbf{\gamma}$即可得到所有的公共解

两个方程组同解的条件

一般是已知两个方程组同解求解未知的参数

两个线性方程组同解必要条件是它们的系数矩阵的秩相等

通过秩相等以及其他条件进行推理得到可能的参数回代验证

抽象的方程组同解问题把解设出来

线性方程组理论的应用

利用两个方程组同解证明秩相等

可以利用线性方程组的理论证明

  1. $r(AA^T) = r(A)$$r(A^TA) = r(A)$
  2. 如果 $A$ 列满秩那么 $r(AB) = r(B)$

特征值理论

特征值是针对方阵而言的

特征值与特征向量

如果 $A\mathbf{v} = \lambda \mathbf{v}$并且 $\mathbf{v} \neq 0$那么 $\lambda$$A$ 的特征值$\mathbf{v}$$A$ 的对应于特征值 $\lambda$ 的特征向量

用定义求解特征向量$A\mathbf{v} = \lambda \mathbf{v}$$(A - \lambda I)\mathbf{v} = \mathbf{0}$求解 $(A - \lambda I)\mathbf{v} = \mathbf{0}$ 的非零解即可特征值$\det(A - \lambda I) = 0$特征向量实际上是齐次方程组的解空间的基解空间又被称为特征子空间

矩阵的特征多项式$f(\lambda) = \det(A - \lambda I) = 0$

特征值与特征向量的性质

  1. $\displaystyle \sum \lambda_i = tr(A)$
  2. $\displaystyle \prod \lambda_i = \det(A)$
  3. 属于不同特征值的特征向量线性无关
  4. $k$ 重特征值至多有 $k$ 个线性无关的特征向量$\dim V_{\lambda} \leq k$
  5. 如果 $r(A) = 1$那么其特征多项式 $\displaystyle \det(A - \lambda I) = \lambda^n - \left( \sum_{i = 0}^n a_{ii} \right) \lambda^{n - 1}$从而 $\lambda_1 = \lambda_2 = \dots = \lambda_{n-1} = 0$$\lambda_n = tr(A)$
    • 一眼就能看出 $r(A) = 1$ 的矩阵$\alpha \beta^T$$\alpha, \beta \neq \mathbf{0}$并且对于这样的矩阵$tr(A) = \alpha^T \beta = <\alpha, \beta>$
  6. $A^{n \times n}$如果 $A$ 是上三角矩阵 $\begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ 0 & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} \end{bmatrix}$那么 $A$ 的特征值是对角线上的元素 $a_{11}, a_{22}, \dots, a_{nn}$
    • 上三角行列式的计算$\displaystyle \begin{vmatrix} a_{11} - \lambda & a_{12} & \dots & a_{1n} \\ 0 & a_{22} - \lambda & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} - \lambda \end{vmatrix} = \prod_{i = 1}^n (a_{ii} - \lambda)$
  7. 如果 $\alpha$ $\beta$$A$ 关于特征值 $\lambda$ 的特征向量那么 $k_1\alpha + k_2\beta$ 也是 $A$ 关于特征值 $\lambda$ 的特征向量
  8. 如果 $\alpha$$\beta$$A$ 关于不同特征值的特征向量那么 $\alpha + \beta$ 不是 $A$ 的特征向量
  9. $f(x)$ 为矩阵 $A$ 的特征多项式则有 $f(A) = O$Hamilton-Cayley 定理

矩阵运算对特征值特征向量的影响

已知矩阵 $A$ 的特征值 $\lambda$ 和其对应的特征向量 $\mathbf{v}$$A\mathbf{v} = \lambda \mathbf{v}$那么可以推出

  1. $\det(\lambda I - A^T) = \det(\lambda I - A) = 0$$\lambda$$A^T$ 的特征值
  2. $\displaystyle A^{-1}\mathbf{v} = \frac{1}{\lambda} \mathbf{v}$$\displaystyle \frac{1}{\lambda}$$A^{-1}$ 的特征值$\mathbf{v}$$A^{-1}$ 的特征向量
  3. $A^k \mathbf{v} = \lambda^k \mathbf{v}$$\lambda^k$$A^k$ 的特征值$\mathbf{v}$$A^k$ 的特征向量
  4. $(A + kI) \mathbf{v} = (\lambda + k) \mathbf{v}$$\lambda + k$$A + kI$ 的特征值$\mathbf{v}$$A + kI$ 的特征向量
  5. 对于任意多项式 $g()$$g(A)\mathbf{v} = g(\lambda) \mathbf{v}$$g(\lambda)$$g(A)$ 的特征值$\mathbf{v}$$g(A)$ 的特征向量
  6. $\displaystyle A^\star \mathbf{v} = \det(A) \frac{1}{\lambda} \mathbf{v}$$\displaystyle \frac{\det(A)}{\lambda}$$A^\star$ 的特征值$\mathbf{v}$$A^\star$ 的特征向量

注意以上的结论 3, 5 是 $\Rightarrow$ 的关系不保证反过来的结论一定成立

如果追加条件 $P^{-1}AP = B$那么可以推出

  1. $B(P^{-1}\mathbf{v}) = \lambda (P^{-1}\mathbf{v})$$P^{-1}\mathbf{v}$$B$ 的特征向量$\lambda$$B$ 的特征值

如果追加条件 $A = P^{-1}BP$那么可以推出

  1. $A(P\mathbf{v}) = \lambda (P\mathbf{v})$$P\mathbf{v}$$A$ 的特征向量$\lambda$$A$ 的特征值

特征值与线性方程组的联系

例. 已知 $A\mathbf{x} = \mathbf{b}$ 的解是 $5\mathbf{b} + k_1 \mathbf{\alpha}_1 + k_2 \mathbf{\alpha}_2$$A$ 的特征值

解. 由解的结构$5\mathbf{b}$ 是非齐次方程 $A\mathbf{x} = \mathbf{b}$ 的解从而 $\displaystyle A\mathbf{b} = \frac{1}{5}\mathbf{b}$$\displaystyle \frac{1}{5}$$A$ 的特征值属于该特征值的特征向量是 $\mathbf{b}$又由于 $\mathbf{\alpha}_1$$\mathbf{\alpha}_2$$A\mathbf{x} = \mathbf{0}$ 的解从而 $A\mathbf{\alpha}_1 = 0 = 0 \mathbf{\alpha}_1$$A\mathbf{\alpha}_2 = 0 = 0 \mathbf{\alpha}_2$从而 $0$$A$ 的特征值属于该特征值的特征向量是 $\mathbf{\alpha}_1$$\mathbf{\alpha}_2$

矩阵的相似性

如果存在可逆矩阵 $P$ 使得 $P^{-1}AP = B$那么称 $A$$B$ 相似记作 $A \sim B$

相似是等价关系满足自反对称传递

矩阵运算对相似性的影响

$A = P^{-1}BP$ 则有

  1. $(A + kI) = P^{-1} (B + kI) P$$(A + kI) \sim (B + kI)$
  2. $A^k = P^{-1} B^k P$$A^k \sim B^k$
  3. $A^{-1} = P^{-1} B^{-1} P$$A^{-1} \sim B^{-1}$
  4. $A^T = ({P^T})^{-1} B^T P^T$$A^T \sim B^T$

矩阵的相似对角化

相似对角化$A = P^{-1}\Lambda P$其中 $\Lambda = \begin{bmatrix} \lambda_1 I_{k_1} & & & \\ & \lambda_2 I_{k_2} & & \\ & & \ddots & \\ & & & \lambda_s I_{k_s} \end{bmatrix}$$k_i$$\lambda_i$ 对应的特征值的重数$I_{k_i}$$k_i$ 阶单位矩阵

也有定义是从 $A \sim \Lambda$ 出发$P^{-1}AP = \Lambda$这样求出的 $P$ 与本文所述的互为逆矩阵

解方程组 $A\begin{bmatrix} \mathbf{\gamma}_{1} & \dots & \mathbf{\gamma}_{n} \end{bmatrix} = \begin{bmatrix} \mathbf{\gamma}_{1} & \dots & \mathbf{\gamma}_{n} \end{bmatrix} \begin{bmatrix} d_1 & & \\ & \ddots & \\ & & d_n\end{bmatrix}$ $A = P^{-1} D P$两边同右乘 $P^{-1}$可以得到

$P^{-1} = \begin{bmatrix} \mathbf{v}_{11} \mathbf{v}_{12} \dots \mathbf{v}_{1k_1} \mathbf{v}_{21} \mathbf{v}_{22} \dots \mathbf{v}_{2k_2} \dots \mathbf{v}_{s1} \mathbf{v}_{s2} \dots \mathbf{v}_{sk_s} \end{bmatrix}$$\mathbf{v}_{ij}$$\lambda_i$ 对应的特征值的线性无关的特征向量

这个过程还可以说明可以相似对角化的矩阵所有的特征向量线性无关因为 $P^{-1}$ 是可逆矩阵从而 $P^{-1}$ 的列向量线性无关

相似的一个意义将矩阵看作列向量组矩阵的特征值与选取的基向量无关可以通过变基求解矩阵的特征值

关于矩阵的相似对角化下列命题等价

  1. 矩阵 $A^{n \times n}$ 可对角化
  2. $A$$n$ 个线性无关的特征向量
  3. $A$ 的每个特征值的特征子空间的维数等于特征值的重数$\dim V_{\lambda_i} = k_i$
  4. $A$ 的特征子空间的维数之和等于 $n$$\dim V_{\lambda_1} + \dim V_{\lambda_2} + \dots + \dim V_{\lambda_s} = n$

判断是否可以相似对角化:

  1. 实对称矩阵一定可以相似对角化
  2. $n$ 个不同的特征值的矩阵一定可以相似对角化
  3. 以上两个条件都不满足计算重数大于 $1$ 的特征值的特征子空间的维数即计算 $\dim V_{\lambda_i} = n - r(A - \lambda_i I)$如果所有的 $\dim V_{\lambda_i} = k_i$则可以相似对角化先算特征值再算 $A - \lambda_i I$ 的秩

实对称矩阵

实对称矩阵一定可以相似对角化并且实对称矩阵属于不同特征值的特征向量相互正交

实对称矩阵的特征值都是实数

实对称矩阵可以使用正交矩阵相似对角化即存在正交矩阵 $Q$ 使得 $A = Q^{-1} \Lambda Q = Q^{T} \Lambda Q$其中 $\Lambda$ 是由矩阵 $A$ 的特征值组成的对角矩阵

为了表述方便这一段采取 $Q^{-1}AQ = Q^{T}AQ = \Lambda$ 的形式

求满足 $Q^{T}AQ = Q^{-1}AQ = \Lambda$ 的正交矩阵 $Q$

  1. 求特征值特征向量
  2. 改造特征向量使之正交化
    1. 如果特征值不同由于实对称矩阵属于不同特征值的特征向量相互正交只需要单位化这些特征向量
      • 需要单位化的原因$A^T A$ 的各元素是 $A$ 的列向量的内积而正交矩阵要求 $A^T A = I$从而要求 $A$ 的列向量正交并且模长为 $1$
    2. 如果特征值代数重数大于 $1$对应的特征向量不正交需要进行 Schmidt 正交化然后单位化

Schmidt 正交化

$\alpha_1, \alpha_2, \dots \alpha_n$ 线性无关通过下面的方法构造 $\text{span}(\alpha_1, \alpha_2, \dots \alpha_n)$ 的一组正交基 $\beta_1, \beta_2, \dots \beta_n$

  1. $\displaystyle \beta_1 = \alpha_1$
  2. $\displaystyle \beta_2 = \alpha_2 - \frac{\alpha_2 \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1$
  3. $\displaystyle \beta_3 = \alpha_3 - \frac{\alpha_3 \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1 - \frac{\alpha_3 \cdot \beta_2}{\beta_2 \cdot \beta_2} \beta_2$
  4. $\displaystyle \beta_n = \alpha_n - \frac{\alpha_n \cdot \beta_1}{\beta_1 \cdot \beta_1} \beta_1 - \frac{\alpha_n \cdot \beta_2}{\beta_2 \cdot \beta_2} \beta_2 - \dots - \frac{\alpha_n \cdot \beta_{n - 1}}{\beta_{n - 1} \cdot \beta_{n - 1}} \beta_{n - 1}$

Schmidt 正交化的几何直观$\displaystyle \frac{\alpha_2 \cdot \beta_1}{\beta_1 \cdot \beta_1}\beta_1$$\beta_1$$\alpha_2$ 的投影$\alpha_2$ 中减去这个投影得到的向量就是 $\beta_2$由三角形法则$\beta_2$$\beta_1$ 正交

判断矩阵的相似性

如果 $A \sim B$则有以下必要条件

  1. $\det(A) = \det(B)$
  2. $tr(A) = tr(B)$
  3. $A \sim \Lambda$$B \sim \Lambda$ $\Rightarrow$ $r(A) = r(B)$
  4. $\det(A - \lambda I) = \det(B - \lambda I)$ $\Rightarrow$ $\lambda_A = \lambda_B$

满足上面的条件但是 $A \sim B$ 不成立的情况其中一个矩阵无法相似对角化

判断矩阵的相似性的充分条件$A \sim \Lambda$$B \sim \Lambda$由相似的传递性$A \sim B$

判断两个不可相似对角化的矩阵是否相似

任意系数域为 $\mathbb{K}$ 的矩阵 $A$只要其特征值都在 $\mathbb{K}$那么一定存在一个与之相似的 Jordan 标准型矩阵

使用相似的传递性可以得到两个矩阵相似当且仅当它们的 Jordan 标准型相同

下面简要介绍 Jordan 标准型的计算方法

Jordan 标准型块$J_{\lambda, n} = \begin{bmatrix} \lambda & 1 & 0 & \dots & 0 \\ 0 & \lambda & 1 & \dots & 0 \\ 0 & 0 & \lambda & \dots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \dots & \lambda \end{bmatrix}_{n \times n}$

Jordan 标准型$J = \begin{bmatrix} J_{\lambda_i} & & & \\ & J_{\lambda_i} & & \\ & & \ddots & \\ & & & J_{\lambda_i} \end{bmatrix}$

  1. 求出矩阵 $A$ 的特征值 $\lambda_1, \lambda_2, \dots, \lambda_s$
  2. 对于每个特征值 $\lambda_i$求出其代数重数 $a_i$ 和几何重数 $g_i$
  3. $g_i = a_i = k$特征值 $\lambda_i$ 对应 $k$$J_{\lambda_i, 1} = \begin{bmatrix} \lambda_i \end{bmatrix}$
  4. $g_i < a_i$特征值 $\lambda_i$ 对应 $g_i$ 个 Jordan 标准型块并且所有 Jordan 标准型块的大小之和等于 $a_i$Jordan 标准型块的最大大小是使得 $\dim \ker(A - \lambda_i I)^k = \dim \ker(A - \lambda_i I)^{k + 1}$ 成立的最小正整数 $k$
    • 二重特征值当几何重数不等于代数重数时几何重数只可能是 $1$即 Jordan 标准型块一定是 $\begin{bmatrix} \lambda_i & 1 \\ 0 & \lambda_i \end{bmatrix}$
    • 三重特征值当几何重数不等于代数重数时几何重数只可能是 $1$ 或者 $2$分别对应 Jordan 标准型块 $\begin{bmatrix} J_{\lambda_i, 3} \end{bmatrix}$$\begin{bmatrix} J_{\lambda_i, 2} & 0 \\ 0 & J_{\lambda_i, 1} \end{bmatrix}$

由此可知两个不可相似对角化的矩阵相似的必要条件它们的特征值相同且对应特征值的几何重数也相同

二次型

为简便起见以下的讨论都是针对 $3$ 阶的实二次型

二次型与二次型矩阵

二次型是关于 $n$ 个变量 $x_1, x_2, \dots, x_n$ 的二次齐次多项式三阶的二次型形如

$$f(x_1, x_2, x_3) = Ax_1^2 + Bx_2^2 + Cx_3^2 + 2Dx_1x_2 + 2Ex_1x_3 + 2Fx_2x_3 $$

二次型可以写为矩阵乘法的形式

$$f(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \qquad A = \begin{bmatrix} A & D/2 & E/2 \\ D/2 & B & F/2 \\ E/2 & F/2 & C \end{bmatrix} $$

对称矩阵 $A$ 称为二次型 $f(\mathbf{x})$ 的二次型矩阵

二次型的秩

二次型 $\mathbf{x}^T A \mathbf{x}$ 的秩被定义为二次型矩阵 $A$ 的秩

坐标变换

$\begin{cases}x_1 = c_{11}y_1 + c_{12}y_2 + c_{13}y_3 \\ x_2 = c_{21}y_1 + c_{22}y_2 + c_{23}y_3 \\ x_3 = c_{31}y_1 + c_{32}y_2 + c_{33}y_3 \end{cases}$$x = Cy$其中 $C = \begin{bmatrix} c_{11} & c_{12} & c_{13} \\ c_{21} & c_{22} & c_{23} \\ c_{31} & c_{32} & c_{33} \end{bmatrix}$

如果有矩阵 $C$ 是可逆矩阵维护了一个一一对应的映射关系那么称 $x = Cy$ 为坐标变换

对于二次型 $\mathbf{x}^T A \mathbf{x}$如果有坐标变换 $x = Cy$那么有$\mathbf{x}^T A \mathbf{x} = \mathbf{y}^T C^T A C \mathbf{y}$$C^T A C = B$那么通过坐标变换得到的矩阵 $B$ 和原矩阵 $A$ 是合同的

合同矩阵

如果存在可逆矩阵 $Q$使得 $A = Q^T B Q$那么称 $A$$B$ 是合同的

注意此处并没有要求 $Q^T$$Q$ 的逆矩阵

$Q^T \neq Q^{-1}$$A$$B$ 是合同但不相似的它们的特征值符号相同而值不尽相同如果 $A$$B$ 是两个二次型矩阵此时不存在正交变换 $\mathbf{x} = C\mathbf{y}$ 使 $A$ 对应的二次型变换为 $B$ 对应的二次型这种情况下寻找满足 $A = Q^T B Q$ 的矩阵 $Q$ 需要通过配方法

合同关系是一种等价关系满足自反对称传递

合同矩阵的判定

通过标准型的正惯性指数 $p$ 和负惯性指数 $q$ 来判定两个矩阵是否合同充要条件

对于实对称矩阵它们一定与 $\Lambda = \begin{bmatrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_3 \end{bmatrix}$ 合同通过传递性可以通过它们的特征值的正负来判定是否合同

对于两个不可相似对角化的矩阵判定它们是否合同比较复杂可以使用下面的两个定理进行排除

定理. 如果矩阵 $A$$B$ 合同那么它们的秩相等

定理. 如果矩阵 $A$$B$ 合同并且其中一个矩阵 $A$ 是实对称矩阵那么另一个矩阵 $B$ 也是实对称矩阵

二次型的标准型

如果二次型中仅有平方项没有交叉项那么这个二次型是标准型的

定理. 任何二次型都存在某一个合适的坐标变换 $C$ 将其化为标准型

二次型有两种方法化为标准型配方法与正交变换法

配方法化二次型为标准型

例. 将二次型 $f = 1x_1^2 + 1x_2^2 + 4x_3^2 + 5x_1x_2 + 1x_1x_3 + 4x_2x_3$ 化为标准型

$$\begin{array}{rl} f &= x_1^2 + x_2^2 + 4x_3^2 + 5x_1x_2 + x_1x_3 + 4x_2x_3 \\ &= \left[x_1^2 + x_1(5x_2 + x_3)\right] + x_2^2 + 4x_3^2 + 4x_2x_3 \\ &= \displaystyle \left[x_1^2 + 2x_1\left(\frac{5x_2 + x_3}{2}\right) + \left(\frac{5x_2 + x_3}{2}\right)^2 \right] - \left(\frac{5x_2 + x_3}{2}\right)^2 + x_2^2 + 4x_3^2 + 4x_2x_3 \\ &= \displaystyle \left(x_1 + \frac{5}{2}x_2 + \frac{1}{2}x_3\right)^2 - \frac{21}{4} x_2^2 + \frac{15}{4} x_3^2 + \frac{3}{2}x_2x_3 \\ &= \displaystyle \left(x_1 + \frac{5}{2}x_2 + \frac{1}{2}x_3\right)^2 - \left(\frac{21}{4} x_2^2 - \frac{3}{2} x_2x_3\right) + \frac{15}{4} x_3^2 \\ &= \displaystyle \left(x_1 + \frac{5}{2}x_2 + \frac{1}{2}x_3\right)^2 - \left(\frac{\sqrt{21}}{2}x_2 - \frac{\sqrt{21}}{14} x_3\right)^2 + \frac{27}{7} x_3^2 \\ &= \displaystyle \frac{1}{4} \left(2x_1 + 5x_2 + x_3\right)^2 - \frac{3}{28} \left(7x_2 - x_3\right)^2 + \frac{27}{7} x_3^2 \end{array} $$

$\begin{cases} \displaystyle y_1 = 2x_1 + 5x_2 + x_3 \\ \displaystyle y_2 = 7x_2 - x_3 \\ \displaystyle y_3 = x_3 \end{cases}$解出 $\begin{cases}\displaystyle x_1 = y_1 - \frac{5}{7}y_2 - \frac{12}{7}y_3\\ \displaystyle x_2 = \frac{1}{7} y_2 + \frac{1}{7}y_3\\\displaystyle x_3 = y_3\end{cases}$即可得到坐标变换矩阵 $C$这种方法得到的矩阵 $C$ 必然是可逆的

$$C = \begin{bmatrix} 1 & -5/7 & -12/7 \\ 0 & 1/7 & 1/7 \\ 0 & 0 & 1 \end{bmatrix} $$

对于不含平方项的二次型通过先作一次坐标变换构造平方差公式凑出平方项然后使用与上面相同的方法

例. 将二次型 $f = 2x_1x_2 - 4x_1x_3$ 化为标准型

$\begin{cases} x_1 = y_1 + y_2 \\ x_2 = y_1 - y_2 \\ x_3 = y_3 \end{cases}$从而

$$\begin{array}{rl} f &= 2x_1x_2 - 4x_1x_3 \\ &= 2(y_1 + y_2)(y_1 - y_2) - 4(y_1 + y_2)y_3 \\ &= 2y_1^2 - 2y_2^2 - 4y_1y_3 - 4y_2y_3 \\ &= \dots \\ &= 2(y_1 - y_3)^2 - 2(y_2 + y_3)^2 \end{array} $$

$\begin{cases} z_1 = y_1 - y_3 \\ z_2 = y_2 + y_3 \\ z_3 = y_3 \end{cases}$解出 $\begin{cases} y_1 = z_1 + z_3 \\ y_2 = z_2 - z_3 \\ y_3 = z_3 \end{cases}$即可得到坐标变换矩阵 $C$$\mathbf{x} = C \mathbf{z}$

$$C = \begin{bmatrix} 1 & 1 & 0 \\ 1 & -1 & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & -1 \\ 0 & 0 & 1 \end{bmatrix} = \begin{bmatrix} 1 & 1 & 0 \\ 1 & -1 & 2 \\ 0 & 0 & 1\end{bmatrix} $$

正交变换法化二次型为标准型

实对称矩阵必可使用正交矩阵相似对角化即实对称矩阵 $A$存在正交矩阵 $U$使得 $U^{-1} A U = \Lambda$其中 $\Lambda = \begin{bmatrix} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_3 \end{bmatrix}$

作坐标变换 $\mathbf{x} = U \mathbf{y}$

$$\begin{array}{cl} \mathbf{x}^T A \mathbf{x} &= (U \mathbf{y})^T A (U \mathbf{y}) \\ &= \mathbf{y}^T U^T A U \mathbf{y} \\ &= \mathbf{y}^T \Lambda \mathbf{y} \\ &= \lambda_1 y_1^2 + \lambda_2 y_2^2 + \lambda_3 y_3^2 \end{array} $$

二次型的规范型

如果标准型中的系数只有 $1$$-1$那么这个二次型是规范型的

使用坐标的伸缩变换将标准型化为规范型如下面的例子所示

例.$f = 11 x_1^2 + 45 x_2^2 + 14 x^3_2$ 化为规范型

$\begin{cases} x_1 = \sqrt{11} y_1 \\ x_2 = \sqrt{45} y_2 \\ x_3 = \sqrt{14} y_3 \end{cases}$坐标变换矩阵 $C = \begin{bmatrix} \sqrt{11} & 0 & 0 \\ 0 & \sqrt{45} & 0 \\ 0 & 0 & \sqrt{14} \end{bmatrix}$即可得到规范型

惯性指数

正惯性指数 $p=$ 标准型/规范型中正平方项的个数

负惯性指数 $q=$ 标准型/规范型中负平方项的个数

定理. Sylvester 惯性定理任何实二次型可以通过可逆的线性变换 $\mathbf{x} = C \mathbf{y}$ 化为唯一的规范型并且经过任意可逆的线性变换 $\mathbf{x} = C \mathbf{y}$ 二次型的正负惯性指数不变且满足 $p + q = r(f)$

使用上面的定理时需要注意区分对矩阵作线性变换左右乘可逆矩阵初等变换和对二次型作线性变换$\mathbf{x} = C \mathbf{y}$对二次型矩阵而言实际上是作了两个线性变换 $A' = C^T A C$

并不是每一个线性变换 $A' = AP$ 都能拆成 $A' = C^T A C$ 的形式

正定矩阵

正定矩阵是针对二次型矩阵而言的因此首先必须要有 $A^T = A$

定义$\forall \mathbf{x} \neq \mathbf{0}$都有 $f = \mathbf{x}^T A \mathbf{x} > 0$那么称 $A$ 是正定矩阵

正定矩阵的判定

  1. 平方项系数都是正数必要条件
  2. 正惯性指数 $p = n$充要条件
  3. 与单位矩阵合同充要条件
  4. 对于实对称矩阵所有的特征值都是正数充要条件
  5. 顺序主子式都是正数充要条件
  6. 存在可逆的 $P$ 使得 $A = P^T P$充要条件

正定矩阵的应用

实对称矩阵正定当且仅当其所有的特征值都是正数可以通过证明某个矩阵正定来证明这个矩阵可逆

负定矩阵的判定

矩阵负定的一个充要条件为顺序主子式的符号与 $(-1)^k$ 一致一阶主子式为负二阶主子式为正三阶主子式为负以此类推

线性代数的几何意义

本节参考 3B1B 线性代数的本质Essence of linear algebra. 3Blue1Brown

目前本章的内容较为散乱已经被隐藏有待进一步整理

相关证明

占位符

本章留作在前文中提到的定理的补充证明

$r(A) = r(A^T) = r(A^T A) = r(A A^T)$

通过证明 $A\mathbf{x} = \mathbf{0}$$A^T A\mathbf{x} = \mathbf{0}$ 的解空间相同证明这个的结论

这个结论仅仅在实数域内成立这是因为证明时需要利用到向量内积非负

在复数域内我们可以举出反例$A = \begin{bmatrix} i & i \\ 1 & 1 \end{bmatrix}$$r(A) = 1$$A^T A = \begin{bmatrix} 0 & 0 \\ 0 & 0 \end{bmatrix}$$r(A^T A) = 0$

关于 $r(A^\star)$ 的取值

$r(A^\star) = \begin{cases} n & \text{if } r(A) = n \\ 1 & \text{if } r(A) = n - 1 \\ 0 & \text{if } r (A) \leq n - 2 \end{cases}$

证明.

(1) $AA^\star = \det(A) I$如果 $r(A) = n$$\det(A) \neq 0$$A^\star$ 可逆$r(A^\star) = n$

(2) 如果 $r(A) = n - 1$由于此时 $AA^\star = O$从而 $r(A) + r(A^\star) \leq n$$r(A^\star) \leq 1$又由 $r(A) = n - 1$ 知至少有一个 $A$$n - 1$ 阶子式非零从而 $A^\star$ 至少有一个元素非零从而 $r(A^\star) \geq 1$从而 $r(A^\star) = 1$

(3) 如果 $r(A) \leq n - 2$从而所有的 $n - 1$ 阶子式都为零从而 $A^\star = O$$r(A^\star) = 0$

如果 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 非零且两两正交那么 $\mathbf{\alpha_1} \dots \mathbf{\alpha_n}$ 一定线性无关

$\displaystyle \sum_{i = 1}^n x_i \mathbf{\alpha}_i = \mathbf{0}$接下来证明所有的 $x_i$ 均为零是唯一的可能

$\forall j \in \{1, 2, \dots, n\}$ 等式 $\displaystyle \sum_{i = 1}^n x_i \mathbf{\alpha}_i = \mathbf{0}$两边点乘 $\mathbf{\alpha}_j$$x_j \mathbf{\alpha}_j \cdot \mathbf{\alpha}_j = 0$由于 $\alpha_j$ 非零从而必定有 $x_j = 0$而不会有其他可能

矩阵的秩等于其列向量组的秩等于其行向量组的秩

首先证明两个引理

  1. 初等行变换不改变矩阵的行秩也不改变矩阵的列秩
  2. 初等列变换不改变矩阵的列秩也不改变矩阵的行秩

第二个引理可以通过对矩阵进行转置转为第一个引理的情况

将矩阵通过初等变换化为 $\begin{bmatrix} I_r & O \\ O & O \end{bmatrix}$ 形式由该该矩阵行秩列秩秩均为 $r$从而得证

以下是对引理 1 的简要证明

假设矩阵 $A$ 通过初等行变换变为 $B$

对于矩阵的行秩通过结构归纳法$B$ 的所有可能进行分析可以得到$B$ 的行向量组与 $A$ 的行向量组等价从而证明 $A$ 的行向量组的秩等于 $B$ 的行向量组的秩

对于矩阵的列秩可以证明 $A$ 的列向量的任意一个组合通过初等行变换保持其相关性或无关性从而证明 $A$ 的列向量组的秩等于 $B$ 的列向量组的秩

如果 $A^{m \times n}$$B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \dots & \mathbf{\beta}_s \end{bmatrix}$并且 $AB = O$那么 $\beta_1, \dots, \beta_s$$A\mathbf{x} = \mathbf{0}$ 的解

如果 $AB = O$那么 $A\begin{bmatrix} \mathbf{\beta}_1 & \mathbf{\beta}_2 & \dots & \mathbf{\beta}_s \end{bmatrix} = O$那么 $\begin{bmatrix} A \beta_1 & A \beta_2 & \dots & A \beta_n \end{bmatrix} = O$从而 $\beta_1, \beta_2, \dots, \beta_s$ 都是 $A\mathbf{x} = \mathbf{0}$ 的解

使用这个结论可以证明对于 $A^{m \times n}$$B^{n \times s}$如果 $AB = O$那么 $r(A) + r(B) \leq n$

特征值的几何重数小于等于代数重数$k$ 重特征值至多有 $k$ 个线性无关的特征向量

假设矩阵 $A^{n \times n}$ 的特征值 $\lambda_0$ 对应的特征向量有 $\xi_1, \xi_2, \dots, \xi_k$这些特征向量组成 $\ker(\lambda_0 I - A)$ 的一组基$\lambda_0$ 的几何重数为 $k$将其补齐为 $n$ 维空间的一组基$\xi_1, \xi_2, \dots, \xi_k, \alpha_{k+1}, \dots, \alpha_n$

$B = \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix}$

$$\begin{array}{rl} AB &= A \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix} \\ &= \begin{bmatrix} A_\ \xi_1 & A_\ \xi_2 & \dots & A_\ \xi_k & A\alpha_{k+1} & \dots & A\alpha_n \end{bmatrix} \\ &= \begin{bmatrix} \lambda_0 \xi_1 & \lambda_0\xi_2 & \dots & \lambda_0\xi_k & A\alpha_{k+1} & \dots & A\alpha_n \end{bmatrix} \\ &= \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix} \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix} \\ &= B \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix} \end{array} $$

显然 $B$ 可逆$A \sim \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}$从而 $A$$\begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}$ 具有相同的特征多项式与特征值由于

$$\begin{array}{rl} \det(\lambda I - \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}) &= \det(\begin{bmatrix} (\lambda - \lambda_0) I_{k} & \star'_{21} \\ O & \star'_{22} \end{bmatrix})\\ \\ &= \det \Big((\lambda - \lambda_0) I_{k}\Big) \det(\star'_{22}) \\ \\ &= (\lambda - \lambda_0)^k \det(\star'_{22}) \end{array} $$

从而特征值 $\lambda_0$ 的代数重数大于等于 $k$即特征值的几何重数小于等于代数重数

反之则推得$k$ 重特征值至多有 $k$ 个线性无关的特征向量$\blacksquare$

实对称矩阵属于不同特征值的特征向量相互正交

$A$ 是实对称矩阵$\lambda_1 \neq \lambda_2$$\mathbf{v}_1$$\mathbf{v}_2$ 分别是互异特征值 $\lambda_1$$\lambda_2$ 所对应的特征向量

$$A\mathbf{v}_1 = \lambda_1 \mathbf{v}_1, \qquad A\mathbf{v}_2 = \lambda_2 \mathbf{v}_2 $$

考察内积 $\mathbf{v}_1 \cdot \mathbf{v}_2$

$$\begin{array}{rl} \lambda_1 \mathbf{v}_1 \cdot \mathbf{v}_2 &= (\lambda_1 \mathbf{v}_1)^{T} \mathbf{v}_2 \\ &= (A\mathbf{v}_1)^{T} \mathbf{v}_2 \\ &= \mathbf{v}_1^{T} A^{T} \mathbf{v}_2 \\ &= \mathbf{v}_1^{T} A \mathbf{v}_2 \\ &= \lambda_2 \mathbf{v}_1 \cdot \mathbf{v}_2 \end{array} $$

由于 $\lambda_1 \neq \lambda_2$从而只有可能 $\mathbf{v}_1 \cdot \mathbf{v}_2 = 0$$\blacksquare$

矩阵 $A$ 正定当且仅当存在可逆矩阵 $P$ 使得 $A = P^{T}P$

(i) 必要性矩阵 $A$ 正定 $\Rightarrow$ 存在可逆的矩阵 $P$使得 $A = P^{T}P$

证明.

对矩阵 $A$ 作相似对角化由于矩阵 $A$ 是正定矩阵前提条件是矩阵 $A$ 是实对称的从而存在正交矩阵 $Q$ 使得 $A = Q \Lambda Q^T$

由于 $A$ 正定对角矩阵 $\Lambda$ 各个元素 $\lambda_i > 0$对其各个元素开方得到对角矩阵 $\Lambda'$从而 $A = Q \Lambda' \Lambda'^T Q^T$

显然矩阵 $P = \Lambda'^T Q^T$ 是可逆的从而 $A = P^{T}P$$\blacksquare$

(ii) 充分性存在可逆矩阵 $P$ 使得 $A = P^{T}P$ $\Rightarrow$ 矩阵 $A$ 正定

证明.

对任意的 $\mathbf{x} \neq \mathbf{0}$$\mathbf{x}^{T} A \mathbf{x} = \mathbf{x}^{T} P^{T} P \mathbf{x} = \lVert P \mathbf{x} \rVert^{2}$

而由于矩阵 $P$ 可逆方程 $P \mathbf{x} = 0$ 仅有零解

从而 $\lVert P \mathbf{x} \rVert^{2} > 0$从而矩阵 $A$ 正定$\blacksquare$