跳转至

本文是原先 线性代数 中的一部分,将这部分内容单独提取出来,以减少原文的篇幅。

线性代数的相关证明

矩阵的秩

矩阵转置不改变秩、矩阵乘以自身的转置不改变秩

即:\(r(A) = r(A^T) = r(A^T A) = r(A A^T)\)

通过证明 \(A\mathbf{x} = \mathbf{0}\)\(A^T A\mathbf{x} = \mathbf{0}\) 的解空间相同,证明这个的结论。

这个结论仅仅在实数域内成立,这是因为证明时需要利用到向量内积非负。

在复数域内,我们可以举出反例:\(A = \begin{bmatrix} i & i \\ 1 & 1 \end{bmatrix}\)\(r(A) = 1\),而 \(A^T A = \begin{bmatrix} 0 & 0 \\ 0 & 0 \end{bmatrix}\)\(r(A^T A) = 0\)

伴随矩阵的秩取值

有结论:\(r(A^\star) = \begin{cases} n & \text{if } r(A) = n \\ 1 & \text{if } r(A) = n - 1 \\ 0 & \text{if } r (A) \leq n - 2 \end{cases}\)

证明.

(1) \(AA^\star = \det(A) I\),如果 \(r(A) = n\),则 \(\det(A) \neq 0\)\(A^\star\) 可逆,\(r(A^\star) = n\)

(2) 如果 \(r(A) = n - 1\),由于此时 \(AA^\star = O\),从而 \(r(A) + r(A^\star) \leq n\)\(r(A^\star) \leq 1\);又由 \(r(A) = n - 1\) 知至少有一个 \(A\)\(n - 1\) 阶子式非零,从而 \(A^\star\) 至少有一个元素非零,从而 \(r(A^\star) \geq 1\),从而 \(r(A^\star) = 1\)

(3) 如果 \(r(A) \leq n - 2\),从而所有的 \(n - 1\) 阶子式都为零,从而 \(A^\star = O\)\(r(A^\star) = 0\)

矩阵的秩、行秩、列秩相等

即:矩阵的秩等于其列向量组的秩等于其行向量组的秩

证明.

首先证明两个引理:

  1. 初等行变换不改变矩阵的行秩、也不改变矩阵的列秩;
  2. 初等列变换不改变矩阵的列秩、也不改变矩阵的行秩。

第二个引理可以通过对矩阵进行转置,转为第一个引理的情况。

将矩阵通过初等变换,化为 \(\begin{bmatrix} I_r & O \\ O & O \end{bmatrix}\) 形式,由该该矩阵行秩、列秩、秩均为 \(r\),从而得证。

以下是对引理 1 的简要证明:

假设矩阵 \(A\) 通过初等行变换变为 \(B\)

对于矩阵的行秩,通过结构归纳法,对 \(B\) 的所有可能进行分析,可以得到:\(B\) 的行向量组与 \(A\) 的行向量组等价,从而证明 \(A\) 的行向量组的秩等于 \(B\) 的行向量组的秩。

对于矩阵的列秩,可以证明 \(A\) 的列向量的任意一个组合,通过初等行变换,保持其相关性或无关性,从而证明 \(A\) 的列向量组的秩等于 \(B\) 的列向量组的秩。

线性相关与线性无关

正交的非零向量线性无关

即:如果 \(\mathbf{\alpha_1} \dots \mathbf{\alpha_n}\) 非零且两两正交,那么 \(\mathbf{\alpha_1} \dots \mathbf{\alpha_n}\) 一定线性无关

证明.

\(\displaystyle \sum_{i = 1}^n x_i \mathbf{\alpha}_i = \mathbf{0}\),接下来证明:所有的 \(x_i\) 均为零是唯一的可能。

\(\forall j \in \{1, 2, \dots, n\}\) ,等式 \(\displaystyle \sum_{i = 1}^n x_i \mathbf{\alpha}_i = \mathbf{0}\)两边点乘 \(\mathbf{\alpha}_j\),有 \(x_j \mathbf{\alpha}_j \cdot \mathbf{\alpha}_j = 0\),由于 \(\alpha_j\) 非零,从而必定有 \(x_j = 0\),而不会有其他可能。

线性方程组

矩阵乘法与线性方程组的关系

如果 \(A^{m \times n}\)\(B^{n \times s} = \begin{bmatrix} \mathbf{\beta}_1 & \dots & \mathbf{\beta}_s \end{bmatrix}\),并且 \(AB = O\),那么 \(\beta_1, \dots, \beta_s\)\(A\mathbf{x} = \mathbf{0}\) 的解

证明.

如果 \(AB = O\),那么 \(A\begin{bmatrix} \mathbf{\beta}_1 & \mathbf{\beta}_2 & \dots & \mathbf{\beta}_s \end{bmatrix} = O\),那么 \(\begin{bmatrix} A \beta_1 & A \beta_2 & \dots & A \beta_n \end{bmatrix} = O\),从而 \(\beta_1, \beta_2, \dots, \beta_s\) 都是 \(A\mathbf{x} = \mathbf{0}\) 的解。

使用这个结论,可以证明:对于 \(A^{m \times n}\)\(B^{n \times s}\),如果 \(AB = O\),那么 \(r(A) + r(B) \leq n\)

矩阵的特征值与特征向量

特征值的几何重数小于等于代数重数

证明.

假设矩阵 \(A^{n \times n}\) 的特征值 \(\lambda_0\) 对应的特征向量有 \(\xi_1, \xi_2, \dots, \xi_k\),这些特征向量组成 \(\ker(\lambda_0 I - A)\) 的一组基,\(\lambda_0\) 的几何重数为 \(k\)。将其补齐为 \(n\) 维空间的一组基,即 \(\xi_1, \xi_2, \dots, \xi_k, \alpha_{k+1}, \dots, \alpha_n\)

\(B = \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix}\),则

\[ \begin{array}{rl} AB &= A \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix} \\ &= \begin{bmatrix} A_\ \xi_1 & A_\ \xi_2 & \dots & A_\ \xi_k & A\alpha_{k+1} & \dots & A\alpha_n \end{bmatrix} \\ &= \begin{bmatrix} \lambda_0 \xi_1 & \lambda_0\xi_2 & \dots & \lambda_0\xi_k & A\alpha_{k+1} & \dots & A\alpha_n \end{bmatrix} \\ &= \begin{bmatrix} \xi_1 & \xi_2 & \dots & \xi_k & \alpha_{k+1} & \dots & \alpha_n \end{bmatrix} \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix} \\ &= B \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix} \end{array} \]

显然 \(B\) 可逆,有 \(A \sim \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}\)。从而 \(A\)\(\begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}\) 具有相同的特征多项式与特征值。由于

\[ \begin{array}{rl} \det(\lambda I - \begin{bmatrix} \lambda_0 I_{k} & \star_{21} \\ O & \star_{22} \end{bmatrix}) &= \det(\begin{bmatrix} (\lambda - \lambda_0) I_{k} & \star'_{21} \\ O & \star'_{22} \end{bmatrix})\\ \\ &= \det \Big((\lambda - \lambda_0) I_{k}\Big) \det(\star'_{22}) \\ \\ &= (\lambda - \lambda_0)^k \det(\star'_{22}) \end{array} \]

从而特征值 \(\lambda_0\) 的代数重数大于等于 \(k\),即特征值的几何重数小于等于代数重数。

反之,则推得\(k\) 重特征值至多有 \(k\) 个线性无关的特征向量。\(\blacksquare\)

实对称矩阵属于不同特征值的特征向量相互正交

证明.

\(A\) 是实对称矩阵,\(\lambda_1 \neq \lambda_2\)\(\mathbf{v}_1\)\(\mathbf{v}_2\) 分别是互异特征值 \(\lambda_1\)\(\lambda_2\) 所对应的特征向量。有:

\[ A\mathbf{v}_1 = \lambda_1 \mathbf{v}_1, \qquad A\mathbf{v}_2 = \lambda_2 \mathbf{v}_2 \]

考察内积 \(\mathbf{v}_1 \cdot \mathbf{v}_2\),有:

\[ \begin{array}{rl} \lambda_1 \mathbf{v}_1 \cdot \mathbf{v}_2 &= (\lambda_1 \mathbf{v}_1)^{T} \mathbf{v}_2 \\ &= (A\mathbf{v}_1)^{T} \mathbf{v}_2 \\ &= \mathbf{v}_1^{T} A^{T} \mathbf{v}_2 \\ &= \mathbf{v}_1^{T} A \mathbf{v}_2 \\ &= \lambda_2 \mathbf{v}_1 \cdot \mathbf{v}_2 \end{array} \]

由于 \(\lambda_1 \neq \lambda_2\),从而只有可能 \(\mathbf{v}_1 \cdot \mathbf{v}_2 = 0\)\(\blacksquare\)

二次型

正定的矩阵一定能分解为一个可逆矩阵的转置与自身的乘积

即:矩阵 \(A\) 正定,当且仅当存在可逆矩阵 \(P\) 使得 \(A = P^{T}P\)

证明.

(i) 必要性:矩阵 \(A\) 正定 \(\Rightarrow\) 存在可逆的矩阵 \(P\),使得 \(A = P^{T}P\)

对矩阵 \(A\) 作相似对角化,由于矩阵 \(A\) 是正定矩阵,前提条件是矩阵 \(A\) 是实对称的,从而存在正交矩阵 \(Q\) 使得 \(A = Q \Lambda Q^T\)

由于 \(A\) 正定,对角矩阵 \(\Lambda\) 各个元素 \(\lambda_i > 0\),对其各个元素开方得到对角矩阵 \(\Lambda'\),从而 \(A = Q \Lambda' \Lambda'^T Q^T\)

显然,矩阵 \(P = \Lambda'^T Q^T\) 是可逆的,从而 \(A = P^{T}P\)\(\blacksquare\)

(ii) 充分性:存在可逆矩阵 \(P\) 使得 \(A = P^{T}P\) \(\Rightarrow\) 矩阵 \(A\) 正定。

对任意的 \(\mathbf{x} \neq \mathbf{0}\),有 \(\mathbf{x}^{T} A \mathbf{x} = \mathbf{x}^{T} P^{T} P \mathbf{x} = \lVert P \mathbf{x} \rVert^{2}\)

而由于矩阵 \(P\) 可逆,方程 \(P \mathbf{x} = 0\) 仅有零解。

从而 \(\lVert P \mathbf{x} \rVert^{2} > 0\),从而矩阵 \(A\) 正定。\(\blacksquare\)

能够分解为一个可逆矩阵的转置与自身的乘积的矩阵是正定矩阵

即:对于矩阵 \(A^TA\),如果 \(A\) 是满秩矩阵,那么 \(A^TA\) 是正定矩阵。

证明.

\(A^T A\) 是实对称矩阵,考虑二次型 \(f = \mathbf{x}^T A^T A \mathbf{x}\)

\(f = (A \mathbf{x})^T (A \mathbf{x}) = \lVert A \mathbf{x} \rVert^2\)

\(A\) 满秩,方程组 \(A \mathbf{x} = \mathbf{0}\) 仅有零解,从而 \(\lVert A \mathbf{x} \rVert^2 > 0\),从而 \(A^T A\) 是正定矩阵。\(\blacksquare\)

实数反对称矩阵的二次型值为零

即:如果 \(A\) 是实数反对称矩阵,那么 \(\mathbf{x}^T A \mathbf{x} = 0\)

证明.

\[ \begin{array}{rl} \mathbf{x}^T A \mathbf{x} &= \displaystyle \frac{1}{2}\left( \mathbf{x}^T A \mathbf{x} + \mathbf{x}^T A \mathbf{x}\right) \\ &= \displaystyle \frac{1}{2}\left[ \mathbf{x}^T A \mathbf{x} + (\mathbf{x}^T A \mathbf{x})^T\right] \\ &= \displaystyle \frac{1}{2}\left[ \mathbf{x}^T A \mathbf{x} + \mathbf{x}^T A^T \mathbf{x}\right] \\ &= \displaystyle \frac{1}{2}\left[ \mathbf{x}^T A \mathbf{x} - \mathbf{x}^T A \mathbf{x}\right] \\ &= 0 & \blacksquare \end{array} \]