矩阵基本概念

1. 术语

概念/符号 含义
方阵 行数和列数相同的矩阵
长方矩阵 函数和列数可能不相同的矩阵
C\mathbb{C} 复数域
R\mathbb{R} 实数域
Sn\mathbb{S}^n nn 阶对称阵全集
diag(d1,,dn)\mathrm{diag}(d_1,\cdots,d_n) 表示对角元素为 d1,,dnd_1,\cdots,d_n 的对角矩阵
\odot Hadamard 积

A=(aij)Cm×n A = (a_{ij}) \in \mathbb{C}^{m \times n} aija_{ij} 是矩阵 AA 的元素,则:

  • AA^\top:表示 AA 的转置。
  • A\overline{A}:表示 AA 的共轭。
  • AA^*:表示 AA 的共轭转置,即 A=(A) A^* = (\overline{A})^\top

2. 矩阵

2.1 定义

ACn×n A \in \mathbb{C}^{n \times n}

  • AA=AA A^* A = A A^* ,则称 AA正规矩阵

  • A=A A = A^* ,则称 AAHermite 矩阵;若 A=A A = -A^* ,则称 AA反 Hermite 矩阵

  • AA=I A^* A = I ,则称 AA酋矩阵

2.2 性质

  • Hermite 矩阵,反 Hermite 矩阵,酋矩阵都是正规矩阵。
  • 实 Hermite 矩阵就是实对称矩阵,实酋矩阵就是实正交矩阵。

一个方阵的全体特征值的集合称为该方阵的

3. 行列式

3.1 定义

方阵的行列式记作 det(A)\mathrm{det}(A)A|A|,其定义如下:

det(A)=σSn(sgn(σ)i=1nai,σi)\mathrm{det}(A) = \sum_{\sigma \in S_n} \left( \mathrm{sgn}(\sigma) \prod_{i=1}^n a_{i,\sigma_i} \right)

其中,SnS_n 是元素 1n1 \sim n 的置换群,sgn\mathrm{sgn}sign 函数

置换 σ\sigma 的 sign 函数只返回两个值:+1+1 如果置换 σ\sigma 是偶的,1-1 如果置换 σ\sigma 是奇的。

逆序数为奇数的置换叫做奇置换,逆序数为偶数的置换叫做偶置换。

3.2 性质

3.2.1 基本性质

  • det(cA)=cndet(A)\mathrm{det}(cA) = c^n \mathrm{det}(A)

  • det(A)=det(A)\mathrm{det}(A^\top) = \mathrm{det}(A)

  • A,BA, B 均为方阵,则有:det(AB)=det(A)det(B)\mathrm{det}(AB) = \mathrm{det}(A) \mathrm{det}(B)

  • 若方阵 AA 可逆,则有:det(A1)=(det(A))1\mathrm{det}(A^{-1}) = (\mathrm{det}(A))^{-1}

  • det(A)=i=1n(1)i+jaijMij\mathrm{det}(A) = \sum_{i=1}^n (-1)^{i+j} a_{ij} M_{ij},其中 aja_j 是选择展开的列,MijM_{ij} 是对应的余子式,一般记 Cij=(1)i+jMijC_{ij} = (-1)^{i+j} M_{ij} 为代数余子式,则有:det(A)=i=1naijCij\mathrm{det}(A) = \sum_{i=1}^n a_{ij} C_{ij}

AA 的伴随矩阵为 adj(A)\mathrm{adj}(A),其定义为:(adj(A))ij=(1)i+jMji(\mathrm{adj}(A))_{ij} = (-1)^{i+j} M_{ji}

  • 若方阵 AA 可逆,则有:A1=1det(A)adj(A)A^{-1} = \frac{1}{\mathrm{det}(A)} \mathrm{adj}(A)

  • det(A)=i=1nλi\mathrm{det}(A) = \prod_{i=1}^n \lambda_i,其中所有的 λi\lambda_i 为方阵 AA 的特征值

3.2.2 舒尔补

若方阵 XSnX \in \mathbb{S}^n,将其使用分块矩阵表达如下:

X=[ABBC]X = \left[ \begin{matrix} A & B \\ B^\top & C \end{matrix} \right]

其中,ASkA \in \mathbb{S}^k。若 det(A)0\mathrm{det}(A) \neq 0,则称矩阵

S=CBA1BS = C - B^\top A^{-1} B

AAXX 中的舒尔补。舒尔补具有如下性质:

  • det(X)=det(A)det(S)\mathrm{det}(X) = \mathrm{det}(A) \mathrm{det}(S)
  • XX 正定当且仅当 AA 正定且 SS 正定
  • AA 正定,则 XX 半正定当且仅当 SS 半正定。

3.2.3 上下界

  • tr(IA1)logdet(A)tr(AI)\mathrm{tr}(I - A^{-1}) \leq \log{\mathrm{det}(A)} \leq \mathrm{tr}(A - I)
  • ntr(A1)det(A)1n1ntr(A)1ntr(A2)\frac{n}{\mathrm{tr}(A^{-1})} \leq \mathrm{det}(A)^{\frac{1}{n}} \leq \frac{1}{n} \mathrm{tr}(A) \leq \sqrt{\frac{1}{n} \mathrm{tr}(A^2)}

4. 迹

4.1 定义

方阵 AA记作 tr(A)\operatorname{tr}(A),其定义如下:

tr(A)=iAii\operatorname{tr}(A) = \sum_{i} A_{ii}

4.2 性质

4.2.1 基本性质

  • tr(cA)=ctr(A)\operatorname{tr}(cA) = c\operatorname{tr}(A)
  • tr(A+B)=tr(A)+tr(B)\operatorname{tr}(A + B) = \operatorname{tr}(A) + \operatorname{tr}(B)
  • tr(A)=tr(A)\operatorname{tr}(A) = \operatorname{tr}(A^\top)

4.2.2 乘积的迹

A,BRm×nA, B \in \mathbb{R}^{m \times n},则有:

tr(AB)=tr(AB)=tr(BA)=tr(BA)=imjnaijbij\mathrm{tr}(A^\top B) = \mathrm{tr}(AB^\top) = \mathrm{tr}(B^\top A) = \mathrm{tr}(BA^\top) = \sum_{i}^m \sum_{j}^n a_{ij} b_{ij}

m=nm = n,即 AABB 均为方阵,则进一步有:

tr(AB)=tr(AB)=tr(BA)=tr(BA)=imjnaijbij=ij(AB)ij\mathrm{tr}(A^\top B) = \mathrm{tr}(AB^\top) = \mathrm{tr}(B^\top A) = \mathrm{tr}(BA^\top) = \sum_{i}^m \sum_{j}^n a_{ij} b_{ij} = \sum_{ij} (A \odot B)_{ij}

m=1m = 1n=1n = 1 类似),则 AABB 都变成向量,不妨记 a=A\boldsymbol{a} = Ab=B\boldsymbol{b} = B,则有:

tr(ba)=tr(ba)=ba\mathrm{tr}(\boldsymbol{b}^\top \boldsymbol{a}) = \mathrm{tr}(\boldsymbol{b}\boldsymbol{a}^\top) = \boldsymbol{b} \boldsymbol{a}^\top

5. 矩阵指数

矩阵指数是方阵的一种矩阵函数,与指数函数类似。设 XXn×nn \times n 的实数/复数矩阵,XX 的指数用 eXe^X 或者 exp(X)\exp(X) 来表示,其定义如下:

eX=k=01k!Xke^X = \sum_{k=0}^\infty \frac{1}{k!} X^k

附录