二次型及其应用
1 定义
任意一个方阵\(A\)的二次型\(\mathbf{x}^{T}A \mathbf{x}\) 是一个标量。举 个例子,假设
\begin{equation} \label{eq:1} A = \begin{bmatrix} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{bmatrix} \end{equation}为例。
其二次型为:
\begin{eqnarray} \label{eq:2} \mathbf{x}^{T} A \mathbf{x}&=& [x_{1},x_{2},x_{3}] \begin{bmatrix} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{bmatrix} \begin{bmatrix} x_{1} & x_{2} & x_{3} \end{bmatrix} \\ &=& x_1^2 + 7x_2^2 + 3 x_3^2 + 3 x_1x_2 + x_1x_3 + 11 x_2x_3 \end{eqnarray}上式的计算可以简单的做出来,可以观察到,对于\(A\)上对角线的元素对应的 分别是\(x_{1}^{2},x_{2}^{2},x_{3}^{2}\)的系数, \(A_{ij} + A_{ji}\)对应 的是\(x_{i}x_{j}\)的系数。另外可以看到上式的计算结果中最高的幂次是 \(2\),称这是变元\(x\)的二次型函数,称\(\mathbf{x}^{T}A \mathbf{x}\)为 矩阵\(A\)的二次型。
推而广之,若\(\mathbf{x} = [x_{1},x_{2},\ldots,x_{n}]^{T}\),且 \(n\times n\)矩阵\(A\)的元素\(a_{ij}\),则二次型:
\begin{equation} \label{eq:3} \mathbf{x}^{T}A \mathbf{x} = \sum_{i=1}^{n}\sum_{j=1}^{n} x_{i}x_{j}a_{ij} \end{equation}进一步计算:
\begin{eqnarray} \label{eq:5} \sum_{i=1}^{n}\sum_{j=1}^{n} x_{i}x_{j}a_{ij} &=& \sum_{i=1}^{n}a_{ii}x_{i}^{2} + \sum_{i=1,i\neq j}^{n}\sum_{j=1}^{n} a_{ij}x_{i}x_{j} \\ &=& \sum_{i=1}^{n}a_{ii}x_{i}^{2} + \sum_{i=1}^{n-1}\sum_{j=i+1}^{n} (a_{ij} + a_{ji}) x_{i}x_{j} \end{eqnarray}根据式 (\ref{eq:5}) 我们发现,同一个二次型函数可以对应不同的矩阵,比如:
\begin{equation} \label{eq:6} B= \begin{bmatrix} 1 & 2 & 1 \\ 1 & 7 & 3 \\ 1 & 8 & 3 \end{bmatrix} \end{equation}和\(A\)具有相同的二次型函数。即,对于一个二次型函数:
\begin{equation} \label{eq:7} f(x_{1},x_{2},\ldots,x_{n}) = \sum_{i}^{n}\alpha_{ii}x_{i}^{2} + \sum_{i=1,i\neq j}^{n} \sum_{j=1}^{n} \alpha_{ij} x_{i}x_{j} \end{equation}存在许多矩阵\(A\),它们的二次型\(\mathbf{x}^{T}A\mathbf{x}\)相同。但是 只有一个对称矩阵\(A\)满足\(\mathbf{x}^{T}A\mathbf{x} = f(x_{1},\ldots,x_{n})\),其元素\(a_{ii} = \alpha_{ii}, a_{ij} = a_{ji} = \frac{1}{2}(\alpha_{ij} + \alpha_{ji}) \) 其中\(i = 1,\ldots, n; j = 1,\ldots, n, i\neq j\),因此讨论二次型的时候通常假定矩阵\(A\)为对称 矩阵或者Hermitian矩阵。Hermitian矩阵是复对称矩阵,所以实对称矩阵是 Hermitian矩阵的特殊形式。
2 正定矩阵
如果将大于零的二次型\(\mathbf{x}^{T}A\mathbf{x}\)称为正定的二次型,则 与之对应的Hermitian矩阵称为正定矩阵。类似的还可以定义Hermitian矩阵的半 正定性,负定性和半负定性。
条件 | 定义 |
---|---|
\(\mathbf{x}^{T}A\mathbf{x} > 0, \forall \mathbf{x} \neq 0\) | 正定矩阵 |
\(\mathbf{x}^{T}A\mathbf{x} \geq 0, \forall \mathbf{x} \neq 0\) | 半正定矩阵 |
\(\mathbf{x}^{T}A\mathbf{x} < 0, \forall \mathbf{x} \neq 0\) | 负定矩阵 |
\(\mathbf{x}^{T}A\mathbf{x} \leq 0, \forall \mathbf{x} \neq 0\) | 半负定矩阵 |
若\(\mathbf{x}^{T}A\mathbf{x}\) 的取值即可能为正,也可能为负,则对应的 Hermitian矩阵为不定矩阵。
3 Hermitian矩阵的正定性
我们之前提到过,对于一个二次型,有多个矩阵\(A\)与之对应。但是,只有一 个矩阵是对称的。我们这么做不仅仅是因为这个Hermitian矩阵的唯一性,还因 为这个矩阵具有非常多的特性。另外,我们在实际的工程应用中也有很多矩阵是 Hermitian矩阵,所以深入的研究Hermitian矩阵很有必要。
定义Hermitian二次型为:
\begin{equation} \label{eq:8} H(\mathbf{x},\mathbf{x}) = \langle \mathbf{x}, A\mathbf{x} \rangle = \mathbf{x}^{T} A \mathbf{x} = \sum_{i=1}^{n}\sum_{j=1}^{n} r_{ij}x_{i}^{T}x_{j} \end{equation}称\(A\)为二次型的核或者矩阵。核为单位阵时,二次型退化为向量 \(\mathbf{x}\)和它自己的内积\(\mathbf{x}^{T}\mathbf{x}\)。因此,二次型 可以视为内积的推广。
考虑酉变换之后的二次型。定义线性变换\(\mathbf{x} = R \mathbf{y}\),其 中\(R\)是酉矩阵。此时,可以将原来的二次型改写为:
\begin{equation} \label{eq:9} H(\mathbf{x},\mathbf{x}) = \mathbf{y}^{T}R^{T} AR\mathbf{y} = \mathbf{y}^{T}P\mathbf{y} \end{equation}式中,\(P = R^{T} A R = R^{-1} A R \) 。特别地,若选择酉矩阵\(R\)使得 \(P\)为对角矩阵,则称:
\begin{equation} \label{eq:10} \mathbf{x}^{T}A \mathbf{x} = \mathbf{y}^{T} (R^{T} A R ) \mathbf{y} = y^{T} \mathrm{diag}(\lambda_{1},\ldots,\lambda_{n}) \mathbf{y} \end{equation}为标准二次型。因为这样的二次型,只有核对角线上的元素非零。因为\(R\)是 酉矩阵,则有\(R^{-1} = R^{T}\)。令\(A = U \Sigma U^{T}\)是\(A\)的特征 值分解,并将它带入二次型\(H(x,x)\),得到:
\begin{equation} \label{eq:11} H(x,x) = \mathbf{x}^{T}A\mathbf{x} = \mathbf{x}^{T} U\Sigma U ^{T} \mathbf{x} \end{equation}令\(R = U\), 则\(\mathbf{x} = R\mathbf{y} = U \mathbf{y}\), \(\mathbf{y} = U^{T} x \), 所以式 (\ref{eq:11}) 变为:
\begin{equation} \label{eq:12} H(x,x) = \mathbf{y}^{T} \Sigma \mathbf{y} = \langle \mathbf{x}, A x \rangle = \sum_{i=1}^{n} \lambda_{i} |y_{i}|^{2} \end{equation}经过酉变换\(\mathbf{x} = R\mathbf{y}\)之后,二次型 \(\mathbf{x}^{T}A\mathbf{x}\)的值等于二次型核矩阵\(A\)的特征值与 \(y_{i}\)的模值平方的乘积之和。
通过观察式 (\ref{eq:12}) ,我们可以很容易的判定Hermitian 的正定性。一 个\(n\times n\)的Hermitian矩阵是正定的,当且仅当其满足如下条件:
- 二次型\(\mathbf{x}^{T}A\mathbf{x} > 0, \forall \mathbf{x} \neq 0 \)
- 矩阵\(A\)的所有特征值都大于零。
- 所有主子矩阵\(A_{k}\)都具有正的行列式,\(A_{k} = A(1:k,1:k)\)由矩阵 \(A\)的第\(1\sim k\)行和第\(1\sim k\)列组成。
- 存在一个非奇异的\(n\times n\)矩阵\(R\)使得 \(A = R^{T}R\)
- 存在一个非奇异的\(n\times n\)矩阵\(P\)使得\(P^{T}AP\)是正定的。
4 正定矩阵的意义