本证向量与上三角矩阵
1 多项式作用于算子
算子理论比线性映射理论更加丰富多彩,主要原因是算子能自乘为幂。我们从算子的幂以及多项式作用于算子这一关键概念的定义开始。
若T∈L(V),则TT是有意义的,并且也包含于L(V)。通常用T2代替TT,更一般的,我们有:
设T∈L(V),m是正整数。
- 定义Tm为Tm=T⋯T⏟m
- 定义T0为V上的恒等算子I
- 若T是可逆的,且逆为T−1,则定义T−m为Tm=(T−1)m
设T∈L(V),p∈P(F),对z∈F,有p(z)=a0+a1z+a2z2+…amzm,则p(T)是定义为p(T)=a0I+a1T+…+amTm的算子。
设D∈L(P(R))是由Dq=q′定义的微分算子,p是多项式p(x)=7−3x+5x2,则p(D)=7I−3D+5D2。于是对每个q∈P(R)有(p(D))q=7q−3q′+5q″
若p,q∈P(F),则pq∈P(F)的定义为:∀z∈F,(pq)(z)=p(z)q(z)
2 本征值的存在性
有限维非零复向量空间上的每个算子都有本征值
设V是n维复向量空间,n>0, 并设T∈L(V),取v∈V且v≠0,因为V是n维的,所以n+1个向量v,Tv,T2v,…,Tnv线性相关。于是有并且为零的复数a0,…,an使得: 0=a0v+a1Tv+…+anTnv
注意a1,…,an不全为零,否则a0也必须为0.
以这些aj做一个多项式,利用代数学基本定理可以将此多项式分解为:
a0+a1z+…+anzn=c(z−λ1)…(z−λm)其中c是非零复数,每个λj都属于C,且对于式 (1) 所有的z∈C均成立。则:
0=a0v+a1Tv+…anTnv=(a0I+a1T+…+anTn)v=c(T−λ1)…(T−λm)v于是至少有一个j使得T−λjI不是单的,即有v≠0使得(T−λjI)v=0,即有Tv=λv
3 上三角矩阵
设T∈L(V),并设v1,…,vn是V的基。T关于该基的矩阵定义为n×n的矩阵:
M(T)=[A1,1…A1,n⋮⋱⋮An,1…An,n]其元素Aj,k定义为:
T(vk)=A1,kv1+…An,kvn我们发现:
- 线性算子的矩阵是正方形方阵,越来越有意思了。
- Tvk写成v1,…,vn的线性组合时使用的那些系数构成了矩阵M(T)的第k列。
若T是Fn的算子,且没有指定基,则假定为标准基。此时可以认为M(T)的第j列维T作用到第j个标准基上得到的向量。
定义T∈L(F)3为T(x,y,z)=(2x+y,5y+3z,8z),则:
M(T)=[210053008]对这个问题,我们有对于标准基,显然有:
T(1,0,0)=(2,0,0)T(0,1,0)=(1,5,0)T(0,0,1)=(0,3,8)线性代数的一个中心目标就是要证明,对于给定的算子T∈L(V),必定存在V的一个基,使得T关于该基有一个相当简单的矩阵。更直白的说法是,我们要选择V的基使得M(T)有很多的0,这样我们把线性映射同构于矩阵,做矩阵运算时要简单得多。
若V是有限维的复向量空间,那么可以肯定的是V有一个基使得T关于这个基的矩阵的第一列除第一个元素之外全是0,也就是说,V有一个基使得T关于这个基的矩阵形状是:
[λ0∗⋮0]已知有限维复向量空间上的每个算子都有本征值,所以对于T一定有一个本征值λ和对应的本证向量v,把v扩张成V的一个基,则T关于这个基的矩阵就具有上面的形式。
上三角矩阵的条件:
设T∈L(V),且v1,…,vn是V的基,则一下条件等价:
- T关于v1,…,vn的矩阵是上三角的。
- 对每个j=1,…,n都有Tvj∈span(v1,…,vj)
- 对每个j=1,…,n,有span(v1,…,vj)在T下不变。
这几个命题的证明比较简单,但是证明过程需要对算子的矩阵有比较熟稔的记忆。假设T∈L(V),T是V上的线性算子,则T关于该基的矩阵定义为n×n的矩阵:
A=[A1,1…A1,n⋮⋱⋮An,1…An,n]其中Aj,k定义为:
Tvk=A1,kv1+…+An,kvk注意V上算子关于基的矩阵是一个方阵,并且T和V上的基共同决定了A。比如V上的恒等映射就是一个单位矩阵。满足:Tvk=vk 显然恒等映射T的特征值都是1,特征向量有n个,每个都是V的基。从恒等映射我们知道一个特征值可以对应多个特征向量。好了,现在让我们回到三角矩阵的条件。
首先从第1条到第二条。因为T关于v1,…,vn的矩阵是上三角的。所以
Tvj=A1,jv1+…Aj,jvj+0vj+1+…+0vn显然Tvj∈span(v1,…,vj)
从第二条到第三条。 我们知道:
Tv1∈span(v1)⊂span(v1,…,vj)Tv2∈span(v1,v2)⊂span(v1,…,vj)⋮Tvj∈span(v1,…,vj)假设v∈span(v1,…,vj),则有 Tv∈span(v1,…,vj) 也就是说span(v1,…,vj)在T下不变。
第三条说明什么?说明一个上三角阵以及对应的基具有一定的嵌套性质。比如我单独的把前j列拉出来,则这j列对应的基中的元素张成了一个T下的不变子空间,自成体系。
一个重要的定理:
设V是有限维复向量空间,T∈L(V),则T关于V的某个基有上三角阵。
我们使用数学归纳法。若dimV=1,则结论是显然的,一定有Tv=λv。
假设dimV>1,并对所有维数比V小的复向量空间结论都成立。设λ是V的本征值,设:
U=range(T−λI)我们知道T−λI不是满的,因为有v∈null(T−λI)。根据线性映射基本定理dim(T−λI)+range(T−λI)=dimV 所以dimU<dimV.
接下来我们证明:U在T下不变。对于u∈U,有:
Tu=(T−λI)u+λu显然(T−λI)u∈U, λu∈U ,所以Tu∈U,因此T在U下不变。
因此T|U是U上的算子,有归纳法假设知,U有基u1,…,um使得T|U对应的矩阵为上三角阵。因此对每个j都有:
Tuj=(T|U)(uj)∈span(u1,…,uj)把u1,…,um扩充称V的基u1,…,um,v1,…,vn,对每个k都有:
Tvk=(T−λI)vk+λvkU的定义表明(T−λI)vk∈U=span(u1,…,um),因此上式可得:
Tvk∈span(u1,…,um,v1,…,vk)根据式 (21)(23)可以知道T关于基u1,…,um,v1,…,vn有上三角阵。
接下来给出第二种证明。
我们仍然对V的维数用归纳法。若dimV=1,则结论显然成立。
现在假设dimV=n>1,并设对于所有n−1的复向量空间结论成立。设v1是T的任意一个本证向量,设U=span(v1),则U是T的不变子空间且dimU=1.
由于dimV/U=n−1,我们可以对T/U∈L(V/U)用归纳法假设。于是V/U有一个基v2+U,…,vn+U使得T/U关于该基有上三角矩阵。则对于每个j=2,…,n,有:
(T/U)(vj+U)∈span(v2+U,…,vj+U)对于式 (24)我们有:
Tvj∈span(v1,…,vj)于是,T关于V的基v1,…,vn具有上三角矩阵。
如何通过观察一个算子的矩阵来确定概算子是否可逆?如果我们很幸运的有一个基使得该算子关于这个基的矩阵是上三角的,那么这个问题就会变得很简单。
设T∈L(V)关于V的某个基有上三角矩阵。则T是可逆的当且仅当这个上三角矩阵上的元素都不是0.
设v1,…,vn是V的基使得T关于这个基具有上三角阵:
M(T)=[λ1∗λ2⋱0λn]我们需要证明:T是可逆的当且仅当所有λi均不为0 首先设对角线元素λ1,…,λn均不为0,则有:Tv1=λ1v1。因为λ1≠0 所以有T(v1/λ1)=v1,即v1∈range(T)。现在对于某个a∈F,有:T(v2/λ2)=av1+v2 上式的左端和av1都包含于range(T),于是v2∈range(T)。
依次类推,v1,…,vn∈range(T),因为v1,…,vn是V的基,所以range(T)=V,也就是T是满的,于是T是可逆的。
现在完成另一个方向的证明。假设T是可逆的,显然有λ1≠0,不然Tv1=0,说明null(T)≠{0},这与T可逆矛盾。设λj≠0,1<j≤n,式 (26) 表明 T将span(v1,…,vj)映射如span(v1,…,vj),我们知道dimspan(v1,…,vj−1)=j−1, dimspan(v1,…,vj)=j,所以T将一个大的空间映射到了一个小的空间,null(T)≠{0},所以T不是可逆的。与假设矛盾。
综上T是可逆的。
值得注意的是,现在我们还无法利用算子的矩阵来精确计算算子的本征值。但是,如果我们有幸找到一个基使得算子关于这个基的矩阵是上三角的,则本征值的计算问题就变得平凡了。
设T∈L(V)关于V的某个基有上三角矩阵。则T的本征值恰为这个上三角矩阵对角线上的元素。
设v1,…,vn是V的基,并且T关于这个基有上三角元素:
M(T)=[λ1∗λ2⋱0λn]设λ∈F,则:
M(T−λI)=[λ1−λ∗λ2−λ⋱0λn−λ]因此T−λI不可逆当且仅当λ等于λ1,…,λn中的某一个。于是λ是T的本征值当且仅当λ等于λ1,…,λn中的某一个。