特征值特征向量及对称矩阵的相似对角化

释放双眼,带上耳机,听听看~!
本文介绍了特征值、特征向量的定义和求解方法,以及对称矩阵的相似对角化,帮助读者更好地理解矩阵的特征分解和对角化过程。

文章内容

  • 特征值 / 特征向量
  • 相似矩阵
  • 对称矩阵的相似对角化

特征值 / 特征向量

什么是特征值、特征向量

定义:设 AAnn 阶矩阵(方阵),若存在常数 λlambda 和非零 nn 维列向量 xx,使 Ax=λxAx=lambda x,则称 λlambdaAA 的特征值,xxAA 的属于特征值 λlambda 的特征向量.

易得:Ax=λx→(A−λ)x=0→(A−λE)x=0Ax=lambda x rightarrow (A-lambda)x=0 rightarrow (A-lambda E)x=0

矩阵的加减法只能应用于同型矩阵,矩阵是无法和常数相加减的,但是对于方阵来说,加减一个常数相当于加减这个常数乘以单位矩阵 EE.

已知向量 xx 为非零向量,则齐次方程组 (A−λE)x=0(A-lambda E)x = 0 有非零解,则 R(A−λE)<0R(A-lambda E) < 0,又因为矩阵 A−λEA-lambda E 是方阵,则有其对应的行列式 ∣A−λE∣≠0|A-lambda E| neq 0

行列式 ∣A−λE∣=∣a11−λa12⋯a1na21a22−λ⋯a2n⋮⋮⋮an1an2⋯ann−λ∣|A-lambda E|= begin{vmatrix} a_{11}-lambda & a_{12} & cdots & a_{1n} \ a_{21} & a_{22}-lambda & cdots & a_{2n} \ vdots & vdots & & vdots \ a_{n1} & a_{n2} & cdots & a_{nn}-lambda end{vmatrix}

可以很容易看出,该行列式展开之后得到的是一个关于未知数 λlambda 的表达式,我们设这个表达式为 f(λ)f(lambda),则有 f(λ)=0f(lambda)=0,这个方程被称为特征方程,将该特征方程进行因式分解得到特征多项式,该 方程(多项式) 的解就是特征值 λlambda 的值 (可能有多个特征值)

特征方程因式分解:将 f(λ)f(lambda) 化成 (λ−a)(λ−b)⋯=0(lambda-a)(lambda-b)cdots=0 的形式.

将求得的特征值 λlambda 代入到原来的式子 (A−λE)x=0(A-lambda E)x=0,已知 λ,Alambda,A,可求得非零解 xx,求出的 xx 就是 AA 的对应特征值 λlambda特征向量

每个特征值都带入原式求出其对应的特征向量.

nn 阶矩阵 AAnn 个特征值为 λ1,λ2,⋯ ,λnlambda_1,lambda_2,cdots,lambda_n,则有:{∑i=1nλi=∑i=1naii∏i=1nλi=∣A∣begin{cases} sum_{i=1}^nlambda_i=sum_{i=1}^n a_{ii} \ prod_{i=1}^n lambda_i=|A| end{cases},证明过程就不详细展开来证了。

一元 nn 次方程中中所有根之和和所有根之积有明确定义,例如适用于一元二次方程的韦达定理 ({x1+x2=−bax1x2=ca)(begin{cases} x_1+x_2=-frac {b}{a} \ x_1x_2=frac {c}{a} end{cases}),上方的情况是一元 nn 次方程.

方阵中正对角线元素的和:例如对方阵 AA 中正对角线元素取和,被称为矩阵 AA 的迹,记作 tr(A)tr(A).

不同特征值对应的特征向量是线性无关的

:矩阵 An∗nA_{n*n} 最后最多会有 nn 个特征值(可能会有相同的特征值),因为矩阵 A−λEA-lambda E 对应的行列式展开后 f(x)=0f(x)=0 是关于 λlambdann 阶方程。

从几何上解释特征值、特征向量

变形的命名上并不标准,重点看如何进行变换

① 伸缩变换

特征值特征向量及对称矩阵的相似对角化

回头看定义中的式子:Ax=λxAx=lambda x,直面上的意思就是说向量 xx 左乘矩阵 AA,相当于向量 xxλlambda

例如设 A=[100k],x=[01]A=begin{bmatrix} 1 & 0 \ 0 & k end{bmatrix},x=begin{bmatrix} 0 \ 1end{bmatrix},则有 [100k][01]=k[01]begin{bmatrix} 1 & 0 \ 0 & k end{bmatrix}begin{bmatrix} 0 \ 1end{bmatrix} = kbegin{bmatrix} 0 \ 1end{bmatrix}

即向量 xxx1x_1方向上不变,x2x_2 方向上变为原来的 kk 倍,其中 [01]begin{bmatrix} 0 \ 1 end{bmatrix} 就是特征向量,kk 就是特征值.

② 平移变换

特征值特征向量及对称矩阵的相似对角化

[1k01][10]=[10]begin{bmatrix} 1 & k \ 0 & 1 end{bmatrix}begin{bmatrix} 1 \ 0 end{bmatrix} = begin{bmatrix} 1 \ 0end{bmatrix},可以发现大小是不变的,但是位置发生了改变,对于向量 xx

  • 变化前:(0,0)→(0,1)(0,0) rightarrow (0,1)
  • 变化后:(k,1)→(k+1,1)(k,1) rightarrow (k+1,1)

特征值为1,特征向量为 [10]begin{bmatrix} 1 \ 0end{bmatrix}

③ 镜像变换

特征值特征向量及对称矩阵的相似对角化

左乘矩阵 [0110]begin{bmatrix} 0 & 1 \ 1 & 0 end{bmatrix} 相当于沿着对角线 x2=x1x_2=x_1 进行翻转

要保证向量 xx 不发生改变,可见向量必须在这条线上

有: [0110][11]=[11]begin{bmatrix} 0 & 1 \ 1 & 0 end{bmatrix} begin{bmatrix} 1 \ 1end{bmatrix} = begin{bmatrix} 1 \ 1end{bmatrix},其中特征值为 11,特征向量为 [11]begin{bmatrix} 1 \ 1 end{bmatrix}

④ 旋转变换

特征值特征向量及对称矩阵的相似对角化

可见旋转变换整个一周中没有操作前后保持不变的向量这种情况,这种变换没有特征值、特征向量

由此可见 Ax=λxAx=lambda x,变化前后向量共线,只是大小发生了改变,变为原来的 λlambda 倍,特征值就是放大的倍数,特征向量就是经过矩阵 AA 改变前后仍然共线的向量.此外,从几何解释中也可以看出,特征向量就是前后共线的向量,那么就有若 xx 为特征向量,则 kxkx 也为特征向量.

特征值、特征向量的求解过程

一般求解思路:求解的过程相当于齐次方程组 (A−λE)x=0(A-lambda E)x=0 求解,其中 A−λEA-lambda E 为系数矩阵,以 ∣A−λE∣=0|A-lambda E|=0 先求得特征值 λlambda ,然后将多个 λlambda 分别带入到 (A−λE)x=0(A-lambda E)x=0 中求得每个特征值 λlambda 对应的特征向量 xx .

∣A−λE∣=0|A-lambda E|=0 因为特征向量是非零向量,因此不能有零解,因此有 R(A−λE)<nR(A-lambda E) < n,非满秩,根据矩阵的秩的定义得,∣A−λE∣=0|A-lambda E|=0.

:求矩阵 A=[3−1−13]A=begin{bmatrix} 3 & -1 \ -1 & 3 end{bmatrix} 的特征值和特征向量

Ax=λEAx=lambda E(A−λE)x=0(A-lambda E)x = 0

易得 A−λE=[3−λ−1−13−λ]A-lambda E = begin{bmatrix} 3-lambda & -1 \ -1 & 3-lambda end{bmatrix}

则有 ∣A−λE∣=∣3−λ−1−13−λ∣=(3−λ)2−1=0|A-lambda E| = begin{vmatrix} 3-lambda & -1 \ -1 & 3-lambda end{vmatrix} = (3-lambda)^2 – 1 = 0,解得:{λ1=2λ2=4begin{cases} lambda_1 = 2 \ lambda_2 = 4 end{cases}

λ1lambda_1 代入 (A−λE)x=0(A-lambda E)x = 0

  1. 系数矩阵 A−λEA-lambda E 先初等变换为行阶梯矩阵的形式:[1−1−11]∼[1−100]begin{bmatrix}1 & -1 \ -1 & 1end{bmatrix} sim begin{bmatrix} 1 & -1 \ 0 & 0 end{bmatrix}
  2. 自由变量有 n−R(A−λE)=1n-R(A-lambda E)=1 个,主元为 x1x_1,自由变量为 x2x_2
  3. [1−100]x=0begin{bmatrix} 1 & -1 \ 0 & 0 end{bmatrix}x = 0,即 x1−x2=0x_1-x_2=0.
  4. 一个基础解系 (x2x_2 为1),直接代入得到结果 [11]begin{bmatrix} 1 \ 1 end{bmatrix}

λ2lambda_2 同理,得到结果 [−11]begin{bmatrix} -1 \ 1 end{bmatrix}

则矩阵 AA 的特征值和特征向量分别为:{λ1=2p1=[11]begin{cases} lambda_1=2 \ p_1=begin{bmatrix} 1 \ 1 end{bmatrix} end{cases}{λ2=4p2=[−11]begin{cases} lambda_2=4 \ p_2=begin{bmatrix} -1 \ 1 end{bmatrix} end{cases}

正如文章前面提到的,若 xx 为特征向量,则 kxkx 仍然为特征向量,若题目中问的是求解矩阵 AA所有特征向量,则需要用该齐次方程组的通解来表示 (注意 k≠0kneq 0):

{λ1=2p1=k[11]begin{cases} lambda_1=2 \ p_1=kbegin{bmatrix} 1 \ 1 end{bmatrix} end{cases}{λ2=4p2=k[−11](k≠0,k∈R)begin{cases} lambda_2=4 \ p_2=kbegin{bmatrix} -1 \ 1 end{bmatrix} end{cases} quad (kneq 0, k in R)

,线性代数中规定:特征值可为0,表示每一个特征值都对应着无穷个特征向量,但特征向量不可为零向量

:求矩阵 A=[−110−430102]A=begin{bmatrix} -1 & 1 & 0 \ -4 & 3 & 0 \ 1 & 0 & 2 end{bmatrix} 的特征值和特征向量.

Ax=λxAx=lambda x得,(A−λE)x=0(A-lambda E)x=0

∣A−λE∣=∣−1−λ10−43−λ0102−λ∣=0|A-lambda E| = begin{vmatrix} -1-lambda & 1 & 0 \ -4 & 3-lambda & 0 \ 1 & 0 & 2-lambda end{vmatrix}=0

则有:∣A−λE∣=(2−λ)(−1)3+3∣−1−λ1−43−λ∣=0|A-lambda E|=(2-lambda)(-1)^{3+3}begin{vmatrix} -1-lambda & 1 \ -4 & 3-lambda end{vmatrix}=0

行列式的值 = 某一行/某一列中元素与其对应的代数余子式的积之和,这里选择的是第三列.

整理得:(2−λ)[(λ+1)(λ−3)+4]=(2−λ)(λ−1)2=0(2-lambda)[(lambda + 1)(lambda – 3)+4]=(2-lambda)(lambda-1)^2=0

解得:{λ1=2λ2=λ3=1begin{cases} lambda_1=2 \ lambda_2=lambda_3=1 end{cases}

λ1=2lambda_1 = 2 时:
∣A−λE∣=[−310−410100]∼[100010000]|A-lambda E| = begin{bmatrix} -3 & 1 & 0 \ -4 & 1 & 0 \ 1 & 0 & 0 end{bmatrix} sim begin{bmatrix} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 0 end{bmatrix}

易得自由变量个数为 n−R(A−λE)=1n-R(A-lambda E)=1,主元为 x1,x2x_1,x_2,自由变量为 x3x_3

基础解系:[x1x21]begin{bmatrix} x_1 \ x_2 \ 1 end{bmatrix}

新的齐次方程组:{−3×1+x2=0−x2=0begin{cases} -3x_1 + x_2 = 0 \ -x_2 = 0 end{cases},解得:p1=[001]p_1=begin{bmatrix} 0 \ 0 \ 1 end{bmatrix}

λ2=λ3=1lambda_2=lambda_3=1 时,同理得到 p2=[−1−21]p_2=begin{bmatrix} -1 \ -2 \ 1 end{bmatrix}

则矩阵 AA 的特征值和特征向量分别为:{λ1=2p1=[001]begin{cases} lambda_1=2 \ p_1=begin{bmatrix} 0 \ 0 \ 1 end{bmatrix} end{cases}{λ2=λ3=1p2=[−1−21]begin{cases} lambda_2=lambda_3 = 1 \ p_2=begin{bmatrix} -1 \ -2 \ 1 end{bmatrix} end{cases}

:设 α=[a1,a2,⋯ ,an]T,β=[b1,b2,⋯ ,nn]T,A=αβTalpha=[a_1,a_2,cdots,a_n]^T,beta=[b_1,b_2,cdots,n_n]^T,A=alphabeta^T(α,β)=3(alpha, beta)=3,求 AA 的特征值及重数,以及 AA 的非零特征值对应的线性无关的特征向量.

这里的重数指代数重数,例如 (x−2)3=0(x-2)^3=0,则特征值为 22,该特征值的重数为 33

这种题知道解题思路后可以一眼秒出结果,解题思路如下:

A=αβT=[a1a2⋮an][b1b2⋯bn]=[a1b1a1b2⋯anbna2b1a2b2⋯a2bn⋮⋮⋮anb1anb2⋯anbn]A = alphabeta^T = begin{bmatrix} a_1 \ a_2 \ vdots \ a_n end{bmatrix}begin{bmatrix} b_1 & b_2 & cdots & b_n end{bmatrix} = begin{bmatrix} a_1b_1 & a_1b_2 & cdots & a_nb_n \ a_2b_1 & a_2b_2 & cdots & a_2b_n \ vdots & vdots & & vdots \ a_nb_1 & a_nb_2 & cdots & a_nb_nend{bmatrix}

(α,β)=αTβ=tr(A)=3(alpha,beta)=alpha^Tbeta=tr(A)=3

要求特征值和特征向量,设 Ax=λxAx=lambda x

Ax=λxAx=lambda x 得:A2x=A(Ax)=λ(Ax)=λ(λx)=λ2xA^2x = A(Ax) = lambda (Ax) = lambda (lambda x)=lambda^2 x

A2x=λ2xA^2x=lambda^2 x.

又因为 A2=AA=(αβT)(αβT)=α(βTα)βT=α(α,β)βT=3αβT=3AA^2 = AA=(alphabeta^T)(alphabeta^T)=alpha(beta^Talpha)beta^T=alpha(alpha,beta)beta^T=3alphabeta^T=3A

A2=3AA^2=3A.

则有 A2−3A=0A^2-3A=0

整理得 (A2−3A)x=A2x−3Ax=λ2x−3λx=λ(λ−3)x=0(A^2-3A)x = A^2x-3Ax = lambda^2x-3lambda x=lambda(lambda-3)x=0

A2−3A=0→(A2−3A)x=0A^2-3A=0rightarrow (A^2-3A)x=0

λ(λ−3)x=0lambda(lambda – 3)x=0,即 {λ1=0λ2=3begin{cases} lambda_1 = 0 \ lambda_2 = 3 end{cases}λlambda 为 0 或 3

又因为所有特征值的和 ∑i=1nλi=tr(A)=(α,β)=3sum _{i=1}^n lambda_i = tr(A)=(alpha,beta)=3

不难看出 {λ1=λ2=⋯=λn−1=0λn=3begin{cases} lambda_1 = lambda_2 = cdots = lambda_{n-1}=0 \ lambda_n = 3 end{cases},即 特征值 {0,r1=n−13,r2=1begin{cases} 0,quad r_1=n-1 \ 3,quad r_2=1 end{cases}

rir_i 为 第 ii 个特征值对应的重数

题目要求不考虑特征值为 0 时对应的特征向量,只需考虑特征值为 3 的情况

由于 Aα=αβTα=α(α,β)=3αAalpha = alpha beta^T alpha = alpha(alpha,beta)=3alpha

Aα=3αAalpha=3alpha,因此特征值 33 对应的特征向量就为 αalpha

综上所述:特征值为 0,30,3,分别对应的重数为 n−1,1n-1,1,特征值 33 对应的特征向量为 αalpha.

结论:对于每行每列成比例的矩阵 AA,矩阵 AA 一定能拆成一个列向量 αalpha 乘以一个行向量 βbeta,也就是上方例题中的情况,这种矩阵它的特征值有两个,分别是 0 和 (α,β)(alpha,beta),后者特征值对应的特征向量为列向量 αalpha

A=[123246369]=[123][123]A=begin{bmatrix} 1 & 2 & 3 \ 2 & 4 & 6 \ 3 & 6 & 9 end{bmatrix} = begin{bmatrix} 1 \ 2 \ 3 end{bmatrix} begin{bmatrix} 1 & 2 & 3 end{bmatrix}

补充:求特征值为 00 时对应的特征向量

Ax=λx→(A−λE)x=0Ax=lambda x rightarrow (A-lambda E)x = 0,有 Ax=0Ax=0,求解齐次方程组 Ax=0Ax=0 即可,该齐次方程组的通解表示的无穷多个向量就是该特征值对应的特征向量。

矩阵和特征值的关系

矩阵和特征值的关系:对于 Ax=λxAx=lambda x,有函数关系 f(A)x=f(λ)xf(A)x = f(lambda)x

例如对于矩阵 AA 有特征值 λlambda,则对于矩阵 2A−1−2E2A^{-1}-2E 有特征值 2λ−1−22lambda^{-1}-2.

λlambda 是方阵 AA 的特征值,证明:

  1. λnlambda^nAnA^n 的特征值
  2. AA 可逆时,1λfrac {1}{lambda}A−1A^{-1} 的特征值

λnlambda^nAnA^n 的特征值

证:已知 Ax=λxAx=lambda x

则有 Anx=An−1Ax=An−1λx=λAn−2Ax=λ2An−2x=⋯=λnxA^nx = A^{n-1}Ax=A^{n-1}lambda x = lambda A^{n-2}Ax = lambda^2A^{n-2}x = cdots = lambda^nx

② 当 AA 可逆时,1λfrac {1}{lambda}A−1A^{-1} 的特征值

证:已知 Ax=λxAx=lambda x

则有 AA−1x=A−1λx→1λx=A−1xAA^{-1}x=A^{-1}lambda x rightarrow frac {1}{lambda}x=A^{-1}x

A−1x=1λxA^{-1}x=frac {1}{lambda}x.

:设3阶矩阵 AA 的特征值为 1, -1, 2, 求 A∗+3A−2EA^*+3A-2E 的特征值

已知矩阵 AA 的所有特征值,则 ∣A∣=1∗(−1)∗2=−2|A|=1*(-1)*2=-2

AA∗=∣A∣EAA^*=|A|E 得:A−1=A∗∣A∣A^{-1}=frac {A^*}{|A|},即 A∗=−2A−1A^*=-2A^{-1}

则原式 = −2A−1+3A−2E-2A^{-1}+3A-2E

已知 Ax=λxAx=lambda x

则有:(−2A−1+3A−2E)x=−2A−1x+3Ax−2Ex=−2λ−1x+3λx−2x=(−2λ−1+3λ−2)x(-2A^{-1}+3A-2E)x=-2A^{-1}x+3Ax-2Ex=-2lambda^{-1}x+3lambda x-2x=(-2lambda^{-1} + 3lambda -2)x

则特征值为 −1,−3,3-1, -3, 3

相似矩阵

什么是相似矩阵

定义:设 A,BA,Bnn 阶矩阵,若存在可逆矩阵 PP,使 B=P−1APB=P^{-1}AP,则称矩阵 AABB 相似,记为 A∼BA sim B,称 P−1APP^{-1}AP 是对 AA 做相似变换

很多教材中矩阵等价和相似使用的符号都是 ∼sim,但是不要混淆,这两个是不同的概念,此外,一些教材中规定的等价符号为 =∼stackrel {sim}{=},而相似的符号为 ∼sim.

设向量 x2,y2x_2,y_2,这两个向量是在不同基下的同一向量,有 x2=Py2x_2=Py_2 某变换在这两个基下的的表示分别为矩阵 AABB,矩阵 A,BA,B 相似.

{x2=Ax1y2=By1begin{cases} x_2=Ax_1 \ y_2=By_1 end{cases},有
x2=Py2=PBy1,x2=Ax1=APy1→PBy1=APy1x_2 = Py_2=PBy_1,x_2=Ax_1=APy_1 rightarrow PBy_1=APy_1

整理得 By1=P−1APy1→B=P−1APBy_1=P^{-1}APy_1 rightarrow B=P^{-1}AP

矩阵相似:同一矩阵在不同基下的表示

定理1:若矩阵 A∼BA sim B,则有:

  1. R(A)=R(B)R(A)=R(B)
  2. ∣A∣=∣B∣|A|=|B|
  3. ∣λE−A∣=∣λE−B∣|lambda E-A|=|lambda E-B|
  4. tr(A)=tr(B)tr(A)=tr(B)

证明:

  • R(A)=R(B)R(A)=R(B)B=P−1APB=P^{-1}AP,左乘和右乘相当于对矩阵A做初等行列变换,不改变矩阵的秩.
  • ∣A∣=∣B∣|A|=|B|∣B∣=∣P−1AP∣=∣P−1∣∣A∣∣P∣=∣A∣|B|=|P^{-1}AP|=|P^{-1}||A||P|=|A|,这里补充一个知识点,∣P−1∣=∣1P∣|P^{-1}|=|frac {1}{P}|.
  • ∣λE−A∣=∣λE−B∣|lambda E-A|=|lambda E-B|:这两个式子就是求特征值的式子,这两个式子相同意味着矩阵 AA 和矩阵 BB 对应的特征值是相同的,矩阵对应的行列式的值等于所有特征值的积,因此 ∣λE−A∣=∣λE−B∣|lambda E- A|=|lambda E – B|.
  • tr(A)=tr(B)tr(A)=tr(B):和上一个同理,特征值都一样,那特征值的和肯定也一样.

定理2:若矩阵 A∼BA sim B,则有:

  1. AT∼BTA^T sim B^T
  2. A−1∼B−1A^{-1}sim B^{-1}
  3. An∼Bn(n∈N)A^nsim B^n quad (n in N)
  4. A∗∼B∗(A,B可逆)A^* sim B^* quad (A,B 可逆)
  5. A−nE∼B−nEA-nE sim B-nE

证明:

  • AT∼BTA^T sim B^TBT=(P−1AP)T=PTAT(P−1)T=PTAT(PT)−1B^T=(P^{-1}AP)^T=P^TA^T(P^{-1})^T=P^TA^T(P^T)^{-1},把 PTP^T 看成一个整体,则有 AT∼BTA^T sim B^T.
  • A−1∼B−1A^{-1}sim B^{-1}:这条和上方两矩阵对应的转置矩阵相似证明过程同理. – An∼Bn(n∈N)A^nsim B^n quad (n in N)Bn=(P−1AP)n=P−1A(PP−1)A(PP−1)A⋯(PP−1)AP=P−1AnPB^n=(P^{-1}AP)^n=P^{-1}A(PP^{-1})A(PP^{-1})Acdots (PP^{-1})AP=P^{-1}A^nP,则 An∼BnA^n sim B^n
  • A∗∼B∗(A,B可逆)A^* sim B^* quad (A,B 可逆):由上面的条件得,A−1∼B−1A^{-1} sim B^{-1},即 B−1=P−1A−1P→B∗∣B∣=P−1A∗∣A∣PB^{-1}=P^{-1}A^{-1}P rightarrow frac {B^*}{|B|}=P^{-1} frac{A^*}{|A|} P,由定理1得 ∣A∣=∣B∣|A|=|B|,则有 B∗=P−1A∗PB^*=P^{-1}A^*P,则 A∗∼B∗A^* sim B^*.
  • A−nE∼B−nEA-nE sim B-nEP−1(A−nE)P=(P−1AP)−(P−12EP)=B−nEP^{-1}(A-nE)P=(P^{-1}AP)-(P^{-1}2EP)=B-nE

:设 A∼BA sim B,且 B=[001010100]B=begin{bmatrix} 0 & 0 & 1 \ 0 & 1 & 0 \ 1 & 0 & 0 end{bmatrix},则 R(A−2E)+R(A−E)=?R(A-2E)+R(A-E)=?

R(A−2E)+R(A−E)=R(B−2E)+R(B−E)R(A-2E)+R(A-E)=R(B-2E)+R(B-E)

B−2E=[−2010−1010−2]∼[10−20−1000−3]B-2E=begin{bmatrix} -2 & 0 & 1 \ 0 & -1 & 0 \ 1 & 0 & -2 end{bmatrix} sim begin{bmatrix} 1 & 0 & -2 \ 0 & -1 & 0 \ 0 & 0 & -3 end{bmatrix}

B−E=[−10100010−1]∼[−101000000]B-E=begin{bmatrix} -1 & 0 & 1 \ 0 & 0 & 0 \ 1 & 0 & -1 end{bmatrix} sim begin{bmatrix} -1 & 0 & 1 \ 0 & 0 & 0 \ 0 & 0 & 0 end{bmatrix}

R(B−2E)+R(B−E)=4R(B-2E)+R(B-E)=4

R(A−2E)+R(A−E)=4R(A-2E)+R(A-E)=4

相似对角化

定义:若矩阵 AA 能与对角阵 ΛLambda 相似,则称矩阵 AA 可相似对角化,记作 A∼ΛA sim Lambda,称 ΛLambdaAA 的相似标准形.

P−1AP=Λ⟶两边左乘PAP=PΛ(将P按列分块P=[η1,η2,⋯ ,ηn])P^{-1}AP=Lambda stackrel {两边左乘P}{longrightarrow} AP=PLambda quad (将P按列分块 P=[eta_1,eta_2,cdots,eta_n])

AP=A[η1η2⋯ηn]=[Aη1Aη2⋯Aηn]AP=Abegin{bmatrix} eta_1 & eta_2 cdots & eta_n end{bmatrix} = begin{bmatrix} Aeta_1 & Aeta_2 cdots & Aeta_n end{bmatrix}

A=[a11a12a21a22],BA=begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} end{bmatrix},B (按列分块) =[η1η2],AB=[Aη1Aη2]=begin{bmatrix} eta_{1} & eta_{2} end{bmatrix},AB=begin{bmatrix} Aeta_1 & Aeta_2 end{bmatrix}

这里是把矩阵 AA看成一个整体 (分块)

[a11a12a21a22][b11b12b21b22]=[a11a12a21a22][η1η2]=begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} end{bmatrix}begin{bmatrix} b_{11} & b_{12} \ b_{21} & b_{22} end{bmatrix} = begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} end{bmatrix}begin{bmatrix} eta_{1} & eta_{2} end{bmatrix} =

[[a11a12]η1[a11a12]η2[a21a22]η1[a21a22]η2]=[[a11a12a21a22]η1[a11a12a21a22]η2]begin{bmatrix} begin{bmatrix} a_{11} & a_{12} end{bmatrix}eta_1 & begin{bmatrix} a_{11} & a_{12} end{bmatrix}eta_2 \ begin{bmatrix} a_{21} & a_{22} end{bmatrix}eta_1 & begin{bmatrix} a_{21} & a_{22} end{bmatrix}eta_2 end{bmatrix} = begin{bmatrix} begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} end{bmatrix}eta_1 & begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} end{bmatrix}eta_2 end{bmatrix}

PΛ=[η1η2⋯ηn][λ1λ2⋯λn]=[η1λ1η2λ2⋯ηnλn]PLambda = begin{bmatrix} eta_1 & eta_2 cdots & eta_n end{bmatrix}begin{bmatrix} lambda_1 & & & \ & lambda_2 & & \ & & cdots & \ & & & lambda_n end{bmatrix} = begin{bmatrix} eta_1lambda_1 & eta_2lambda_2 & cdots eta_nlambda_n end{bmatrix}

AP=PΛAP=PLambda[Aη1Aη2⋯Aηn]=[η1λ1η2λ2⋯ηnλn]begin{bmatrix} Aeta_1 & Aeta_2 cdots & Aeta_n end{bmatrix}=begin{bmatrix} eta_1lambda_1 & eta_2lambda_2 & cdots eta_nlambda_n end{bmatrix}

则有:{Aη1=η1λ1Aη2=η2λ2⋮Aηn=ηnλnbegin{cases} Aeta_1 = eta_1lambda_1 \ Aeta_2 = eta_2lambda_2 \ qquad vdots \ Aeta_n=eta_nlambda_n end{cases}

这些式子就是前面的特征值特征向量的定义 Ax=λxAx=lambda x

结论:所以要想矩阵 AA 和对角阵相似的话,对角阵中的元素必须是 AA 的特征值,矩阵 PP 中的列向量为矩阵 AA 的特征值对应的特征向量.

定理1nn 阶方阵 AA 可对角化的充要条件是 AAnn 个线性无关的特征向量.

  • 推论:若 AAnn 个不同的特征值,则 AA 一定可以相似对角化

补充:不同特征值对应的特征向量线性无关,相同特征值(重数大于1)对应的特征向量不保证一定线性无关。

从几何上理解,向量表示的是矩阵变换中只有伸缩变换没有旋转变换的方向向量,特征值是这个方向的伸缩系数,一个方向当然只有一个伸缩系数。

定理2nn 阶矩阵 AA 与对角矩阵相似的充要条件是 AA 的每个特征值对应的特征向量线性无关的个数等于该特征值的重数.

当重数大于1时,意味着可能有相同的特征值,”每个特征值对应的特征向量线性无关的个数等于该特征值的重数” 这句话意味着当特征值相同时,对应的特征向量仍然是线性无关的.

:设矩阵 A=[−211020−413]A=begin{bmatrix} -2 & 1 & 1 \ 0 & 2 & 0 \ -4 & 1 & 3 end{bmatrix},问 AA 能否对角化?若能,则求可逆矩阵 PP 和对角矩阵 ΛLambda,使 P−1AP=ΛP^{-1}AP=Lambda.

假设矩阵 AA 能对角化.

∣A−λE∣=∣−2−λ1102−λ0−413−λ∣=(2−λ)(−1)2+2∣−2−λ1−43−λ∣=(2−λ)(λ+1)(λ−2)=0|A-lambda E| = begin{vmatrix} -2-lambda & 1 & 1 \ 0 & 2-lambda & 0 \ -4 & 1 & 3-lambda end{vmatrix} = (2-lambda)(-1)^{2+2}begin{vmatrix} -2 – lambda & 1 \ -4 & 3-lambda end{vmatrix}=(2-lambda)(lambda + 1)(lambda – 2)=0

{λ1=−1λ2=λ3=2begin{cases} lambda_1 = -1\ lambda_2=lambda_3=2 end{cases}

λ2=λ3=2lambda_2 = lambda_3 = 2 时,A−2E=[−411000−411]∼[−411000000]A-2E=begin{bmatrix} -4 & 1 & 1 \ 0 & 0 & 0 \ -4 & 1 & 1end{bmatrix} sim begin{bmatrix} -4 & 1 & 1 \ 0 & 0 & 0 \ 0 & 0 & 0 end{bmatrix}

由基础解系易得两个解:p2=[1410],p3=[1401]p_2 =begin{bmatrix} frac 1 4 \ 1 \ 0 end{bmatrix},p_3 = begin{bmatrix} frac 1 4 \ 0 \ 1 end{bmatrix},易得这两个向量构成的向量组线性无关

同理当 λ1=−1lambda_1 = -1 时,得到 p1=[101]p_1=begin{bmatrix} 1 \ 0 \ 1end{bmatrix}

则矩阵 AA 可对角化

易得对角阵 Λ=[−122]Lambda=begin{bmatrix} -1 & & \ & 2 & \ & & 2 end{bmatrix},可逆矩阵 P=[11414010101]P=begin{bmatrix} 1 & frac 1 4 & frac 1 4 \ 0 & 1 & 0 \1 & 0 & 1 end{bmatrix}

对角阵和可逆矩阵答案不唯一,λ1,λ2,λ3lambda_1,lambda_2,lambda_3 哪两个为2,哪个为1,顺序不确定,因此最终得到的对角阵和可逆矩阵中的顺序也可能不同,答案不唯一.

:设矩阵 A=[20131×405]A=begin{bmatrix} 2 & 0 & 1 \ 3 & 1 & x \ 4 & 0 & 5 end{bmatrix} 可相似对角化,求 xx.

∣A−λE∣=∣2−λ0131−λx405−λ∣=(1−λ)(−1)2+2∣2−λ145−λ∣|A-lambda E|=begin{vmatrix} 2-lambda & 0 & 1 \ 3 & 1-lambda & x \ 4 & 0 & 5-lambda end{vmatrix} = (1-lambda)(-1)^{2+2}begin{vmatrix} 2-lambda & 1 \ 4 & 5-lambda end{vmatrix}

=(1−λ)(λ−1)(λ−6)=0=(1-lambda)(lambda-1)(lambda-6) = 0

解得 {λ1=λ2=1λ3=6begin{cases} lambda_1 =lambda_2 = 1 \ lambda_3 = 6 end{cases}

λ1=λ2=1lambda_1 = lambda_2 = 1 时,A−λE=[10130×404]∼[10100x−3000]A-lambda E=begin{bmatrix} 1 & 0 & 1 \ 3 & 0 & x \ 4 & 0 & 4 end{bmatrix} sim begin{bmatrix} 1 & 0 & 1 \ 0 & 0 & x-3 \ 0 & 0 & 0 end{bmatrix}

由于矩阵 AA 可相似对角化,因此齐次方程组 (A−E)x=0(A-E)x=0 一定有2个线性无关解

3−R(A−E)=23-R(A-E)=2R(A−E)=1R(A-E)=1

线性无关解个数 = 自由变量个数 = n−R(系数矩阵)n-R(系数矩阵)

x−3=0→x=3x-3=0 rightarrow x=3.

对称矩阵的相似对角化

对称矩阵AT=AA^T=A,实对称矩阵,也就是矩阵元素都为实数

我们不研究 虚对称矩阵

性质1:实对称矩阵的特征值为实数

性质2:实对称矩阵 AA 对应于不同特征值的特征向量相互正交

性质3nn 阶实对称矩阵 AA 必可相似对角化,且总存在正交矩阵 QQ,使得 QTAQ=diag(λ1,λ2,⋯ ,λn)Q^TAQ=diag(lambda_1,lambda_2,cdots,lambda_n),其中 λ1,λ2,⋯ ,λnlambda_1,lambda_2,cdots,lambda_n 是矩阵 AA 的特征值.

diag(λ1,λ2,⋯ ,λn)diag(lambda_1,lambda_2,cdots,lambda_n):对角阵,正对角线元素按顺序分别为 λ1,λ2,⋯ ,λnlambda_1,lambda_2,cdots,lambda_n.

:设 AA 是三阶实对称矩阵,其特征值为 λ1=6,λ2=λ3=3lambda_1=6, lambda_2=lambda_3=3,其特征值 33 对应的特征向量为 ξ2=[−1,0,1]T,ξ3=[1,−2,1]Txi_2=[-1, 0, 1]^T,xi_3=[1,-2,1]^T,求矩阵 AA 的对应于特征值 66 的特征向量及矩阵 AA.

ξ1=[x1,x2,x3]Txi_1=[x_1,x_2,x_3]^T,由于 AA 为三阶实对称矩阵,则有 {(ξ1,ξ2)=0(ξ1,ξ3)=0begin{cases} (xi_1,xi_2)=0 \ (xi_1,xi_3)=0 end{cases}

{−x1+x3=0x1−2×2+x3=0begin{cases} -x_1+x_3=0 \ x_1-2x_2+x_3 = 0 end{cases},易得系数矩阵:[−1011−21]∼[−1010−22]begin{bmatrix} -1 & 0 & 1 \ 1 & -2 & 1 end{bmatrix} sim begin{bmatrix} -1 & 0 & 1 \ 0 & -2 & 2 end{bmatrix}

易得主元为 x1,x2x_1,x_2,基础解系:ξ1=[1,1,1]Txi_1=[1,1,1]^T

Q=[ξ1ξ2ξ3]=[1−1110−2111]Q=begin{bmatrix} xi_1 & xi_2 & xi_3 end{bmatrix} = begin{bmatrix} 1 & -1 & 1 \ 1 & 0 & -2 \ 1 & 1 & 1 end{bmatrix}

Q−1AQ=ΛQ^{-1}AQ=Lambda 得:A=QΛQ−1(两边分别左乘Q−1和右乘Q)A=QLambda Q^{-1} quad (两边分别左乘Q^{-1}和右乘Q)

A=[1−1110−2111][633][1−1110−2111]−1=[411141114] A=begin{bmatrix} 1 & -1 & 1 \ 1 & 0 & -2 \ 1 & 1 & 1 end{bmatrix}begin{bmatrix} 6 & & \ & 3 & \ & & 3 end{bmatrix}begin{bmatrix} 1 & -1 & 1 \ 1 & 0 & -2 \ 1 & 1 & 1 end{bmatrix}^{-1}=begin{bmatrix} 4 & 1 & 1 \ 1 & 4 & 1 \ 1 & 1 & 4 end{bmatrix}

最后这步就硬算,计算过程有点麻烦,但思路很简单,算出来就好了

:设三阶实对称矩阵 AA 的各行元素之和为 3 ,向量 α1=[−1,2,−1]T,α2=[0,−1,1]Talpha_1=[-1,2,-1]^T,alpha_2=[0,-1,1]^T 是方程组 Ax=0(0为零向量)Ax=0 (0为零向量) 的两个解,(1) 求 AA 的特征值和特征向量;(2) 求正交矩阵 QQ 和对角矩阵 ΛLambda,使得 Q−1AQ=ΛQ^{-1}AQ=Lambda.

(1) 求 AA 的特征值和特征向量.

已知三阶实对称矩阵 AA 的个行元素之和为3

A[111]=3[111]Abegin{bmatrix} 1 \ 1 \ 1 end{bmatrix} = 3begin{bmatrix} 1 \ 1 \ 1 end{bmatrix},即 Aα=λα,α=[111]Aalpha=lambda alpha,quad alpha=begin{bmatrix} 1 \ 1 \ 1 end{bmatrix}

易得 特征值λ3lambda_333,对应的特征向量为 α3=[111]alpha_3=begin{bmatrix} 1 \ 1 \ 1 end{bmatrix}

易得 A=[α1α2α3]=[−1012−11−111]A=begin{bmatrix} alpha_1 & alpha_2 & alpha_3 end{bmatrix} = begin{bmatrix} -1 & 0 & 1 \ 2 & -1 & 1 \ -1 & 1 & 1 end{bmatrix}

已知向量 α1=[−1,2,−1]T,α2=[0,−1,1]Talpha_1=[-1,2,-1]^T,alpha_2=[0,-1,1]^T 都是方程组 Ax=0Ax=0 的解

则有 Aα1=0=0α1,Aα2=0α2Aalpha_1 = 0 = 0alpha_1,Aalpha_2=0alpha_2

则特征向量对应的特征值有 λ1=λ2=0lambda_1=lambda_2=0

AA 特征值:{λ1=λ2=0λ3=3begin{cases} lambda_1=lambda_2=0 \ lambda_3=3 end{cases},特征向量:α1=[−12−1],α2=[0−11],α3=[111]alpha_1=begin{bmatrix} -1 \ 2 \ -1 end{bmatrix},alpha_2=begin{bmatrix} 0 \ -1 \ 1 end{bmatrix},alpha_3=begin{bmatrix} 1 \ 1 \ 1 end{bmatrix}

(2) 求正交矩阵 QQ 和对角矩阵 ΛLambda,使得 Q−1AQ=ΛQ^{-1}AQ=Lambda.

易得对角阵 Λ=[003]Lambda=begin{bmatrix} 0 & & \ & 0 & \ & & 3 end{bmatrix}

已知矩阵 AA 不同特征值对应的特征向量相互正交,即 α3alpha_3 分别与 α1,α2alpha_1,alpha_2 正交

β1=α1beta_1 = alpha_1,由施密特正交法得:

β2=α2−(α2,β1)(β1,β1)β1=12[−101],β3=α3=[111]beta_2 = alpha_2 – frac {(alpha_2,beta_1)}{(beta_1,beta_1)}beta_1=frac {1}{2}begin{bmatrix} -1 \ 0 \ 1 end{bmatrix},beta_3=alpha_3=begin{bmatrix} 1 \ 1 \ 1 end{bmatrix}

r1=β1∣∣β1∣∣=16[−12−1]r_1=frac {beta_1}{||beta_1||}=frac {1}{sqrt 6}begin{bmatrix} -1 \ 2 \ -1 end{bmatrix},同理 r2=12[−101],r3=13[111]r_2=frac {1}{sqrt 2}begin{bmatrix} -1 \ 0 \ 1 end{bmatrix},r_3=frac {1}{sqrt 3}begin{bmatrix} 1 \ 1 \ 1 end{bmatrix}

则 正交矩阵 Q=[r1r2r3]Q=begin{bmatrix} r_1 & r_2 & r_3 end{bmatrix}

正交矩阵需要向量互相正交且模都为1,前面提到实对称矩阵不同特征值相互正交,因此这里只需要保证特征值相同时的连个特征向量相互正交即可,规范化特征向量后得到该正交矩阵 QQ.

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

深度兴趣网络(DIN)算法及其在点击率预估中的应用

2023-11-21 14:27:00

AI教程

DIY中秋明信片

2023-11-21 14:38:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索