线性代数与矩阵之度量矩阵与广义内积
度量矩阵与广义内积
度量矩阵
Gram矩阵
设A为一个m×n阶实矩阵,n阶方阵G=[gij]=ATA称为Gramian或Gram矩阵,也有人称之为交互乘积(cross-product)矩阵。考虑A的行向量表达式A=[a1a2⋯an],ai∈Rm,则 G=ATA=⎣⎡a1Ta2T⋮anT⎦⎤[a1a2⋯an]=⎣⎡a1Ta1a2Ta1 anTa1a1Ta2a2Ta2 anTa2⋯⋯ ⋯a1Tana2Tan anTan⎦⎤ 这指出gij=aiTaj。推广至一般情况,设向量集v1,v2,…,vn属于内积空间V,n×n阶Gramian矩阵G的(i,j)元定义为vi和vj的内积,以gij=⟨vi,vj⟩表示。
本文仅讨论广泛应用于统计学与控制系统的实Gramian矩阵,以下列举几个实Gramian矩阵G=ATA的基本性质。
- ATA是对称矩阵。
明显地,gij=aiTaj=ajTai=gji。
(2)对任一实矩阵A,rank(ATA)=rankA。
(3)若ATA=0,则A=0。
性质(3)是性质(2)的必然结果。若ATA=0,则rankA=rankATA=rank0=0,惟有零矩阵其矩阵秩为零,推得A=0。
Gramian矩阵和正定矩阵有密切的关系,归结为以下三个性质。
(4)对任一实矩阵A,ATA是半正定矩阵。设x∈Rn且x=0,则xTATAx=(Ax)T(Ax)=∥Ax∥2≥0。
(5)任一实对称半正定矩阵M皆可表示为Grammin矩阵,亦即存在一矩阵A使得M=ATA。
实对称矩阵M可正交对角化为M=QΛQT,其中QTQ=I,Λ=diag(λ1,…,λn)。又M为半正定,这意味对所有i,λi≥0,故可令Λ1/2=diag(λ1,…,λn)且A=Λ1/2QT,立得M=QΛQT=(QΛ1/2)(Λ1/2QT)=(Λ1/2QT)T(Λ1/2QT)=ATA。
(6)唯当A的列向量a1,…,an是线性独立时,ATA可逆,故为正定矩阵。因为A有线性独立的列向量意味rankA=n,由性质(2)可知rank(ATA)=n,反向陈述显然成立。另外也可以考虑Ax=0,当A有线性独立行向量时,零空间N(A)={0},性质(4)的等号仅发生于x=0,故A为正定矩阵。
广义内积
有复空间Cn,有一组基bases1={ε1,ε2,⋯,εn},α,β用base1表示的向量,那么α,β在base1下的内积可以定义为 ⟨α,β⟩=i=1∑nj=1∑nxiyˉi⟨εi,εj⟩=xTAyˉ 其中,A=(⟨εi,εj⟩)n∗n,称A是空间Cn在基{ε1,ε2,⋯,εn}下的度量矩阵,这种带有度量矩阵的内积称为广义内积。
对于欧几里得空间Rn,度量矩阵是对称矩阵AT=A;对于酉空间Cn,度量矩阵是Hermite矩阵AH=A。对于一般内积,可以看成度量矩阵是n阶单位矩阵In∗n。
可以看出定义内积的方式是多种多样的,因此我们能够指出只要满足哪些问题就可以算是内积。
内积空间
标量域F是指实数域R或复数域C。
正式地,一个内积空间是域F上的向量空间V与一个内积(即一个映射)构成的。V上的一个内积定义为正定、非退化的共轭双线性形式(F=R时,内积是一个正定、对称、非退化的双线性形式),记为⟨⋅,⋅⟩:V×V→F。
它满足以下设定:
- 共轭对称;∀x,y∈V,⟨x,y⟩=⟨y,x⟩,这个设定蕴含了:∀x∈V,⟨x,x⟩∈R,因为⟨x,x⟩=⟨x,x⟩.
- 对第一个元素线性; ∀a∈F, ∀x,y∈V, ⟨ax,y⟩=a⟨x,y⟩,∀x,y,z∈V, ⟨x+y,z⟩=⟨x,z⟩+⟨y,z⟩. 前两条可以推断出: ∀b∈F, ∀x,y∈V, ⟨x,by⟩=b⟨x,y⟩,∀x,y,z∈V, ⟨x,y+z⟩=⟨x,y⟩+⟨x,z⟩. 因此⟨⋅,⋅⟩实际上是一个半双线性形式。
- 非负性:∀x∈V, ⟨x,x⟩≥0.
- 非退化:从V到对偶空间V∗的映射:x↦⟨x,⋅⟩是同构映射。在有限维的向量空间中,只需要验证它是单射:⟨x,y⟩=0∀y∈V,当且仅当x=0。
拥有以上性质的共轭双线性形式被称为埃尔米特形式。内积是一个埃尔米特形式。如果F是实数域R那么共轭对称性质就等价于对称性:⟨x,y⟩=⟨y,x⟩,也就是说,共轭双线性变成了一般的双线性。