#数学基础W10:矩阵的SVD分解
面对方阵:
- A=LU
- A=QR
- A=QΛQ
- 正定矩阵的cholosky分解
面对非方阵:
Am×n=SVD;
数学基础的重点;
图像压缩:利用SVD的图像压缩
奇异值分解基于特征向量的矩阵变换方法;
图像压缩:减少冗余提高效率;
某种意义上冗余可以看作成噪声;
压缩:保留大的特征值
新的压缩方法:SVD分解 把获得的奇异值,取其中比较大的(类同特征值提取的压缩方法)
奇异值,舍去较小的奇异值,以达到数字图像压缩的目的。
若考虑图像的局部平稳性,也可以对图像分块奇异值分解去噪,这样能在一定程度上保护图像的边缘细节。
低于门限的奇异值置为0.a.k.a截断奇异值分解=有损压缩.
奇异值分解
定义:Am×n=UΣVT
其中 U 是 m 阶正交矩阵。V 是 n 阶正交矩阵,
Σ 是由降序排列的非负的对角线元素组成m×n对角矩阵;
对角矩阵上的元素称为矩阵的奇异值.
U 的列向量称为左奇异向量,V的列向量称为右奇异向量。
虚线与截断,截断以后有了进一步约束;
完全奇异值分解;
任何一个矩阵总能构造一个奇异值分解,矩阵的奇异值分解是不唯一的;
当m=n时,即考虑方阵的对角化.
几何解释
从线性变换的角度理解奇异值分解,m × n矩阵 A 表示从 n 维空间Rn 到 m 维空间 Rm的一个线性变换;
该线性变换可以分为如下3种变换:
1-2-U,vT是正交矩阵表示成旋转或反射;
3-Σ是坐标轴的缩放变换;
先VT对x进行旋转或反射,再变基,转化完基以后,再反射;
对于 SVD 来说,分别改变了Rn 和 Rm 两个空间的基底。
而特征分解仅仅是在同一个空间中做变换。
- 正交矩阵的线性变换意义是旋转或反射变换.
奇异值分解的存在性定理保证奇异值分解一定是存在的.
紧奇异值分解和截断奇异值分解
紧奇异值分解与原始矩阵等rank,Um×r
A=UrΣrVTr,其中Σr是r阶对角矩阵,Ur是完全奇异值分解中U的前r列.
在上面的例子中,如果我们取其中两个非0的奇异值,则得到了阶段奇异值分解
截断奇异值分解比原始矩阵低rank,分解降到rank=k,k<r,Um×k其中 U∈Rm×k, V∈Rn×k,Σr是 k 阶对角矩阵;
矩阵Ur 由完全奇异值分解中 U 的前 k列、矩阵 Σk 由 Σ 的前 k 个对角线元素得到,紧奇异值分解的对角矩阵 Σ*k* 的秩比原始矩阵 A 的秩低。
在实际应用中,常常需要对矩阵的数据进行压缩,将其近似表示,奇异值分解提供了一种方法。
后面将要叙述,奇异值分解是在平方损失意义下对矩阵的最优近似。
紧奇异值对应着无损压缩,
截断奇异值分解对应着有损压缩,截断奇异值分解会很大的减少计算量.
奇异值分解存在性定理
对于对称矩阵来说,奇异值分解总是存在的。因为,我们知道如果 A 是对称矩阵,那么存在一个正交矩阵 P 使得 A 有特征分解A=PΣPT;
此时我们令 U = P = V 那么就有
A=UΣVT
所以对称矩阵的奇异值分解就是他们的特征分解。
即奇异值分解一定可以保证存在性,不一定可以保证唯一性;
奇异值分解的计算
即先求ATA的特征值和特好着呢个响亮,特征值的平方根为奇异值.
求正奇异值对应的左奇异向量,再求扩充的AT的标准正交基,即A的左零空间的标准正交基.
基于A的正奇异值计算可得到列向量.A的左零空间的标准正交基.
ATA=VΣVT,ATA是一个n阶的实对称矩阵
对任意一个长方形矩阵,我们都可以构造一个对称正半定矩阵的:
由非方阵,我们总是可以得到一个对称矩阵,不仅是一个对称矩阵,更是一个正半定矩阵;
即ATA是一个正半定矩阵;
A=UΣVT,u1,u2,…,ur是Col(A)的一组标准正交基;
ur+1,um是A的左零空间的一组标准正交基;
v1,v2,…vr是ATA的正特征值对应的特征向量,vr+1,…,vn为特征值0的特征向量;
SVD 分解的algorithm:
奇异值分解定理的证明的过程蕴含了奇异值分解的计算方法。
矩阵 A 的奇异值分解可以通过求对称矩阵 ATA的特征值和特征向量得到。ATA* 的特征向量构成正交矩阵的列;ATA 的特征值 λ*j 的平方根为奇异值 σ**j 即
σ**j = √λ*j
对奇异值由大到小排列作为对角线元素,构成对角矩阵 Σ;
求正奇异值对应的左奇异向量,再求扩充的 AT 的标准正交基,构成正交矩阵 U 的列。从而得到 A 的奇异值分解.
A = UΣVT
奇异值分解的性质.
ATA.AAT的特征分解存在,且可以由矩阵A的奇异值分解的矩阵表示.
V的列向量是ATA的特征向量;
U的列向量是AAT的特征向量.
Σ是奇异值是这两个正半定矩阵的特征值的平方根
奇异值分解中,奇异值是唯一的,而两个正交矩阵U,V不是唯一的.