真正理解SVD直观的核心理念

今天,奇异值分解已经通过许多科学分支传播,特别是心理学和社会学、气候和大气科学以及天文学。它在机器学习以及描述性和预测性统计中也非常有用。

历史

奇异值分解技术(简称SVD)具有长期且有些令人惊讶的历史。它开始于社会科学与智力测试。早期的情报研究人员指出,用于衡量智力的不同方面的测试,例如口头和空间,通常是密切相关的。

因此,他们假设有一个共同的智力的一般衡量标准,他们称之为“g”,因为“一般情报”,现在通常被称为“智商”,所以他们着手解释构成的不同因素智力,以便拉出最重要的一个。

今天,奇异值分解已经通过许多科学分支传播,特别是心理学和社会学,气候和大气科学以及天文学。它在机器学习以及描述性和预测性统计中也非常有用。

力学的启发

回顾基本力学,力的分解是力的合成的逆运算,求一个力的分力的过程,同样遵守平行四边形法则。如果分解后的两个力是互相垂直的,就类似于坐标分解,一般可有无数种分法,如图所示。

所以,任何力矢量都可以沿x轴和y轴分解为其组件

令人失望的是,几乎所有网上SVD方面的博客都讲的使其比必要的更复杂,而核心思想是非常简单的。

SVD只不过是将矢量分解为正交轴 - 我们只是认为它可能需要更堂皇的名称。

让我们看看情况如何。

当矢量a被分解时,我们得到3个信息:

第一、 投影方向单元矢量(v ₁v ₂)我们进行矢量分解的方向。在上面它们是x和y轴,但可以是任何其他正交轴。

第二长度投影(线段sa1sa2),这告诉我们有多少矢量被包含在投影的各个方向(a在v₁比在v₂上的投影更多,因此,sa1>sa2)。

第三、矢量投影(矢量pa1pa2),用于重建原始矢量的分量(矢量和为原始矢量),以及用于其可以很容易地验证pa1 = sa1* v₁pa2= sa2* v₂ ,很容易从以前的2个推断出来。

关键结论:

任何向量都可以用下式表示:

1.投影方向单位向量(v 1,v 2,...)。

2.投影到它们上面的长度(sₐ1,sₐ2,......)。

SVD所做的就是将这个结论扩展到多个向量(或点)和所有维度:

这是数据集的一个示例,一个点可以被认为是从原点出发的矢量。但是要处理这么多数据就是一个比较棘手的混乱。

如何处理这个混乱

如果不先处理单个向量,我们就无法处理这个混乱!

数学中的许多概括,主要使用矩阵。因此,我们必须找到一种方法来表示使用矩阵的向量分解的操作。

事实证明这是很自然的事情:

与之前的数字相同,但通过倾斜投影轴,来表明不限于x和y。aₓ和aᵧ是向量a的坐标,按照惯例放入列矩阵(列向量)。对于v1和v2也是如此。

我们想要沿着单位矢量v 1v 2分解或者说投影矢量a

该投影是由点积来实现的 ,它为我们提供了长度投影sa1和sa2:

将a投射到v1和v2上。

但是如果我们可以利用矩阵,那么效率是出色的......

通过为每个单位矢量添加更多的列,一次写入两个方程式。

我们甚至可以添加更多点......

添加一个额外的行就相当于添加了点S是包含投影长度的矩阵。

在添加点b之后,它就是这样的样子:

现在可以很容易地推广到任意数量的点和维度

n =点的个数;

d =维度大小;

A =包含点的矩阵;

V =包含分解轴的矩阵;

S =包含投影长度的矩阵。

下面的动态很好的体现了数学优雅:

总结概括:

在这种情况下,点积只是普通的矩阵乘法

这就是说:

因为V列是正交的,所以它的逆=它的转置(正交矩阵的属性)。

这就是SVD的关键结论:

任何一组矢量(A)可以用其在某组正交轴(V)上的投影长度(S)表示。

传统的SVD公式说:

但这只是意味着我们想看看如何:

这就是接下来需要我们推导的。

如果仔细查看矩阵S,您会发现它包括:

事实证明(出于后面会看到的原因)我们最好能够对这些列向量进行归一化,即使它们具有单位长度

这是通过相当于将每个列向量除以其大小来完成的,以矩阵形式

看一个例子,来看看这个'分裂'的事情是如何完成的。

假设我们想将M第1列除以2。要求必须乘以另一个矩阵来保持恒等:

可以直接验证未知矩阵只不过是单位矩阵,第1行第1列被除数2替换

第二列除以3现在变成了直接的事-只需用元素3有来更换单位阵第2行第2列

应该明白如何将此操作推广到任何大小的任何矩阵。

现在,我们要在上面的'除法'的概念应用到矩阵。

为了标准化S的列,我们将它们除以它们的大小......

.通过使用S,我们在上面的例子中用M做了什么:

最后得到:

这不就是奇异值分解的形式吗?

解释

我们来谈谈这个UΣ ......

σ是什么?为什么我们要把S标准化来找到它们?

由上面我们已经知道,σ是所有点在单位矢量vᵢ投影长度的平方和的平方根。

这是什么意思?

红色部分= 向量在v1上的投影。蓝色部分= 向量在v2上的投影。点越接近特定投影轴,相应σ的值越大。

因为σ在其定义中包含特定轴上的投影长度之和,因此它们表示所有点与该轴的接近程度。

例如,如果σ1>σ2,那么大多数点比v2更接近v1,反之亦然。

这在SVD的无数应用中具有巨大的实用性。

主要应用

找到矩阵的SVD分解的算法并不是不随机选择投影方向(矩阵V的列)的。

他们选择要投影的向量作为数据集的主成分(矩阵A)。

它们是变化最大的线(最大方差)。

特征降维的目的是把数据集投影到方差最大的线(或平面)

洋红色:投射前的点。紫罗兰:投影后的点(维数减少)。

现在,使用SVD投影数据集的行为变得非常简单,因为所有点都已经在所有主成分(vᵢ单位向量)上投影(分解):

因此,例如,将数据集投影到第一个主成分上......

现在,我们要做的就是删除与第一主成分无关的所有列。现在A'中的投影数据集 。

将两个矩阵(上面的S和Vᵀ)相乘得到包含投影点的矩阵A'

(0)

相关推荐

  • 深度学习和计算机视觉中的基础数学知识(一)

    2.1 线性变换与非线性变换 2-1叫相加性,2-2叫齐性 2.1.2 旋转.缩放与矩阵乘法 旋转坐标 矩阵形式 缩放坐标的矩阵形式(B → \to →C) 2.1.3 点积和投影 点积定义: 两个向 ...

  • Python-EEG工具库MNE中文教程(10)-信号空间投影SSP数学原理

    更多技术,第一时间送达 projector(投影)和投影背景 projector(投影)(简称proj),也称为信号空间投影(SSP),定义了应用于空间上的EEG或MEG数据的线性操作. 可以将该操作 ...

  • 基于正交投影的点云局部特征

    重磅干货,第一时间送达 由于点云具有无序,不规则,无拓扑结构的特点,因此可以利用多个二维图像通过三维到二维投影来表示三维点云的几何特征.用图像表示特征可以提供稳定的信息,多个投影角度可以弥补投影过程中 ...

  • 管理体系的核心理念

    管理体系继承了质量管理的经典管理理念经过几十年的发展和实践,一些现代的管理理念也在管理体系中得到应用.运用过程方法.采用PDCA循环.建立风险管理思维.追求持续成功.关注绩效.以顾客为关注焦点.领导作 ...

  • 孟子人性思想的核心理念

    "孟子道性善",以孟子人性思想为性善论,无疑是正确的.但性善只是孟子对人性的具体认识,只是他整个人性思想的一个结论.只说到性善,不对孟子提出这一结论的理依据做深入的研寻探讨,就不可 ...

  • 10大要点,全面了解管理体系的核心理念

    管理体系继承了质量管理的经典管理理念经过几十年的发展和实践,一些现代的管理理念也在管理体系中得到应用.运用过程方法.采用PDCA循环.建立风险管理思维.追求持续成功.关注绩效.以顾客为关注焦点.领导作 ...

  • 理解交易系统的真正核心

    理解交易系统的真正核心

  • 交易取胜的核心理念是赚大赔小;亏钱的根本因素无非是赚小赔大

    交易的生存之道,即赚大赔小,也是交易的核心理念,只有拥有这样的投资思维方式,才能持续不断的生存,金钱不过是保持记录的唯一方法罢了. 而无数投资者赔钱的根本原因,无非就是赔大赚小,而做不到赚大赔小,也是 ...

  • 价值投资的4个核心理念

    今天市场迎来了止跌反弹,让大家松了一口气.然后,却仍有一群人对今天的大涨表示非常不高兴,因为他们在前几天选择了技术止损. 这一波大跌,创业板从最高位置一度下跌了25%,达到了所谓"技术性熊市 ...

  • 八字中地支相穿的核心理念, 以及断事的技巧

    在地支所以关系中,最凶实属穿,有些书上也称为害,它与冲克破不一样,冲只是一种动,一种撞击的象,而穿是速度极快的一种穿射,代表着仇恨,报复,目标明确,难以躲避,手段狠毒等等意象,但凡局中带穿者,必然有应 ...

  • 宝可梦主题联动鲤鱼王金银项坠登场!任天堂的核心理念始终就是全家娱乐!

    任天堂将上线<动森>特有存档备份转移功能 随着游戏发售日的临近,任天堂官方又分享了一批新信息,其中就包括了部分玩家十分在意的备份存档功能细节.以下为Dengeki Online对任天堂的采 ...

  • 吴甘霖《核心理念》

    我们的追求: 智慧点灯 图强济世 我们的基本态度: 让别人去膜拜知识,我们崇尚智慧 我们的基本理念: 用智慧统率知识 我们对生命的理解: 死亡使世界上一切的平凡都变得不平凡.每个活着的人都只有一个问题 ...