现实中的“幽灵”,量子纠缠的数学解释和理论细节

在这篇文章中,我打算概述最典型的量子现象之一——纠缠的理论基础。我的目标是让那些对数学和(非常基础的)线性代数有基本了解的人都能完全理解。因此,本文的大部分内容将从数学的角度全面理解量子纠缠所需要的背景知识。这些工具来自量子力学(例如,量子态,叠加,可观察)和数学(例如,复数,张量乘积,特征向量)世界。我将从数学概念开始,然后是量子力学概念,最后是对结合一切的纠缠的描述。

数学

在这一节,我将介绍几个数学概念,这是理解量子纠缠的基础。应该指出的是,这些概念并不是包罗万象的。在量子力学中还有很多其他重要的数学,但在这篇文章中不会涉及。为了简单起见,我将重点介绍所需的最低限度的数学概念,但尝试深入地介绍它们。
复数
与纠缠有关的第一个数学概念是复数。一个复数可以表示为:
在这个方程中,z是复数,而a和b是实数系数。在等式的右边,a被称为z的“实部”,而ib被称为“虚部”。
复共轭和大小
一旦你理解了复数,理解它们的两个重要运算也很容易:复数共轭和求大小。要求一个复数z的共轭复数,只需把虚部的符号反过来。例如,给定上面z的表达式,z的复共轭可表示为(即复共轭运算用z上的上划线表示):
如果你掌握了复数共轭,那么求一个复数的大小也不会复杂。特别地,求大小需要用复数乘以它的共轭复数,然后求乘积的平方根。这个表达式采用以下形式:
如上所示,一个负数乘以它的共轭复数总是得到一个实数结果。从这个复数主要运算的基本定义,可以对复数的性质有一个基本的了解。想了解更多的细节,可以阅读我的这篇文章现实边缘的数字,从四元数到八元数,将成为解决物理学困境的关键
复数的极坐标表示
虽然一个复数的基本形式并不难掌握,但困惑源于人们可能遇到的不同形式的复数。在某些情况下,人们可能会遇到如下所示的极坐标形式的复数,其中等式(i)是欧拉公式的结果。
在上面的形式中,r编码了复数的大小,将z乘以任何r = 1的复数(这通常被称为“相位因子”)不会改变z的大小,因为当z乘以这个复数时,r的值将保持不变。理解相位因子对于理解量子力学概念是很重要,因为它们可能出现在许多情况下(例如,相位因子可以用来解释为什么量子位只有两个自由变量表示)。
复数向量
一旦你理解了复数,复数的向量也就没什么不同了。事实上,在量子力学中理解这些矢量的主要特点通常是学习如何表示它们。首先,我们可以开始构造一个n维的复列向量,如下所示。
对于任何不熟悉量子力学的人来说,这种表示(即,用尖括号和尖括号表示向量)可能看起来很奇怪。然而,上面所示的向量表示法只是量子力学中表示列向量的一种常用方法,它是由保罗·狄拉克发明并推广的。我们将上面所示的括号向量称为“ket”向量。Ket符号是表示n维列向量的常用方法,其中向量中的每一项都是复数。但是,为什么我们叫它ket呢?如果我们定义一个“ket”向量的对偶——“bra”向量(行向量),这个命名就会变得更加清晰。
可以看出,每个ket向量(即n维复向量空间中的列向量)都有一个对应的“bra”向量,它是等维的行向量。给定任意的ket向量,其对应的bra向量可以通过对ket向量求共轭转置得到(即向量的转置,取向量中每一项的复共轭),用上式中的匕首上标表示。因此,每个列向量(或称ket)在bra向量的对偶空间中都有相应的行向量。在量子力学中,我们总是使用“bras”和“kets”(bracket)的构造来表示复向量。例如,量子力学系统的状态通常表示为一个n维的ket向量。
内积
bras和kets的概念使得复向量的内积的符号非常简单和直观。下面的例子演示了任意bra和ket向量的内积。注意,必须计算行向量和列向量之间的内积。我们表示“bra”和“ket”的方式使这很容易记住。
同样,用bras和kets的内积运算可以很容易地计算出复向量的大小,参见下面(我使用平方大小来避免在整个方程中写一堆平方根)。
特征向量,特征值,和基
除了上面提供的复向量空间的简单解释外,线性代数中的几个概念对于理解纠缠和一般的量子力学是很有用的。第一个概念是基。给定一个n维复向量空间,一个基是由空间内n个线性无关的向量组成的集合。我们称这个向量集合为基因为空间中的任何向量都可以写成基中的向量的线性组合。换句话说,基张成了整个n维复向量空间。
线性代数中另一个有用的概念是线性算子(如矩阵)的特征值和特征向量的概念。给定某个线性算子,该算子的特征值和特征向量可以用下面的恒等式来定义。
如上所述,特征向量只是一个向量,线性算子的应用将其简化为与常数相乘。这个乘法中的常数是特征向量的相关特征值。对于一个线性算子,这样的特征向量可能存在很多,但是不会有超过z个正交特征向量存在,其中z是线性算子的列数和行数的最小值。
克罗内克积
克罗内克积是应用于任意大小的两个线性算子上的运算。通俗地说,它是外积在矩阵空间中的推广。克罗内克积可以形式化如下图所示。
换句话说,克罗内克积取大小为(m x n)和(p x t)的输入线性算子,然后输出一个维数为(mp x nt)的块矩阵。克罗内克积的可视化如下图所示。
克罗内克积并不难理解。此外,应该注意的是,克罗内克积也可以应用于向量(即输入具有任意维数),如下图所示。
克罗内克积——以及类似的张量积——实际上在许多不同的情况下都会出现。例如,给定两个量子态(例如,自旋态或量子位元),这些量子态可以通过取其状态向量的克罗内克组合成一个单一的系统。类似地,给定两个观测值(即厄米特算子),这些观测值可以用克罗内克积在一个多粒子系统上组合成一个单一的观测值。然而,因为我们没有引入任何量子态、可观察态或量子系统的概念,很可能这些句子都没有任何意义。所以,让我们来学习一些基本的量子力学吧。

量子

在这一节中,我将对量子力学的基本思想进行简短的介绍。同样,我只介绍在高层次上理解纠缠所必需的最小概念。因此,对量子力学概念的介绍绝不是详尽无遗的。
一个简单的声明
对于那些不熟悉量子力学的人来说,这一节中概述的概念会有些令人费解。总的来说,量子力学研究的是非常小的物体的行为,这与我们人类对周围世界的感知截然不同。因此,这种行为常常是违反直觉的。量子系统行为最令人困惑的方面是它们具有不确定性(也就是说,受概率控制)。这种不确定的行为在经典力学中没有意义。例如,如果我们连续多次测量一个物体的质量,我们期望每次都得到相同的结果。在量子力学中,系统的状态和系统的测量之间的关系是根本不同的。
量子态
量子态从根本上不同于经典态,知道量子态并不意味着我们知道它的一切,这种状态的行为是不确定的,我们只能知道与这种状态的不同可能性相关联的概率。一般来说,最简单的量子态就是一个ket。记住这一点,一个量子态可以写成关于一些基,如下:
在这个等式中有一些重要的东西需要理解。首先,构成基的集合(即上面等式右边的向量)都是相互正交的。此外,所有的系数(即上面等式中的标量)都是简单的复数。我们通常将这些系数称为“概率振幅”(稍后将对此进行解释)。因此,我们在这个方程中所做的就是把量子态写成在复向量空间中形成任意基的集合的线性组合。因为我们的量子态只是一个向量,这没有什么特别的。从前面的讨论中,你应该知道向量空间中的任何向量都可以被表示成构成该空间中的基的向量的线性组合。
测量
量子态的有趣之处在于我们如何选择基。特别地,我们构造这个基,使它的每个向量代表我们系统的一个可能的状态。因此,量子态仅仅是其可能状态的线性组合。尽管这种说法可能看起来很荒谬,但请记住,在我们的量子态和我们测量量子态时得到的结果之间存在着巨大的差异。也就是说,测量的结果将不是可能状态的线性组合。相反,它是基中的一个向量。当我们测量量子态时,这种测量将导致状态“坍缩”为其基上的一种状态(也就是说,测量会扰乱状态,使它变成别的状态)。哪一个?这个问题的答案是不确定的。但是,我们可以得到概率,量子态在它的基础上坍缩到任何一种状态如下:
如上所示,在测量的基础上,量子态崩溃到某一状态的概率是由与该状态相关的概率振幅的平方给出的。所以,虽然概率振幅不是概率,但它们的大小用来表示与量子态测量相关的概率,从而揭示了为什么我们称它们为概率振幅。因为我们的量子系统中的概率如上所示,我们一般假设量子态是一个单位向量(即,使概率和为1),从而得到如下所示的等式:
叠加
如果你仔细理解上面的部分,你会注意到量子态定义中一个非常重要的细节。当我们测量量子态,它有一定的概率存在于任何基态中(尽管其中一些概率可能是0)。换句话说,如果量子态是一个n维复矢量,这个单一的状态可以同时表示n种不同的状态!这个概念是量子力学的基础,叫做叠加。在经典系统中,我们的状态必须存在于一种可能的状态中(例如,计算机中的比特不能同时是1和0),而在量子系统中,状态可以以一定的概率同时处于多个状态。然而,当我们测量这个量子态时,它必须坍缩成它的基上的可能状态之一。
连续测量
一旦我们测量一个量子态,这个态就会坍缩成一个新的态,对应于一个基向量。那么,如果我们第二次对我们的状态进行同样的测量会发生什么呢?我们100%会得到相同的结果。为什么?在我们第一次测量我们的状态之后,假设(不失一般性)这个状态在基中坍缩为第i个向量。那么,我们新的量子态表示如下:
显然,对上面显示的量子态进行同样的测量将产生一个确定的结果。这突出了量子力学中一个非常重要的问题。一旦我们对我们的量子态进行测量,状态就会坍缩成不同的状态(也就是说,由于测量,状态会被修改)。因此,我们在量子力学中进行测量的顺序和方式是非常重要的。如果我们想要对我们原始的量子态进行重复测量,我们就必须在每次测量之前“准备”这个量子态(即,构造一个以某种方式存在于相同叠加中的量子态)。
量子态的例子,量子位元
为了巩固量子态的概念,给出一个量子系统的具体例子是有用的,这个量子系统有点简单,但在现代研究中非常有用——量子比特,或“qubit”。在经典的计算机中,我们有位的概念,它对应于0或1的值。每个比特必须存在于这两种可能的状态中的一种,并且许多比特可以组合在一起形成复杂的计算机系统。位元的可能状态可以很容易地表示为:
量子比特与比特相似,因为它具有相同的基态。然而,对于量子位,我们考虑复向量空间(与实向量空间相对)。单个量子位可以这样表示:
在这个方程中,基向量的定义与比特相同。此外,如果我们测量一个量子位,结果将是0或1。然而,量子位元可以以这些可能状态的叠加形式存在,这使得它可以比经典位元编码更多的信息。这样的一个系统可以在叫做布洛赫球的东西中被可视化,如下图所示。
可见(测量)
基于到目前为止给出的量子态的定义和测量,你可能会认为可能的状态(即我们用来写量子态的基础)一定是凭空而来的。当我们测量时,我们怎么知道可能的状态是什么?这个问题在量子力学中可以用可观察的概念来回答(有时它被称为可测量的)。这个名字很好地解释了这是什么——可测量(或可观测)代表了量子系统中可以测量的量。具体而言,可测量为厄密线性算子,如下式所示:
从上面的方程可以看出,厄米矩阵就是等于它的共轭转置的矩阵。这种形式的矩阵有一些有用的性质。首先,厄密矩阵的所有特征值都必须是实值。此外,厄米矩阵的特征向量是一个完整的集合(即形成一个标准正交基)。在上面的等式中,这些性质意味着算子H有一组归一化特征向量,这些特征向量构成复向量的n维空间的基。因此,这个空间中的任何向量都可以写成这个厄米特算子的特征向量的线性组合。因此,给定一个可观察对象(即厄米特算符),我们就可以以熟悉的方式展开给我们的任何量子态。
上面的方程与量子态解释中给出的方程完全相同。然而,现在应该从一个稍微不同的角度来看待这个表示。给定一些任意的量子态,我们可以将其展开为与某些可观察到的特征向量的线性组合。然后,这些特征向量对应于可能的状态,量子态可能会在对上述可观察对象进行测量后崩溃。该测量的可能输出(即得到的结果)是可观察到的特征值。具体来说,在进行测量后,无论坍缩到哪个状态,其对应的特征值都会被测量。由于厄米特算子的特征值已知是实值,测量的结果将是一个实值。
我们如何知道我们的测量结果会是什么?
这个问题的答案是不确定的。然而,正如我们从先前关于测量的讨论中所知道的,我们可以很容易地推导出量子态坍缩为某种基态的概率。给定一些具有相关特征向量的可观察对象,我们可以首先将量子态展开为这个可观察对象的特征向量的线性组合。然后,坍缩到任何给定状态的概率,由与这个状态相关的概率振幅的平方给出:
创建一个多量子位系统
在继续解释纠缠之前,理解量子力学中简单的系统如何组合成复杂的系统是很重要的。一般来说,多个系统可以通过克罗内克积来组合在一起。因为这个陈述很模糊,我将使用一个具体的例子来提供更好的解释。
从前面的讨论中,我们知道了如何表示单个量子位元。然而,如果我们在一个系统中有两个量子位呢?让我们首先考虑在这个双量子位系统上进行测量的可能结果。如果我们知道测量的可能结果(即我们的组合系统的基状态),那么我们可以把两个量子比特系统的任何状态写成这些基状态的线性组合。因为每个量子位可能提供0或1的测量,我们有以下测量的可能性:00、01、10和11。我们可以构造这些组合状态的向量表示,方法是取它们各分量的克罗内克积。这如下式所示,其中构造了一个二量子位系统的所有可能状态:
注意这些状态构成了复向量的四维空间的基。上面显示的状态揭示了一个更普遍的模式,即一个有n个量子位元的系统,可以表示2^n种状态(在上面的情况下,有2²= 4种可能的状态)。考虑到两个量子比特系统的这些可能状态,这个组合系统中的量子状态可以很容易地表示为:
一旦我们构建了如上所示的量子态,到目前为止我们学到的一切都适用(它与我们到目前为止所讨论的一般量子系统没有任何不同)。因此,我们现在知道了如何将更小的系统组合成更复杂的系统。理解这个概念对于真正掌握纠缠的概念是至关重要的。
复杂系统的可观测值
如果我们想将较小系统的可观测对象组合成一个组合系统的单个可观测对象,我们将取它们的克罗内克积。例如,单个量子位系统的恒等运算符(即,这是一个厄米矩阵,因此是一个可观察的)是一个2x2矩阵。为了形成一个两个量子位系统的单位算子,我们将取两个单位算子的克罗内克乘积,形成一个4x4单位矩阵。这个4x4单位矩阵是两个量子位组合系统的单位运算符。类似的逻辑也适用于不同类型的可观察对象。

纠缠

现在,我们终于对量子力学有了足够的了解,对量子纠缠有了基本的了解。量子纠缠理论假设存在一个复杂的系统,由几个更小的组分组成。我们刚刚概述了量子系统是如何结合在一起的,我将继续使用相同的示例——一个多量子位系统——来解释纠缠。我将从引入乘积态的概念开始。换句话说,乘积态是一个组合系统可以存在的最简单的状态。它是由系统内各个组分状态的乘积形成的。例如,请看下面的等式,它将两个单独的量子位态结合在一起,形成一个两个量子位系统的乘积态:
在上面的方程中,前两行表示单个量子位元的量子态,最后一行表示乘积态。积态是由两个单独量子态的积形成的。在这种情况下,取不同量子位量子态的乘积,生成一个二量子位系统的积态。在这个方程中,积态矢量中的每一个项都对应于两个量子位系统中每个基态的概率振幅。有趣的是,如果仔细检查积态,就会发现测量两个量子位系统的任何一个组成部分的概率是独立的。要理解这一点,请看下面的表格,我使用了完全相同的乘积态,但是给上面显示的概率振幅指定了具体的值。表中的所有值表示基状态的测量概率(即,基状态列在每个条目的左上角):
检查上表中的积态,在组合系统中测量第一个量子位的概率为0(或1)是0.5(即,与单独测量量子位的概率相同)。同样的观察也适用于第二个量子位。仔细检查上述积态后,可以清楚地看出,如果第一个量子位被测为0(不失一般性),第二个量子位被测为0(或1)的概率仍然是0.5。换句话说,在组合系统中测量一个量子位不会给我们任何关于另一个量子位值的额外信息。在组合系统中,两个量子位元的测量概率并不相互依赖——不存在纠缠。乘积状态的这一特性源于这样一个事实,即乘积态中的所有概率振幅都表示为其每个独立分量的概率振幅的乘积。然而,在一个组合系统中构造状态是可能的,而这种状态不能表示为乘积态。例如,考虑以下两个量子位系统的状态:
如果你尝试很长时间,你会意识到,以上两个量子位量子态不能表示为单个量子位态的乘积。我们将其称为“非积态”,上面所示的非积态的向量表示可以在下面的方程中看到:
如果我们考虑上述量子态的测量概率,我们会注意到一些有趣的事情。假设我们对第一个量子位进行测量,它会坍缩为0。如果我们测量第二个量子位,我们会得到什么结果?有趣的是,当测量第二个量子位时,有100%的可能会崩溃为0如果第一个量子位压缩为1,就会出现类似但相反的现象。换句话说,一旦我们测量了第一个量子位,第二个量子位的状态就知道了——我们的两个量子位系统中的量子位是纠缠的。
因此,通过这个例子,我们对纠缠的意义有了一个基本的理论理解。也就是说,纠缠量子态是那些不能被表达为其单个组件的积,导致系统组件的测量相互依赖(即,测量系统的一个组件将提供关于其他组件的额外信息)。显然,这个想法超出了上面给出的两个量子位元的例子,并且可以在日益复杂的量子力学系统中观察到。
虽然第一眼看上去纠缠态并不令人印象深刻,但意识到系统的纠缠态并不依赖于距离是很重要的。因此,如果我们像上面所示的那样准备一个两个量子位的状态,然后把我们系统中的每个量子位都移得非常远(例如,假设我们把包含第二个量子位信息的设备运到火星上,而把另一个留在地球上)。一旦我们测量了第一个量子位元,第二个量子位元的状态就会立即被确定。因此,当第一个量子位被测量时,这个信息的传播速度就比光速快,这被爱因斯坦描述为“远距离的幽灵行为”。尽管这看起来可能很荒谬,但量子纠缠的这些特性已经被实验验证,证明了现实的本质与我们所感知到的有些不同。例如,这是否意味着瞬间移动是可能的?

结论

总而言之,纠缠态可以被描述为一个量子态(由多个更小的组分组成)测量概率相互依赖。系统的成分相互纠缠,导致一个成分的测量结果影响系统中其他成分的测量结果。
(0)

相关推荐