近日,一位华人统计学博士后部分解决了两大数学难题:Bourgain 截面问题与 KLS 猜想,获得数学领域知名学者的高度赞美!华人博士后Yuansi Chen(以下简称“Chen”),本科就读于法国巴黎综合理工学院应用数学专业,2019年从UC Berkeley取得统计学博士学位(导师为Bin Yu),目前在瑞士数据科学基金会(ETH Foundations of Data Science)担任博士后。今年春天,Yuansi Chen将加入杜克大学统计科学学院担任助理教授。图注:Yuansi Chen(来源:Quanta Magazine)Bourgain截面问题与KLS猜想,听起来似乎有点不知所云太过晦涩。因此,在这篇文章中,AI科技评论将用通俗和专业的方式来介绍Yuansi Chen的研究突破,读者可按照个人兴趣选择食用。
通俗版:搓汤圆猜想
给你1克面团,搓成一个汤圆,随便你搓成什么形状,然后将其一刀切成各0.5克的两个小半汤圆。然后,我要你证明:小半汤圆的切面面积最小不会是零。对了,这里还要提一个条件,不管搓成什么形状,汤圆都得保持凸多面体的形状,并且体积恒定。并且你已经学会了雷之呼吸,切汤圆就像切西瓜那样利索,汤圆不会变形。什么是凸多面体?简单来说,如果多面体在它们每一面所决定的平面的同一侧,则称此多面体为凸多面体。就像下图中所示的图形:在这个图形里,你沿着平行于汤圆的任何一个表面切一刀,汤圆都不会被一分为二。如果我要得到一个无限小的切面,我只需要把汤圆搓成一个中间无限窄的哑铃形状,就像细胞分裂那样。但是,这样就不能满足汤圆保持凸多面体的条件了。另外,我也可以这样,我在一个方向上把汤圆搓得更细,再换另一个方向,再换另一个方向,这样汤圆就能保持凸多面体了。最后,汤圆变成了一个体积无限小的黑洞,切面面积为零。,再见~什么?这个问题三十多年还没被解决?那我得赶紧把上面的证明写成论文投出去,为数学做出伟大贡献......但是,数学哪有那么简单。在数学史上,很多看似简单的猜想,其证明过程都非常艰难。比如,欧几里得空间中最小表面积的单位体积形状问题,古希腊人(大约在公元前150年)知道了问题的答案,是球体。但直到1838年,Jakob Steiner才发现了一个证明。在拓扑学中,若尔当曲线定理指出,说明平面上每一条闭合不相交曲线都把平面分成一个“内部”区域和一个“外部”区域。怎么样,是不是又有一种“这也需要证明?”、“我也能证明!”的错觉?第一个给出证明的是卡米尔·若尔当,该定理就是以他命名的(后来发现他的证明仍有漏洞)。超过半个世纪之后,奥斯瓦尔德·维布伦最终在1905年给出了一个满意和严格的证明。这个问题难在哪里呢?难在它需要考虑所有类型的闭合不相交曲线。不只是我们直观上在脑子里会想到的圆、椭圆、正方形,还有科赫曲线、皮亚诺曲线等等极端案例。还有,三维庞加莱猜想指出三维单连通闭流形都同胚于三维球面。简单来说就是:每一个没有破洞的封闭三维物体,都拓扑等价于三维的球面。粗浅的比喻即为:如果我们伸缩围绕一个柳橙表面的橡皮筋,那么我们可以既不扯断它,也不让它离开表面,使它慢慢移动收缩为一个点;另一方面,如果我们想象同样的橡皮筋以适当的方向被伸缩在一个甜甜圈表面上,那么不扯断橡皮筋或者甜甜圈,是没有办法把它不离开表面而又收缩到一点的。我们说,柳橙表面是“单连通的”,而甜甜圈表面则不是。先不说形状表述的完备问题,若将问题扩展到四维空间,猜想是否仍然成立呢?事实上,包含所有维度的完整猜想历经百年才由佩雷尔曼解决。上文我们讨论的搓汤圆问题也跟高维空间有关。数学家认为,在高维空间中可能存在扭曲但同时满足凸多面体条件的哑铃形汤圆,使得最小切面为无限小。然而,Chen证明了,这样的哑铃形状是不存在的,从而使得Bourgain 截面问题和KLS猜想的最终证明又推进了一大步。此外,Chen的结果也对机器学习算法的加速有重要意义。
专业版:Bourgain 截面问题是什么?
1984年,著名数学家 Jean Bourgain (曾获得1994年菲尔兹奖)提出了一个关于高维形状的简单问题,并在这个问题的研究上付出了一生的时间,都没有解答出来。
Bourgain提出的截面问题是:是否存在c> 0,从而对于任意维度n和任意体积为1的中心对称凸体K ,都存在一个超平面H,使得K∩H的(n −1)维体积至少是c?简单解释,就是:假设一个凸形的体积为 1,使用低一维的平面对该形状进行切割,得到的截面面积是否都极小,或至少有一个截面的面积特别大?当时,Bourgain猜测,如果
,那么答案是肯定的。
也就是说,一些低维截面的表面积必须足够大。而且,他猜想存在一个与维度无关的通用常数,使每一个形状都包含至少一个面积大于该常数的截面。乍一看,Bourgain的猜想似乎一定是正确的,毕竟,如果该凸形在每个方向上都非常“瘦”,不然怎么构成一个体积单位?证明该猜想的难度在于:高维形状常常以藐视我们人类低维直觉的方式存在。例如,在10维以上的维度中,有可能搭建一个立方体和一个球,立方体的体积比球的体积大,但立方体的中心截面面积却比球体中心对应截面的面积要小。高维凸形不仅是纯数学家的主要研究课题,也是统计学家、机器学习研究员和其他处理高维数据集的计算机科学家的重要研究对象。自Bourgain提出问题后,以色列魏茨曼科学研究院(Weizmann Institute of Science)的研究员Milman与Bo’az Klartag 也在该问题上钻研了很长时间,并将该问题称之为理解高维凸形(high-dimensional cortex shapes)的“入门课”。但近日,Bourgain的猜想已经取得了重大突破:华人统计学博士后 Yuansi Chen 在去年11月于 arXiv 上发表了一篇论文“An Almost Constant Lower Bound of the Isoperimetric Coefficient in the KLS Conjecture”,通过KLS猜想(一个涉及凸形几何的更深远问题)来解决 Bourgain 截面问题。
论文链接:https://arxiv.org/pdf/2011.13661.pdf结合以色列数学家Klartag与Eldan的早期研究结果,Chen的工作断言,c=
。
KLS 猜想 vs. Bourgain 截面问题
KLS猜想是目前渐进几何分析/凸几何最重要的猜想之一,至今已有25年历史。KLS猜想主要探索如何将形状对等切割成两部分的最佳方法,在一定程度上暗示了Bourgain的猜测。此外,KLS猜想是统计学与计算机科学领域许多问题的核心,例如热量通过凸形扩散需要多长时间,或一个随机游行者从起点开始,需要走几步才能到达一个真正随机的位置。随机游走(Random walks)可以称得上是唯一有效的随机点采样方法。在许多计算机科学问题上,算法中最重要的子例程就是对随机点进行采样。与Bourgain截面问题类似,KLS猜想也提出了一个简单的问题:假设你想将一个凸形(也许是一个没有凹痕的苹果)对等切成两部分,并把一半贮藏起来备用。苹果的表面若裸露在空气中,则会变成棕色,且变得难吃,因此你要尽可能使截面的面积最小。那么,在所有可能的切割方法中,哪一种方法能使截面的面积最小化呢?如果只采用直面切割,那么这个问题的答案(或近似答案)并不难。但是,如果你可以进行曲线切割,那么所有猜测都是无效的。在二维中,数学家会知道,最佳切割方法是一条直线,或者一条圆弧。但是,在三维空间中,只有一些简单的形状有最佳切割方法。以此类推,在高维形状的切割上,数学家根本找不到最佳切割方法。由于很难确定最佳曲线切口,因此,Kannan、Lovász和Simonovits 思考,如果仅允许直线切割,情况会有多糟糕?在1995年,他们提出一个猜想(也就是KLS 猜想):即使限制只能使用直线切割,事情也不会变得更糟,因为存在一个通用常数,使得最佳平面切口的表面积最多等于整体最佳切割表面积的常数倍。比如,对于一个维度100的凸形,最佳直线切口的表面积最多是最佳切口的10倍。KLS猜想认为,对于任何凸多面体,更一般而言,对于具有对数凹面密度的
上的任何分布,超平面切割都可以达到最小比率,直到一个恒定因数。该常数是通用的,与维数无关。
暴露10倍的表面积可能听起来很糟。但是,由于高维形状的许多属性都随维数的增长而呈指数增长,因此,相比之下,平方根的增长是适度的。但是,研究人员渴望改善这一结果。KLS 的因数包含了凸形内随机行为的所有信息,因为最佳切割越小,随机过程便越难在凸形四周快速扩散。不妨设想一个哑铃:两端巨大的球形由一条狭窄的桥梁进行连接。你可以通过一个简单的切割,将其对等切割为两部分,在这个过程中,“桥梁”是瓶颈。一个球内的热源或随机游行者通常需要用很长的时间才能抵达另一个球,因为它必须找到通过瓶颈的方法。当然,哑铃不是凸的。凸形没有哑铃那样任意小的平面切口,但可以有不成比例的小弯曲切口。KLS猜想本质上是在询问:高维凸形是否可以包含一种隐藏的、扭曲的哑铃,从而减慢随机混合的速度?Kannan、Lovász 和 Simonovits 的平方根限制了这些隐藏哑铃的形状扭曲程度。2012年,以色列数学家引入随机局部化(stochastic localization)的技术来降低维度立方根的边界。随机局部化的设想是:将凸形倾斜,使凸形的一个点在一个又一个方向上滑动,直到它们堆积到一个特定的区域。这个方法可以很容易地证明,KLS猜想是一个高度集中的“团块”(mass),与哑铃几乎一样。通过证明倾斜对凸形没有太大改变,Eldan因此能够计算出原始形状的KLS边界。2019年,华盛顿大学的研究员 Santosh S. Vempala 和 Yin-Tat Lee 发表了一篇名为“Eldan's Stochastic Localization and the KLS Conjecture: Isoperimetry, Concentration and Mixing”,其中将 KLS 的因数从维度的平方根降低到维度的四方根。也就是说,如果维度是 d,则平方根为d^1/2,立方根为 d^1/3,四方根为d^1/4。他们引入新方法“bootstrapping”,认为可以将 KLS 的下界降到 d^δ,δ为接近于零的小的修正因数(fudge factor)。由于 d^0 恒等于1,因此,Lee和Vempala认为 KLS的因数或多或少是一个常数。论文发表后引起了社区的讨论,但不久,Klartag便发现了一个漏洞,证明 d^0 边界是错误的。于是,Lee 与 Vempala 迅速修改论文,提出 d^1/4 的边界要求。因为Eldan 和 Klartag 等人之前已经证明,任何 KLS 边界都可以转换为 Bourgain 的截面边界。例如,Lee和Vempala的 d^1/4 边界意味着,在Bourgain 截面问题上,始终存在一个表面积至少为 1/(d^1/4)的截面。
华人博士后的工作突破
Lee与Vempala在2019年发表的论文引起了 Chen 的注意。当时,Chen 在 UC Berkeley 攻读统计学博士学位,正在研究随机采样方法的混合率。随机采样是许多种统计推断的关键要素,例如贝叶斯统计。在阅读 Lee和Vempala 的论文过程中,Chen 了解到了随机局部化(stochastic localization)的概念。他深入地阅读了论文,并尝试花了几周时间填补 Lee 和 Vempala 证明的空白,但没有取得成果。这几年,如何改进随机局部化的想法一直浮现在他的脑海中。基于Lee和Vempala的bootstrapping方法,Chen提出使用递归方法来降低 KLS 边界。他的方法理论是:如果你可以让边界非常小,那么就有方法让边界更小。在反复的应用中,他所使用的bootstrapping方法实现了 KLS 猜想与 Bourgain 截面问题的近似恒定边界。Yuansi Chen证明,在KLS猜想中,等周系数的下界
几乎恒定!这也意味着更快的马尔可夫链蒙特卡洛(MCMC)采样算法的混合时间范围(在对数凹度度量上)。
Chen的研究结果显示,凸形的最佳对半切口并没有比最佳的平切口要小很多;也就是说,高维凸形不包含带有非常窄的桥梁的隐藏哑铃。从实际的角度来看,这意味着:随机游走混合凸形的速度一定比研究人员先前证明的速度要快得多。Chen 的研究成果明显减少了已知算法在执行任务方面的运行时间,这些任务包括计算凸形体积,或从各种机器学习模型中采样,等等。这将有助于计算机科学家在不同的随机采样技术之间进行优先级排序:找出最基础的随机游走在何时表现最佳,以及更复杂但计算成本更高的算法在何时会表现更好。Chen的工作并不能完全证明 KLS猜想,但在计算机科学应用领域,即使没有完全证明该猜想,Chen的研究也有潜力产生巨大的影响力。当 Chen 把论文挂到 arXiv 上后,立刻引起了此前在该问题上有所研究的数学家 Klartag 的关注。Klartag 提到:“由于以前一些工作所出现的错误证明,以及绝大多数人都没有听过 Chen 的名字,因为大家在看这篇论文时都很谨慎。”但Chen 的论文非常容易验证,可以说是 100% 正确。更难得的是,Chen 是一位统计学专家,没有学习凸形几何的专业知识。他之所以对 KLS 猜想产生研究兴趣,是因为他想解决随机抽样的问题。Bubeck评论:“单单从数学的角度看,这个工作非常重要,是我们之前所不了解的。”数学家们一致认为,Bourgain 会因为这项研究而激动不已,因为在2018年Bourgain卧病去世前,仍时常询问截面问题是否已有进展。他在这个问题上花费了将近一生的时间,但都没有解决。如今,一位华人学者取得了“小”突破,可谓难得!
参考链接:
https://www.quantamagazine.org/statistics-postdoc-tames-decades-old-geometry-problem-20210301/
https://gilkalai.wordpress.com/2020/12/21/to-cheer-you-up-in-difficult-times-15-yuansi-chen-achieved-a-major-breakthrough-on-bourgains-slicing-problem-and-the-kannan-lovasz-and-simonovits-conjecture/#:~:text=The%20KLS%20conjecture%20asserts%20that,Lov%C3%A1sz%20and%20Simonovits%20hyperplane%20conjecture.)