VR/AR背后的弄潮儿(2):微分几何之数据压缩理论

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

顾险峰 (纽约州立大学石溪分校终身教授,清华大学丘成桐数学科学中心访问教授,计算共形几何创始人)

VR/AR的应用往往需要三维几何数据,或者四维的光场数据。大多数的VR/AR设备都是可穿戴的移动设备,和主机通过无线网络联接,因此数据传输成为瓶颈之一。为了提高数据传输效率,几何数据压缩技术成为关键。

为了发展几何数据压缩技术,我们需要仔细考察下列理论问题:一个几何曲面所包含的所有信息如何理解和表示?信息熵的概念如何推广到曲面上面?几何压缩的微分几何理论基础如何?这里所涉及的问题其实非常深刻,即便是现代数学也无法完全回答。依随VR/AR浪潮的兴起,人类社会的财富资源和人力资源集中在三维技术方面,这将极大地推动基础微分几何科学的发展,希望本文提到的一些古老猜想能够被彻底解决。

我们认为,几何信息是分层次的,不同层次的几何信息需要不同的数据结构来表示,和不同的理论工具来分析。下面,我们根据这一指导思想来层分缕析。根据克莱茵的Erlange纲领,不同的几何研究不同变换群下的不变量。现实生活中,一张光滑的曲面具有如下层面的信息:拓扑、共形几何、黎曼几何和通常意义下的微分几何,相应的变换群为拓扑同胚群、共形变换群,和三维欧式空间的刚体变换群。这里,前面的变换群包含后面的变换群,各个层次的几何信息外延依次减小,内涵依次增大。当然,从工程技术角度而言,我们也需要考虑三角剖分的组合结构。

   拓扑信息

拓扑研究同胚变换群下的不变量。直观上而言,我们可以将曲面想象成由橡皮膜制成,我们对橡皮膜拉伸压缩,扭曲折叠,但是避免撕破或粘联,则这些变换都是拓扑同胚,曲面在这些变换下保持不变的量就是拓扑不变量。曲面的拓扑可以由这些拓扑不变量完全刻画。

首先是曲面的可定向性。我们想象一张圆柱面,其边缘为两条封闭曲线。假设有一只蚂蚁在圆柱面的外表面爬行,如果蚂蚁不通过边界曲线,那么它无法达到内表面。这意味着圆柱面有内外两个表面,圆柱面被称为是可定向的。与之相反,我们考察图1中的所谓莫比乌斯带,蚂蚁可以不经过边界曲线自由地到达曲面两侧的任意一个点,曲面的表面无法区分成内表面和外表面。因此,莫比乌斯带被称为是不可定向的。曲面的可定向性由一个比特来表示。

  

   图1. 不可定向曲面。

曲面的另一个拓扑不变量是所谓的“亏格”。我们想象曲面是封闭的,那么曲面所具有的“环柄”数目就是亏格。如图2所示,公牛的曲面不含有环柄,因此亏格为0。图3显示了两个高亏格曲面,左边的小猫模型具有一个环柄,因此亏格为1,右边曲面具有两个环柄,亏格为2。

  

   图2. 亏格为0的曲面。

  

   图3. 曲面的亏格。

曲面的最后一个拓扑不变量是边界的个数。如果曲面不封闭,其边界为多个封闭曲线的并集,封闭曲线的条数被称为是边界数。图4显示了带有边界的人脸曲面。左侧的曲面具有两条边界曲线,右侧的曲面具有16条边界曲线。

  

   图4. 曲面的边界数。

因此,曲面的拓扑信息可以由可定向性、亏格、边界数来表示,可定向性是一个比特信息,亏格和边界数各是一个非负整数。

   共形结构

固定曲面的拓扑结构,我们在其上可以附加所谓的共形结构。首先,我们介绍共形映射的概念。如图5所示,人脸曲面记为

,平面圆盘记为

,我们将人脸曲面映到平面圆盘,映射记为

。我们在人脸曲面上任意画两条相交曲线,

,交点为

。两条曲线映到

,交点为

。并且

的夹角为

,它们的像

的夹角也是

。如果这一性质对于任意的相交曲线

都成立,那么映射

是保角映射。

  

   图5. 保角(共形)映射。

曲面在保角变换下不变的性质被称为是共形不变量。如果两张曲面之间存在保角变换,并且逆变换也是保角的,则两张曲面被称为是共形等价的。所有(带黎曼度量)的曲面被共形等价关系分类,每一个共形等价类具有相同的共形不变量,换言之,共形结构。

如图6所示,所有亏格为零(带黎曼度量)的封闭曲面都可以保角映射到单位球面上,因此所有亏格为零的封闭曲面彼此共形等价。换言之,所有亏格为零的封闭曲面共享同一个共形结构。同时,曲面到单位球面的共形映射不唯一,彼此相差一个单位球面到自身的共形同胚。单位球面到自身的所有共形同胚构成一个6维的李群,莫比乌斯变换群。经过球极投影,单位球面和扩充复平面

共形等价。扩充复平面上的莫比乌斯变换具有形式:

  

   图6. 所有亏格为0的封闭曲面都共形等价于单位球面。

对于亏格为1的封闭曲面,情形复杂很多。如图7所示,小猫曲面为亏格为1的曲面,我们沿着蓝线显示的两条封闭曲线将它切开,则曲面可以共形映到平面的一个平行四边形,如中帧所示。同时,平行四边形的左边界和右边界相差一个平移,上边界和下边界相差一个平移。我们可以取这个平行四边形的无数个拷贝,彼此经过平移粘合,铺满整个平面。如此所得的曲面就是所谓的“平环”,如右帧所示。平环可以相对抽象地定义如下。我们定义一个格群

,格群是平面平行移动群的子群,由两个平行移动生成:

,这里

是一个复数,实部小于1。格群表示为

平环定义为

,其意义是说在复数之间定义一个等价关系:

,当且仅当

。我们把每个等价类视作一个点,这些等价类构成的商空间配上相应的拓扑就是平环。

  

   图7.亏格为1的封闭曲面共形等价于平环。

所有亏格为1的可定向(带黎曼度量的)曲面都和某个平环共形等价,其全系共形不变量就是平行四边形的形状,由参数

所决定,需要两个实数。

  

   图8. 亏格为3曲面的拓扑手术。

高亏格曲面的情形和亏格为1的曲面情形相类似。如图8所示,给定亏格为g的封闭曲面,我们固定一个基点

,过基点构造2g条封闭曲线,

(它们构成曲面基本群的基底)。沿着这些封闭曲线,我们把曲面切开,得到一个4g边形,如图8右帧所示。4g边形的边界为

,

边界可以在曲面上缩成一个点。和亏格为1的曲面情形相类似,我们可以将无数个4g边形的拷贝沿着相应的边界粘合,构成一张无穷大的单连通开曲面。这张曲面被称为是原曲面的万有覆盖空间(universal covering space ),每个4g边形被称为曲面的一个基本域(fundamental domain)。

  

   图9.亏格为2的封闭曲面等价于双曲曲面。

曲面的万有覆盖空间是一个拓扑圆盘,可以保角地映到单位圆盘上。我们在单位圆盘上配上双曲度量:

,

其高斯曲率处处为-1,这是双曲平面的庞加莱模型(Poincare Model),记为。庞加莱模型的双曲刚体变换都是莫比乌斯变换,具有一般形式

.

每一条基本群基底对应着一个莫比乌斯变换,

,这些莫比乌斯变换生成了一个刚体变换子群,被称为是Fuchs群

,

则原来曲面和双曲曲面

共形等价。每个莫比乌斯变换需要3个实数,2g个莫比乌斯变换需要6g个实数。条件

给出了三个独立等式,同时单位圆盘的共形自同胚构成一个三维的群,因此我们需要6g-6个实数来确定Fuchs群,即曲面的全系共形不变量。

以上讨论可以归纳成下图所示的单值化定理,每一张可定向的带度量的封闭曲面都可以保角地映射到三种标准曲面中的一种,亏格为0,1,大于1的曲面,分别映到单位球面,平环或双曲曲面,其完全共形不变量需要0,2,6g-6个实数来描述。

  

   图10. 封闭曲面的单值化定理。

单值化定理对于带边界的可定向带度量曲面依然成立,这种曲面可以共形映射到去掉一些圆盘的标准曲面上面,如图11所示。这时,曲面的共形不变量需要添加圆盘的圆心和半径信息。

  

   图11. 带边界曲面的单值化定理。

综上所述,曲面的共形结构信息由有限个实数来描述。

   黎曼度量

黎曼几何研究等距变换群下的不变量。一般地,曲面上任给两点,则存在一条最短测地线连接它们。等距变换保持任意两点间的测地距离。如图12所示,我们将一幅硬塑料面具变形,这种变形没有拉伸或压缩,如前两列的曲面之间的变形,那么这种变形是等距的。等距变换保持共形结构,如第三列所示。因为高斯曲率由度量所决定,所以等距变换保持高斯曲率。

  

   图12. 曲面间的等距变换。

共形结构可以用来测量角度信息,但是无法确定长度和面积。黎曼度量定义了曲面每点切空间上的内积,可以用来定义曲面上曲线的长度,曲线间的夹角,曲面区域的面积。

给定曲面的共形结构,例如单值化定理中的常值曲率曲面,配有标准球面,欧式,或者双曲度量,记为

,曲面的黎曼度量为

,则两个度量之间相差一个正的标量函数,

。这里函数

被称为是共形因子。因此,黎曼度量由共形因子给出。

如果不用共形结构,而用一般参数化,则曲面的度量是一个张量,局部表示成一个2阶正定方阵。因此,共形结构的应用,简化了度量的表示。

   欧式空间中的嵌入

传统曲面的微分几何研究嵌入在三维欧式空间中的曲面,在欧式空间的刚体变换群(旋转和平移)下的不变量。微分几何的基本定理说曲面的不变量是第一基本形式(黎曼度量)和第二基本形式。通常,这两种基本形式都是张量,局部表示为2阶方阵。这一定理的论述比较笼统,下面我们进行细致分析。

如果我们利用曲面的共形结构,那么第一基本形式简化成一个函数,即共形因子。第二基本形式简化成平均曲率函数

。因此,曲面在欧式空间中的嵌入由共形结构,加上共形因子和平均曲率所决定。换句话说,传统的三维技术中,曲面的表示需要三个函数

,实际上两个

就已经足够。如果曲面的高斯曲率处处非负,那么曲面为凸曲面,那么曲面的嵌入由黎曼度量完全决定。曲面的表示只需要一个共形因子函数。这被称为是凸曲面的刚性。

同时,我们知道有很多黎曼度量无法在三维欧式空间中二阶光滑地实现。例如我们上面讨论过的双曲曲面和平环。但是,令人匪夷所思的是平环可以在三维欧式空间中一阶光滑地嵌入。图13显示了最近由法国数学家发现的平环等距嵌入。

  

   图13. 平环的一阶光滑等距嵌入。

那么,哪些黎曼度量可以光滑嵌入在三维欧式空间之中?哪些黎曼度量无法光滑嵌入在三维欧式空间之中?迄今为止,这个问题没有令人满意的理论解答。

同时,我们知道共形因子和平均曲率并非相互独立,它们满足复杂的Gauss-Codazzi方程。这意味着,共形因子和平均曲率两个函数所表达的信息有冗余。如何去除这些冗余信息,依然是饶有兴味的问题。

更为重要的是,长期以来,人们普遍猜测封闭曲面具有刚性:对于封闭曲面而言,等距的大形变是可能的,但是我们似乎无法找到微小的等距形变。换言之,如果我们固定封闭曲面的黎曼度量,曲率有正有负,如果满足Gauss-Codezzi方程的平均曲率函数不唯一,那么它们彼此之间是分离的,无法形成连续的单参数函数族。这意味着,如果我们采用有损压缩,重建的平均曲率不精确,由Gauss-Codazzi方程,我们可以找到精确解。这一猜测具有悠久的历史,迄今无人能够证明或证伪。人类对于等距嵌入依然理解有限。

   总结

通过以上的讨论,我们看到一张现实生活中的曲面包括多重层次的信息:拓扑结构+共形结构+黎曼度量+欧式空间的嵌入,所需的相应数据结构包含(可定向,亏格,边界数)+(Fuchs群生成元)+(共形因子)+(平均曲率)。曲面的函数自由度为2,而非传统观念中的3个自由度。通常大家觉得需要三个函数来描写一个曲面:

。但这篇文章的数学告诉我们,只需要两个函数(共形因子和平均曲率),加上有限的几个数来刻画拓扑和共形结构,就可以描写一个曲面。这从理论上给出了几何信息压缩技术的新方向。

更进一步,共形因子和平均曲率并不独立,它们满足Gauss-Codazzi方程。凸曲面不需要平均曲率。一般曲面的平均曲率函数可能是分离的系列,这意味着我们可以采用有损压缩,但却得到无损重建。(即压缩是丢失一些信息,但是重建的时候这些丢失的信息会被自动回复。)

由此,我们看到几何信息理论依然有大量悬而未决的问题,封闭曲面的刚性猜想有百年历史。我们由衷希望借助VR/AR的浪潮,这些古老的猜测得以解决;同时对于这些问题的深刻理解将有助于从根本上推动几何数据压缩技术革命性的发展。

注:文本作者顾险峰教授将于2016年7~8月在清华大学丘成桐数学科学中心讲授《计算共形几何》课程,将会用计算机科学的语言诠释现代几何。课程免费公开,欢迎前来研习探讨,共同提高。

延伸阅读

① VR/AR背后的弄潮儿(1):微分几何之逼近理论

② Magic Leap 核心技术揭秘

③ 欲把传统CPU挑下马,概率芯片是如何计算的?

   投稿、提供新闻线索、转载授权请联系: iscientists@126.com

   商务合作事宜请联系: dll2004@163.com

   更多精彩文章:您可以回复"年份+月份",如201510即可 获取月度文章, 或返回主页点击子菜单获取最新文章、往期文章或直达赛先生微博。谢谢!

  

   微信号: iscientists

加载中

随意打赏

提交建议
微信扫一扫,分享给好友吧。