公元2018年9月16日,清华大学计算机科学与技术系建系六十周年系庆,"贵系"1989级同学入学29周年纪念,将近三十年。
往日如昨,那一年青春年少,英姿勃发,高举理想主义的大旗,一路高歌猛进,斗志昂扬;弹指一挥间,三十年世事巨变,沧海桑田,昭华已逝,沉疴缠身,苟且庸琐,意兴阑珊。能够在人生至善至纯的时节,在中国最高学府浸淫于人类数千年的思想文化精髓之中,心无旁骛地欣赏体悟,实在是人生之大幸!回想在清华学习接触到的科学人文,反观对照这三十年的人生道路,见微知著,日有所悟。只可叹年轻时凌云万丈,豪情满怀,但是文字功力不足,无法直抒胸臆;现如今一支秃笔,词略达意,但是波澜不惊,激情不再。近些年来,时乖命蹇,愁肠百结,回首青葱岁月,更是怅惘慨叹。恰值系庆60周年,万千思绪,无从谈起,朝花夕拾,略述一二。
曾经去安阳殷墟探访中华民族的文化源头,极度震撼:一具铜鼎之中霍然一颗煮熟的敌酋人头;一具守墓武士的骨骸,手持铜戈,杀气腾腾,千年不堕;妇好的铜钺,腰斩的殉葬,无一不显示我们先祖的尚武精神。但是,更令老顾震惊的是殷墟发掘的十万甲骨。商王武丁对周边方国、部落发动了一系列的战争。他的妻子妇好多次受命代商王征集兵员,屡任将军征战沙场。武丁深爱他的妻子,每次战争之前都用甲骨进行占卜;妇好生病时,武丁也为她占卜祈福。妇好英年早逝后,伤心欲绝的武丁王将妇好平生的所有甲骨卜辞深藏地下。数千年后,殷墟甲骨文被发掘,司马迁史记中记载的商朝不再是上古传说,而是辅有文字和考古证据的确凿历史。十万甲骨目前流落台湾,殷墟空留一个幽暗的巨坑,坑中一具白骨,没有刀斫斧砍的痕迹,平静而安详。甲骨文是中华民族最早具有完备体系的文字,这具自愿殉葬的白骨可能是最早的知识分子,是甲骨文的千年守卫者。这一切让老顾深感欣慰:上古的中华民族,骁勇尚武,浪漫深情,同时建立了完备的文字系统,千年血脉,生生不息。时至今日,中华文明早已根深叶茂,繁花满树。
但是,作为科技工作者,令老顾一直耿耿于怀的是近代中国没有发展出具有完备体系的科学,无数工艺技术世代口耳相传,断代于战乱,流失于饥馑,最终没能像甲骨文一样演化发展,而是被湮没在历史长河之中。那么人类世代积累的零散知识和技术如何才能汇集成完备的体系,持续地繁衍生长呢?科学技术发展的历史脉络如何把握呢?清华的早年教育给了我们很多启迪。
数学教育
多少年后,回想初上清华,老顾觉得非常幸运,也非常感激黄连生老师。黄老师亲手将老顾挑选如当时计算机系的“理论班”,同时学习数学系和计算机系的课程,这使得老顾有机会受到两个领域的科班训练,了解基础科学和工程技术两个领域的价值观念、审美标准、思维方法和核心技能。在未来漫长的人生道路中,(其实是过去的30年里),因为有了计算机技能,可以信心十足地应对眼前的苟且,同时体悟了纯粹数学的优美,能够在喘息中抬头眺望诗和远方。其实,理论班学习到的数学知识归结为最为基本而又重要的是两个框架:思维框架和计算框架。
思维的框架 理论班学习的是莫斯科大学数学系的教材,布尔巴基学派的结构主义,高屋建瓴,立意深远,沉宏博大,融汇古今。数学分析一开始花费长篇巨著讲解什么是“数”,从公理构造整数,再构造有理数,再将有理数完备化,构造实数。陈天权老师苦口婆心,费尽心机,可是大家依然面面相觑,不知所以。其实大家并非不理解相关技术细节,而是无法领会背后的哲学意义。整数是最为基本的数学概念,但是整数是客观实在、还是主观构造?实数理论的构造方式揭示了现代科学体系的构造范式:公理化方法。
在武丁时期一千多年后的托勒密一世时期,古希腊的亚历山大里亚,诞生了欧几里得。人类历史上,欧几里得首次用公理化方法总结梳理了零散的几何知识,构造成完备的欧几里得几何体系,时至今日,依然蓬勃发展。欧几里得利用5条显而易见、无可辩驳的公理,应用严密而又机械的逻辑思维演绎出当时古希腊人已知的几乎所有几何知识,包罗万象,洋洋大观,但是整个体系却简单清晰。从此之后,公理化方法成为科学发展的范式:人类经过长期的生产实践,观察积累的经验知识,最后被汇总到某一个理论体系之中,由公理经过逻辑推演出来;同时,理论体系经常做出各种预言,依随生产技术水平的提高,逐步被验证,融入技术发展之中。比如,概率理论的发展,开始由广大工程师们和数学家们点滴积累,逐步建立了关键概念,发现了一些定理,最后柯尔莫哥洛夫应用测度论建立了概率论的公理体系。再如,爱因斯坦首先提出了公理,包括狭义相对性原理(一切物理定律(除引力外)的方程式在洛伦兹变换下保持形式不变)和光速不变原理,创建了狭义相对论;后来他又提出了公理,包括等效原理(惯性力场与引力场的动力学效应局部不可分辨)和广义相对性原理(所有的物理定律在任何参考系中都取相同的形式),建立了广义相对论。代数拓扑发展过程中,出现了很多种彼此不同的变体,例如单纯同调、奇异同调、层论等等,后来发展出的公理体系将这些分支统一起来,简化了理论体系,更为深刻地揭示了本质。古代中国科学发展史和西方的主要区别在于公理化方法。公理化方法的益处在于:一旦辩论双方都认可公理,那么整个理论体系都可以通过逻辑计算出来,因此不会出现任何歧义;理论的严格性容易被验证。换言之,思维的严密性有了技术手段来保证,这正是中国文化所缺失的关键特征之一。
由于公理化方法如此成功,希尔伯特提出了将整个数学科学公理化的宏伟蓝图,他希望建立一个完备的公理化体系,将所有的数学真理囊括进去。哥德尔的理论使希尔伯特的梦想破灭。哥德尔证明了对于任何一个包含算术公理的公理体系,都存在一个命题,无论此命题为真或者为假,都和此公理体系相容。
有理数有无穷多个,实数有无穷多个,可以证明有理数可以和实数的一个真子集建立双射,实数无法和有理数的子集建立双射。这意味着实数无穷多比有理数的无穷多本质上更多。那么实数无穷多和有理数无穷多之间是否存在一个无穷多,本质上严格小于实数无穷多,同时又大于有理数无穷多?无论回答存在或者不存在,都不和现代数学相矛盾。开学不到3个月,理论班的同学们就深刻认识到如下的哲学思想:使得思维严密化、系统化、体系化的科学范式是公理化方法,同时,人类只能得到相对真理,从而逼近但是永远达不到绝对真理。同时,哥德尔和希尔伯特之争表明了人类探索科学的过程,是永无止境的。
同时,布尔巴基学派的结构主义对于理论班同学思维框架的奠定起到了决定性的作用。结构主义认为,自然界的时间、空间和关系可以相应被抽象成序结构、拓扑结构和代数,这些基本结构相互交织演化出更为复杂的结构,例如拓扑流形和群相结合就是李群。不同的几何就是研究某个变换群下的不变量,自然界的客观对象具有不同层次的结构,例如一张人脸曲面,具有拓扑结构,共形结构,黎曼度量结构,在三维空间中的嵌入结构等等。每种结构有着不同的研究手法,和数学工具。不同的工程问题需要判断所在的结构层次,用到不同的理论工具。例如物理中的等效电阻,本质上是共形结构起作用;而量子霍尔效应,本质上是拓扑结构起作用。在过去几十年里,老顾一直用计算机来研究共形结构。
计算的框架 理论班的同学经过学习“什么是数”,领悟到另外一个极为重要的数学思想:完备化。数学分析的根基在于微积分,微积分要求运算所施加的数系对求极限封闭,即所谓的完备性。有理数域并不完备,因此我们需要将有理数完备化:将每个有理数柯西列(的等价类)看成是一个实数。用这种古怪而又迂回的思想来解释什么是“数”,使得大家难以适从。多少年后,我们才真正理解背后的深刻性。理论班在本科的最后数学课程是泛函分析,偏微分方程。自然的物理现象都满足最小作用原理,我们可以提出一种以函数为自变量的能量,然后构造一族函数序列,使得能量逐步减小,这一能量递减序列的极限就是问题的解。这要求函数空间对于函数序列求极限封闭。我们将有理数完备化的思想用于函数空间,这样就将经典函数空间推广到索伯列夫空间,从而奠定了偏微分方程的理论基础。
在后来的研究生涯中,老顾意识到,绝大多数的物理定律最终都表示成偏微分方程,很多工程和医学领域的问题最终也归结为求解偏微分方程。很多工程新领域的建立往往依赖于某个偏微分方程解存在性的证明确立,这些领域的最终算法其实都等价于某种数值偏微分方程的解法,或者某种等价的最小作用原理。因此,偏微分方程理论的掌握,实际上对于工程方面的理论研究起着极为重要的作用;而数值偏微分方程的算法掌握,对于工程方面的应用研究必不可少。
从另外一个角度而言,人类思维的最高表现形式是科学理论体系,具体表现形式是公理体系,最终可以归结为从公理到定理的逻辑计算问题。依循这一发展脉络,自然就是人工智能的符号主义。将公理体系代数化,符号主义归结为计算代数。计算代数的理论根基在于希尔伯特定理:多元多项式环中的理想是有限生成的;计算代数的主要算法包括吴文俊方法和Grobner基方法。但是,这些算法的复杂度都是指数级的,目前的算力无法使得计算机能够自动发现人类尚未意识到的深刻定理。通过和吴文俊先生的高足王东明、高小山老师交流,老顾得知目前局部微分几何的定理可以用计算代数自动推出,但是整体微分几何定理还无法自动证明,关键在于代数拓扑理论还没有进入机器定理证明领域。
因此可以,数值代数方程的理论和算法,是计算框架中不可或缺的组成部分。
老顾研究的计算共形几何的框架基本上是用偏微分方程方法,但是存在等价的计算代数方法。计算代数方法所得结论都是绝对精确的,因此计算复杂度非常高;计算偏微分方程方法所得结果是近似的,因此复杂度较低,实际中比较常用。
计算机教育
在清华期间,计算机系的老师们从海外带来了最新的科研方向,令大家受益匪浅。理论组的卢开澄老师将组合数学、离散数学引入国内。卢老为大家讲解群论伽罗华理论,用置换群的可解性来证明高次代数方程不存在求根公式,美轮美奂,把大家听得如醉如痴。最后讲到伽罗华为了爱情而决斗身为,卢老大呼可惜,“他着什么急嘛!”后来讲到奇数阶群都是可解群,直到有限单群分类。那时卢老已经开始了零知识的研究,30年后在区块链上的应用被评为最新科技。黄连生老师讲解线性规划和凸优化,多年之后老顾才理解它们和最优传输理论的内在关系,以及在深度学习生成模型上的应用。黄老师给蒋步星和老顾一本《椭圆曲线理论》,当时老顾不解其意。多年后,Andrew Wiles用椭圆曲线理论证明了费马大定理。最近,椭圆曲线加密被广泛地应用于区块链技术。戴一奇老师讲解有限域论,后来老顾在哈佛学习了图灵奖得主Michael Rabin的随机算法课程,其主要工作就是证明了大数分解是概率多项式复杂度,主要的数学工具就是有限域论。王尔乾老师为大家讲解数字电路,他告诫大家做研究欲速则不达,必须经历的三个阶段“照猫画虎、画蛇添足和独立创造”。他讲了自己当初设计两位数乘法芯片的故事,当时同事们设计了各种逻辑电路,繁琐复杂,他快刀斩乱麻,直接将乘法表烧入rom。这使得我们明白最为简单直接的技术手段就是最有价值的技术手段。孙家广老师给大家讲解计算机复辅助几何设计,他用平面直线相交的算法,强调了算法鲁棒性的重要,并且表达了为创造中国自己CAD系统的雄心。张饶学老师刚从日本回到中国,为大家讲解操作系统,他详尽地解释了进程和程序的区别。孙茂松老师讲解自动控制理论,用压缩映射不动点定理证明常微分方程解的存在唯一性。唐泽圣老师讲解计算几何和可视化,介绍前沿的体视化技术。严蔚敏老师讲解数据结构,详细讲授了将递归转化为循环的技巧。吴建平老师刚从德国回到中国,教授大家网络课程,用c语言实现TCP七层协议。他预言Internet必将为全世界带来革命。
五年的计算机课程学习,为大家打下了坚实的技术基础,同时看到了新一轮的工业革命正在酝酿。
信息革命的浪潮
很快,信息革命的浪潮如海啸般袭来,山河作色,乾坤逆转。个人电脑,Internet,电子商务,无线移动,万物互联,大数据分析,社交网络,虚拟现实,人工智能,一代代科技浪潮排山倒海,摧枯拉朽,颠覆着传统产业,社交生活,商业模式,金融物流,乃至价值观念。
老顾一直在学术界耕耘,目睹和参与了学术领域几次浪潮。仔细分析这些学术浪潮的模式,老顾发现它们的数学理论根基相对古老,每次都是有核心的工程技术突破,从而提出了新的理论问题,新的理论建立后,进一步推动浪潮发展。同时这几次浪潮都有核心的理论框架和算法框架,其奠基人都具有深厚的理论素养。
我们先以偏微分方程三种数值解法引发的三次浪潮为例。传统上偏微分方程都是定义在欧氏空间之中,二十世纪微分几何的发展,使得微积分可以被推广到完全的流形上面,几何偏微分方程理论得到长足发展。计算机只能表示有限的离散数据,我们需要将连续的偏微分方程求解问题离散化。一般来说,有三种比较普适的离散化方法,对应着三种数值偏微分方程的解法,这三种方法在过去的30年中,在不同的领域中各领风骚一个阶段,其兴起的过程和具体技术突破、世界时局有很大的关系。
数字几何 一种方法是将流形(例如曲面)进行三角剖分,然后应用有限元方法求解偏微分方程。在过去十几年,计算机图形学领域兴起的数字几何领域就是基于这种思想。人们可以用各种三维扫描设备直接从环境中获取点云数据,然后将这些点云去噪、融合、光顺、三角剖分,参数化,贴附纹理,几何编辑等等。这些都是数字几何研究的内容,基本的数学基础是代数拓扑、微分几何、几何偏微分方程,这些数学理论于二十世纪七、八十年代发展起来。三十年后,数字几何兴起的原因归功于三维扫描技术的成熟,那么三维扫描技术的成功如何解释呢?老顾倾向于认为,归功于所谓的数字相机和数字光源处理技术(Digital Light Processing),特别是数字微镜设备技术(digital micromirror device, DMD)。德州仪器公司历经数十年研发一种DMD芯片,将数十万面微小的镜子集成到一个芯片上,从而可以精确的控制每个像素的光强。将这种DMD芯片装入投影仪,作为光源,人们可以精确设计各种结构光,从而用数字相机获取图片,经过软件解码,得到三维信息。和经典有限元方法相比,数字几何更多地在曲面上解偏微分方程。老顾研究的“计算共形几何”和数字几何方法密切相关。
水平集方法 另一种方法是用有限差分方法来求解偏微分方程。两千年左右兴起的水平集方法属于这一类别,这种方法曾经是医学图像、图像处理和计算机视觉领域的主流方法。在水平集方法出现之前,图像处理领域基本没有统一的理论框架,基本上是一些实用方法的杂散集合。Stanley Osher教授等创始人基于偏微分方程的变分原理来统一图像处理的问题,从而将工程方法提升到理论方法。Osher教授于1980年代提出水平集方法,二十年后大行其道,其内在原因之一在于医学图像技术的成熟,即核磁共振和CT扫描技术的成熟在于两千年左右。由于医学图像大规模增加,市场上对于医学图像处理技术的需求陡增。水平集方法理论严密,实用有效,同时代码简单,迅速风靡各个领域。
同时,工程师们在压缩医学图像的时候,发现一个传统信息理论无法解释的现象。传统Nyquist理论说:如果有一个信号其频谱宽度为n,采样率必须是2n以上,才能保证采样的信号没有失真。工程师们发现医学图像的频谱很宽,但是比较稀疏,这种情况下采样率远低于2n时,依然可以保持不失真。这引起了陶泽轩的注意,由此发展了稀疏感知理论(Sparse Sensing)。但是这一理论需要进行优化,复杂度非常之高,无法在实用中推广。幸而,Donoho证明在很多情况下优化和优化等价,而后者的计算是切实可行的。一时间稀疏感知成为主流方法。
等几何分析方法 第三种方法是将流形用样条来表示,同时将求解的函数也用样条来表示,将偏微分方程转化成代数方法,进行求解。这种方法不需要用到变分法,不需要弱解到强解的逼近,精度高,光滑性好。同时,省去了复杂的三角剖分过程。从2010年左右,在计算机辅助制造领域,Tom Hughes教授大力推动这种等几何分析方法。目前在世界范围内蔚然成风,成为机械力学领域异军突起的一个新兴领域。但是,等几何分析的关键是构造三维实体的样条,这需要将低维拓扑中比较深刻的理论向工程领域的渗透,例如三流形的拓扑理论和曲面叶状结构理论等等。
我们再以另外两个新兴领域为例,看一下数学理论和工程技术的交织发展情况。
拓扑优化 在机械设计领域,拓扑优化是一个迅猛发展的领域。在给定设计要求的条件下,如何进行形状优化,以达到满足力学性能要求,同时节省材料、方便制作的目的。这在航空航天,医疗器械设计等领域至关重要。拓扑优化领域兴起的原因何在?在于三维打印技术的发展和成熟。拓扑优化方法给出的设计方案往往非常复杂,用传统的数控机床无法制造。但是三维打印带来的增材制造技术可以生产复杂拓扑和几何的机械零件,从而使得拓扑优化领域发展方兴未艾。从数学基础来看,拓扑优化往往设计弯曲形状,其力学分析更为复杂,需要系统应用流形上的微积分,我们可以预见黎曼几何和计算力学的深度结合。
持续同调 (Persistent Homolgy)三维扫描技术的成熟在计算几何领域催生了一个新兴方向,所谓的持续同调。通过离散点云,我们希望重建相应的曲面,首先我们需要判断曲面的拓扑。我们将距离小于某个域值的点彼此相连,构成单纯复形,计算同调群;然后增大阈值,检测同调群的变化情况,以此推断曲面的拓扑。持续同调的理论由Herbert Edelsbrunner教授提出并推广,Edelsbrunner教授对于过于实用的技术没有兴趣,对于实用技术背后的数学理论非常热衷。他早年提出的Delaunay三角剖分理论后来发展成在中国几乎家喻户晓的公司Geomagic。Geomagic的兴盛可能和中国前些年的山寨工业有关。绝大多数制造作坊,用三维扫描仪获取某个现有产品的外形,然后用geomagic软件工具将点云转换成样条曲面,编辑修改后再用数控机床加工出来,作为模具,从而批量生产山寨产品。Edelsbrunner教授曾向老顾抱怨过geometric是世界上被剽窃最多的软件产品。Edelsbrunner教授提出的持续同调理论的兴起归功于脸书所引发的社交网络的兴起。对于大型网络数据的分析,持续同调提供了有力的理论工具。几乎在所有的大数据分析工具中,都有着持续同调的算法。从数学理论上而言,持续同调是经典代数拓扑的自然推广,同时和微分拓扑中的摩尔斯理论有着密切联系。
不畏浮云遮望眼
清华本科期间,理论班所受的教育其实涵盖了很多具有根本意义的数学思想和理论工具,同时对那个年代的计算机科学技术有了全面深入的理解。在过去的30年中,科技界每年都有新兴的学科或者方向勃然兴起,在各种浪潮冲击之下,能够保持定力,不随波逐流,洞察本质,预言大浪淘沙后的遗存;或者审时度势,乘风而起,这些都得益于当初的数学思维和工程训练。
范畴论和C++ 比如,我们学习了范畴论,从而理解了函子的概念:将一个范畴的概念和关系映射到另外一个范畴,同时这种映射保持结构信息,那么这种映射被称为是函子。后来学习了代数拓扑,得知代数拓扑本质上就是将拓扑范畴映射到代数范畴(群、环、域),从而将抽象得难以想象的拓扑现象(例如扭结如何彼此缠绕)转换成计算问题。我们那个年代只有C语言,没有C++语言。当C++语言刚刚出现的时候,我们惊奇的发现C++语言的概念名词居然是从范畴论中直接拿来的,例如类(class),态射(morphism)等等,因此学习C++非常轻而易举。计算机编程可以看成是从物理世界到程序范畴的一个函子映射。
渲染和不动点 计算机图形学和计算图像学中的根本问题之一是渲染(rendering),本质上是用计算机模拟几何光学中的反射折射,以及能量辐射,来由几何模型、纹理模型加上材料模型计算生成图像。这一物理过程可以被视作是能量传递、耗散过程,最终可以归结为求解巴拿赫空间的不动点问题,只是计算复杂度非常高。当时在滴水成冰的严冬,和葛广和郝佳良躲在清华北墙后的农民房中编程实现光线跟踪法,为了加速,用上了汇编语言。那时,我们搓手跺脚中梦想着有朝一日,光线跟踪法的计算能够达到实时。没有想到,直至漫长的25年后这一梦想才最终实现。2018年,英伟达公司的图灵GPU系列终于可以支持实时光线跟踪。但是计算方法并没有本质改变,依然是求解规模宏大的物理系统的不动点。可以预言的是,下一步必然是光场渲染(light field rendering),这是Magic Leap一直宣称的核心技术。光场渲染后的技术瓶颈将会是光场显示系统,这依赖于自由形式光学设计(free form optics),自由形式光学设计的数学层面依赖于高精度的蒙日-安培方程求解,但是制造依赖于三维打印技术。这些技术突破之后,虚拟现实和增强现实(VR/AR)将会实现质的飞跃。
因果性和相关性 传统理论研究的终极目的是揭示因果性,建立自变量到因变量之间的映射。这里自变量到因变量可以是函数、张量或者映射,映射可以被显式或者隐式表示,通常可以用偏微分方程或者用变分能量的极值描述。但是,从原理上揭示因果关系,需要建立整体理论框架,对问题的物理现象本质有着深刻理解。相关性可以用自变量和因变量的联合概率密度来描述,因果性可以视作相关性的一个特例。从原理上而言,相关性不需要对问题有本质的理解,甚至唯像的解释也不需要,只需要有统计得出的分布即可。目前人工智能联结主义的深度学习,实际上是学习联合概率分布,即只关注相关性,而不深究因果性。
虽然概率描述了随机的不确定的现象,但是概率分布自身是确定性的。概率分布之间的变换也存在严格的蒙日-安培偏微分方程理论。从历史长河来看,从相关性走向因果性,从经验公式到理论可解释公式是总的发展趋势。目前来看,用蒙日-安培理论来改进深度学习的算法,对硬件提出了一定的要求。我们相信这将是发展趋势。另外一方面而言,基于统计相关的人工智能只是智能的低层次模拟,未来会和更为抽象的高层次符号主义相融合,进行感知和推理。
(待续)
原文发布在【老顾谈几何】公众号 2018年9月5日
https://blog.sciencenet.cn/blog-2472277-1159524.html
上一篇:深度学习和几何(演讲提要)
下一篇:追忆清华逝水年华 (之二、之三)
暂无评论内容