叶卢庆的博客

李天岩:回首来时路

当初第一志愿考进位于新竹的清华大学数学系,当然号称是因为对数学感兴趣。其实中学时代对数学的所谓兴趣多半也只是建立在钻研和解决数学难题时所得到的‘快感’上吧。有时能解出些“难题征答”性的题目,得意的不得了。没想到一进了大学,差点就被初等微积分里那些莫名其妙的ε-δ语言给逼疯了。记得那时同寝室的另三位室友都是大一数学系的新生。那时我们多在晚间 11 点左右就熄灯就寝。但是常常在半夜一、二点钟时,发现大家都被那些鬼ε-δ的抽象概念搞得睡不着觉。记得我隔壁书桌的一位同学常常在打草稿写“遗书”,遗书的内容基本上是什么都搞不懂,不知怎么办好,不想活下去了,等等。

后来到了美国才知道,我们并不是天字第一号笨蛋。好比说,在我目前任教的密西根州立大学,系里根本禁止在一、二年级初等微积分的课程里灌输学生这些 ε-δ 的抽象概念。其实在牛顿、莱布尼兹发明微积分时,‘逼近’、‘渐近’、‘无穷小’的概念并没有非常严格的定义。也只有到19 世纪中期,数学界的“领导们”才开始对所有数学概念要求严格地定义(rigorously defined)。比如说,请告诉我到底什么是“1”?什么是“2”?为什么 1 + 1 = 2 ?(在这个意义上,到底什么是“+”?)若在初等微积分入门那个阶段就要用 ε-δ 去严格刻画逼近、渐近、无穷等抽象概念,就好像在小学生学基本算术加乘法之前,要求他们先严格定义什么是“1”,什么是“2”什么的。果真如此,少年维特对数学的烦恼肯定要提早发生了,不是吗?中学时代对数学难题的钻研根本上和数学概念上的所谓直觉(intuition)没啥关系,因此大家都好像严重忽略在引入抽象概念之前,先介绍直觉的重要性。我也是到美国以后才知道,数学上的逻辑推理和对数学结构性的认知有相当大的差距。

记得有次在南京时,和一位南京大学数学系的年轻教授午餐,这位教授那时并没有喝过洋墨水,他听说东方学生到美国读研究生一、二年级时成绩多半杰出,可是过了选课期到研究作论文的阶段就逐渐落后老美了,不知是真是假?其实这位教授所听说的大致正确。一般较用功的东方学生,在国内受教育时大都下很大功夫在记忆数学上的逻辑推论 :这一步为什么导致了下一步,下一步为什么再推出了下一步 ;等等 ;然后再把所有习题都拿来钻一钻。在这种情况下,一般的笔试是很难考倒这帮学生的。

可是美国学生所不同的是,在他们早期的数学教育里却已很普遍的在问:它想表达什么(What it says)?以及它为什么可行(Why it works)?这些问题在笔试时几乎不太可能遇到。但在做研究时却是非常非常重要。我有一个台湾来的博士生,有次我请他把我在专题讨论班里讲过的一篇很重要、很复杂的文章用他自己的数学语言仔细写出来。从他后来交来的报告里,可以看出他的确下了很大的功夫把文章中被省略的逻辑细节严密地补足了。我把他的报告改后还给他,然后他又交了来,我又改了改再还给他。他再交来时,我请他告诉我,这篇文章到底在干什么?没想到他却一个字都答不上来。其实在一般的数学研究论文里,我们最常见的是作者用些莫名其妙的定义推些最一般性的定理。我们若只是非常用力地去了解它的逻辑推理,而轻易忽略去搞清楚作者脑袋瓜里到底在想些什么,那么我们对文章的了解将是非常有限,也很难由此做出杰出的工作。非常遗憾的是,极多数重要论文的作者都不会轻易把他们脑袋瓜子里真正的观点和想法花功夫写出来。你必须自己去问这些问题,自己去追求它的答案。

我经常举的一个例子是,我对一个矩阵的‘行秩’和‘列秩’为什么会相等的好奇。其实在任何基本的线性代数书里,我们都可以找到它们为什么相等的证明。但是从那些逻辑推理的外表,我实在看不出它们为什么会巧合地相等。在我真正了解到它们为什么会一样的过程中,这个好奇却帮我了解了许多广义逆矩阵的几何意义。又比方说,上过大学数学的都会矩阵运算里的高斯消去法,对吧?有一次我问台湾南部一所大学数学系的一位教授(这位教授在大学念书时,好像还赢过台湾线性代数比赛的“银牌”)高斯消去法的几何意义到底是什么?他说,这年头谁要去想这种问题?!语言简单的东西(好比‘拓扑熵’)懂不懂好像不那么重要。管它懂不懂老子照样可以挤出在 SCI 杂志发表的文章。可是遇到较复杂的语言时,好比近代代数几何里的基本语言‘scheme’,若对它整个的来龙去脉缺乏一个整体性的理解,一般人恐怕连定义都无法轻易记忆。记得我在自修交换代数时,遇到所谓局部环(local ring),当时只是好奇,为什么称它局部环?从它定义(只有唯一的一个 maximal ideal 的环)的表面实在看不出凭什么称它为‘局部环’。可是在我试图真正去了解为什么要称它局部环的过程里,这个好奇却帮我了解了许多代数几何上的概念。

这一路过来,这种对数学的‘好奇’以及对这些‘好奇’问题答案的追逐的确给我带来对研读数学的极大乐趣。在这里我想强调的是,对这些好奇的追寻(chase)毫无争取在 SCI 的期刊上发表论文的意图。

当初去马里兰大学(University of Maryland)读研究生是一个巧合,遇到后来的指导教授约克(James A.Yorke)更是一个极大的巧合。记得约克教授头一次看了我当初在清华念书的档案时,显然是吃了一惊。以为我是那路杀来的高手,功力无比深厚。现在回想起来那个档案里所记录的实在是有极大的误导性(misleading ;英文这字有时是指人欺诈的礼貌性用词)。看那!我在念大二的三高时,高等微积分用的是 Apostol 的数学分析 ;高等几何用的是 Halmos 的有限维向量空间 ;高等代数用的是 N.Jacobson 的抽象代数讲义 ;微分方程用的是 Coddington的常微分方程导读。大三念近世代数时,用的是 van derWaerden 的现代代数 ;念复变函数论用的是 Ahlfors 的复分析。另外,大三还念了拓扑学、数论 ;大四念了泛函分析、李群、实变函数论(用的是 Royden 的实分析),微分几何(用的是 Hicks 的微分几何讲义)。这些课不但都修过,而且成绩都不错(大四修的课都在 90 分以上)。在表面上看来,这个记录的确是相当牛了,不是吗?可是今天把那些教科书拿出来翻一翻,实在很难想象当初是怎么混过来的。好比说,Ahlfors 那本书的水平不低。它决不适合做初学复变数函数论的教科书。记得我们大二学高等微积分时,教授根本就跳过了线积分(现在想来,大概根本的原因还在于 Apostol 那本书过于高深,教授不可能教完书里大部分的材料。)可这本教材基本上是假设阁下已经清楚地掌握了所谓的复数面上的线积分(contour integral)。若是对线积分都不甚了解,我很难想象当时怎么去理解柯西积分定理(Cauchy integral theorem)等基本概念。那时的老师们好像都觉得能用愈深的教科书(其实每本书都号称是‘self contained’即自成一体)学生自然就会变得‘高档次’吧!

其实抽象数学的出发点多半起始于对实际问题所建立的数学模式,然后将解决问题的方式建立理论,再抽象化,希望能覆盖更一般性的同类问题。因此在学习较高深的抽象数学理论之前,多多少少要对最原始的出发点和工具有些基本的认识。要不然,若是一开始就搞些莫名其妙的抽象定义,推些莫名其妙的抽象定理,学生根本无法知道到底是在干些什么。可是为了考试过关,只好跟着 背定义、背定理、背逻辑,一团混战。对基础数学实质上的认识真是微乎其微。我们那时的学习环境大致如此。所以我那时档案里的记录虽然极为 令人印象深刻,但是如今回想起来,当时实在是“一窍不通”。背定理、背逻辑最多只能应付考试。毕业服完兵役以后,绝大多数以前所学都忘了。老实说,在出 国前,我真想放弃数学。后来在美国遇到了导师约克教授。从他那里,我才慢慢对学数学和数学研究有了些初步的认识。这些认识大大开阔了我以后学习数学的视野和方式。最重要的是,学习“高档次”的数学理论,绝对必须从对“低档次”数学的理解出发。

我常常觉得自己的数学生涯实在是太幸运了。记得那年在凯洛格(B. Kellogg)教授所开“非线性数值分析”的课堂上听到他讲关于赫希(M. Hirsch)用微分拓扑的反证法证明“布劳威尔(Brouwer)不动点”的存在定理。其实我觉得只要把赫希的证明稍稍做些变动(这个变动大概不超过原来证明的1%吧!),就可以轻易地把他的反证法(“……若‘不动点’不存在,则天下会 大乱……”)变成一个找这些不动点的实际方法。后来和导师约克教授提起了我的看法。记得那时摆在我面前的研究课题有好几个,没想到约克教授却坚持要我全力以赴地去实践这个算法的构想。老实说,那时我心里最不想做的就是这个问题。首先,我那时根本不懂计算(连基本的Fortran语言都不会)。另外,我们那时并没有什么“工作站”、“个人电脑”,所有计算程序都必须打在卡片上(一行一张卡),然后把它们送去计算机中心,他们用学校仅有的两台机器替你跑程序。接下来就看你的运气了,有时二十分钟之后就有结果,有时要等两三个小时甚至更长时间。还有一个不想做这个题目的理由:那时总以为数学研究总是要证些定理什么的,搞些ε-δ的玩 意儿,我对算布劳威尔不动点的构想即使可以顺利运作,好像也无法推出什么定理来。不管怎样,在我们那个年代,好像老师叫你做什么,你照着做就是了。虽然我自己心中极不热衷这个题目,但是从里到外都毫无排斥的意识。

记得我是在1974年1月中开始着手这个问题。关于写程序,甚至打卡都只好一面做一面学。我几乎每天在清晨6点半就送卡片去 计算机中心,然后是等结果、改程序、等结果、改程序……常常弄到半夜12点多。每次等到的结果都因程序或算法的 错误,基本上拿到的都是一大沓废纸。后来,去计算机中心拿(或等)一沓废纸好像已经变得习以为常了。记得是3月15日那天早上,我到计算机中心 拿到的结果却只有薄薄的几页。起先心中只是大为疑惑:今天是怎么回事?没想到打开一看,居然算出“不动点”来了!那是个100维的问题!

说实在的,我那时心中并没有很大的成就感。这就好像老师要我去扫厕所,我终于把厕所打扫干净了,如是而已。没想到,大约在 一个月后,约克教授在美国数学学会的Notice(即Notices of the American Mathematical Society,美国数学会杂志。)上看到一个将在当年6月26-28日在南卡罗来纳州的克莱姆森大学(Clemson University)举行“不动点计算及应用国际会议”(International Conference on Computing Fixed Points with Applications)的消息。完全出乎我们意料之外的是,从1967年开始就有一大群人在研究布劳威尔不动点的算法。这些人多半是出自名校经济系、商学院、作业研究、工业工程等系所的教授,因为许多经济学里的模式的“均衡点”(equilibrium)都可以用布劳威尔不动点的方式来表达,因此布劳威尔不动点的运算 变成了实际应用上的一个重要工具。这个会议显然邀请了那个门派所有的重量级人物去做报告。约克教授在知道这个会议的 信息之后,立刻打了个电话给这个会议的主办人卡拉马尔迪昂(S. Karamardian),告诉他我们有一个新的算法。当时卡拉马尔迪昂也只是半信半疑地勉强答应提供我们两张往返克莱姆森的机票。后来我和凯洛格(Kellogg)教授一起参加了 那个会议。我们在那里“一鸣惊人”。后来耶鲁大学经济系的讲座教授斯卡夫(H. Scarf,他是当初在1967年,第一个提出布劳威尔不动点算 法的)在会议论文集的简介里说:

“……对于我们中的很多人来说,在克莱姆森会议中给我们极大惊喜的是凯洛格、李和约克的一篇文章,文中他们给出了第一个通过使用微分拓扑里的 连续映射来计算不动点的方法,而不是使用我们传统的组合方法。在这篇文章中,作者们同样给出了为何赫希的论证可以用来定义从 任意指定的边界点到不动点的路径……”

附带一提的是,我们算法中所引用的微分拓扑概念,后来在解非线性问题数值计算的“同伦算法”中起了“革命性”的作用。

前一阵子,我在美国一个期刊上读到一篇成功企业家退休后所写的感言,其中让我一直无法忘却的一句话是:

“……一个人必须为或将得到的幸运而做好准备……”

回想当初我在挣扎是否研究不动点的运算时,实在有很多借口可以像我曾经接触过的一些学生似的拖宕、躲闪、骗自己、拒绝干活……若真如此,这个天上掉下来的“万年火龟”不是轻易擦身而过了吗?

有一次和约克教授闲聊起关于“智商”的话题。一般来说,他并不太看重“智商”的高低。记得那时他说,“……在伯克利大学的人 一般说来有高智商。但你很难相信他们在做多么笨的问题,我们将选择好的问题以超出他们20点的智商打败他们……”。这些话虽然略为邪门,但是这些年来,每次遇到该选什么研究题目时,总是想起他的这些话。回想当初若给我一个选择,我绝不会拼了命去算布劳威尔不动点,心里真正想搞的倒是在那时偏微分方程领域里相当时髦的单调算子(monotone operator),那时有许多知名的 人物(像是哈特曼(Hartman)、斯坦帕基亚(Stampacchia)、明蒂(Minty)、老莱昂(Lion)……)都在研究它。可是现在 看来,那个时期在单调算子领域里的工作,几乎没有一个里程碑性的成果能够保留到今天。这些年来,我个人曾直接接触过一些数学界 的顶尖高手,但是若谈到判断题目意义的本领,我的导师约克教授在这方面的功力的确深厚,绝不输那些“顶尖高手”。这也许是我自己最大的幸运吧!

我从清华大学毕业已将近四十年了。有时常常想,若是重新再给我一次学习的机会,我将怎么做……但是

“没有人能使
时光倒流,
草原再绿,
花卉再放。
只有在剩余部分,争取力量!”
(摘自作者中学时期看过的一部由华伦比提和娜妲丽华主演的电影《天涯何处无芳草》。)

所以,重新再给我一次机会的事只是幻想。我希望我的经历能在诸位长远的数学研究、学习、甚至教学上贡献一点什么。

编者按:作者在2005年底及2006年底两次于新竹清华大学做演讲,后整理成文,并登载于《数学传播》第31卷第4期,本文由作者根据该文修订而成。