一个数学证明的诞生- · 科普中国网

大数学家外尔 (Hermann Weyl，1885-1955) 曾说：“我的工作总是设法将真与美统一起来，但如果二者只能择其一，我通常会选择美。”在数学中，美的定理、美的证明，特征之一是“清楚简洁”。本文回顾了作者在十六年前的一篇论文中，对“矩阵行列式引理”的一个简洁优美的证明，介绍了线性代数里用于分块矩阵的高斯行列变换技巧。

撰文 | 丁玖（美国南密西西比大学数学系教授）

相遇“矩阵行列式引理”

半年前，我审读了一篇投往《应用数学快报》(Applied Mathematics Letters) 的文章。在这篇关于迭代法的来稿里，有段话引起了我的兴趣：“Before proving the convergence of the new iterative scheme we generalize the so-called matrix determinant lemma of [4] for more general rank-r modifications：”（在证明新的迭代方案的收敛性之前，我们将[4]中的所谓矩阵行列式引理推广到更一般的秩-r修正）。参考文献[4]正是我以及合作者于十六年前在同一家杂志上发表的论文“Eigenvalues of rank-one updated matrices with some applications”（《秩-1校正矩阵的特征值及其一些应用》）。

吊起我胃口的是术语“矩阵行列式引理”，听作者的口气，似乎是我们的文章给出了这条“引理”，甚至还将其加以命名。但是，我对这个名称却是一无所知，那一天是第一次见到它，真是孤陋寡闻！

好在如今资讯发达，在网上查询信息十分便捷。我在谷歌搜索输入词组matrix determinant lemma，电脑屏幕上蹦出来的第一条信息是Wikipedia（维基百科）的“Matrix determinant lemma”条目。它的内容第一段是：“在数学中，特别是线性代数中，矩阵行列式引理计算可逆

然而，条目的作者可能不知道，我们在2007年发表的另一篇论文“Characteristic polynomials of some perturbed matrices”（《一些扰动矩阵的特征多项式》）中，对所言的韦恩斯坦-阿龙扎因恒等式给出了一步证明：将如上用于秩-1校正矩阵的特殊的矩阵分解式直接推广成

然后再两边求行列式便得结果。在维基百科的条目“Weinstein-Aronszajn identity”中，关于这个恒等式的证明采用的技巧是关于2×2分块矩阵的两个经典行列式等式，因而不及上述证明简洁，少了一点美感。然而这或许是2007年新的证明问世前最为标准和最为经济的证明之一。

如上便是维基百科中关于矩阵行列式引理及其推广的基本内容。回到我半年前正在审稿的文章，它的第一个定理就是将矩阵行列式引理推广到上面已经证明出的一般情形，但只考虑了满足该文要求的m = n特例。作者证明该定理的思路依然是传统的，即通过一个经典行列式等式

以及对上式左端2×2分块矩阵的一个三矩阵分解，再取行列式便获成功。

我没有料到自己十六年前受谷歌矩阵激发，为了探讨相关数学问题而想出的矩阵分解，被维基百科条目采纳为“矩阵行列式引理”的标准证明。这让我想起当年写作这篇数学短文的一些细节，在此记录下来，权当是对当年追求简洁美心态的一次回顾，顺便也与读者分享线性代数里用于分块矩阵的高斯行列变换技巧。

论文是怎样炼成的

那年，同之前的十多年一样，我如期访问了中国科学院数学与系统科学研究院。我和其中一个研究所的合作者在计算遍历理论的领域共同耕耘了许多个春秋，合写了不少研究论文，也出版了一本中文合著。这一次，我的合作者告诉我，“谷歌矩阵”这个数学领域的新生事物，由于问世还不到十年的谷歌公司在信息搜索引擎方面的巨大商业成功，尤其是它在“网页排序 (PageRank) ”算法里的核心地位，正在受到应用和计算数学家们的关注。他觉得我们或许也应该“关注一下”。
我接受了他的好建议，于是开始阅读有关文献，对谷歌矩阵——全世界最大的随机矩阵（即每行元素之和都等于1的非负矩阵）的基本性质有所了解。事实上，谷歌矩阵起源于根据所有网页相对重要性概念而定义出的一个有n行和n列的随机矩阵S，叫做原始谷歌矩阵，然后将它与某个秩为1的“摄动矩阵”evT进行一次凸组合，其中e是n维的分量全为1的列向量，n

因为上述关系能够用来求解我自己提出的特征值摄动问题，所以我必须给出这个预备命题的证明。当然，这类初等的行列式等式早已是经典结果，我以前也见到过。美国有名的计算数学家豪斯霍尔德 (Aston Scott Householder，1904-1993) 于1964年出版了一本写法别具一格、相当有深度的好书The Theory of Matrices in Numerical Analysis（《数值

矩阵，其中u是单位列向量。1987年夏，刚毕业的韩国裔师兄李弘九博士在奔赴新校任教前，邀请我同他开办二人讨论班，轮流报告本书各章内容，让我迷上了这本口碑极佳的著作。作者用了行列式按行展开的方式推演出初等矩阵的行列式公式。
如果去研究院的图书馆借出一本内容丰富的矩阵理论书，只要找到矩阵行列式引理，就可以将所列论证搬来作为我文章手稿中的引理证明。但是我想该等式简单，证明无需外援。况且，外人不大容易借出馆藏图书，我也不想麻烦熟人陪跑一趟帮我借阅。于是我开始着手推出这个简洁漂亮的行列式等式，希望写出的证明也同样是简洁漂亮的。
其实我心中已经有了一个似是而非的处理手段。正如前述，我们只需考虑A = I的特例即可。一个如果不仔细推敲就有可能觉得全对的“证明”是这样

广义高斯行变换

终于，我们获得了一个无懈可击的正确证明，然而，它的弱点也是很显然的：证明太长，因而对读者的耐心是个考验。可以给出矩阵行列式引理的一个较短的证明，它不必像上面那样两种情形分而治之，但它需要的是关于2×2分块矩阵行列式的一个经典公式和同一个分块矩阵的块下三角矩阵和块上三角矩阵分解：

和

这两个等式本质上都来自关于分块矩阵的广义高斯行变换。

“广义高斯行变换”是通常的高斯消去法中行变换的推广。高斯消去法的目的是将线性方程组的系数矩阵通过初等行变换转变成一个上三角矩阵，然后利用回代法解出与原方程组等价的线性方程组的解。比如说，如果要解二元一次方程组3x - 2y = 1和2x + y = 3。高斯消去法用-2/3乘上第一个方程，然后再加到第二个方程，结果消去x：(7/3)y = 7/3，解得y = 1，将y的值回代到第一个方程解得x = 1。高斯消去法的这个行变换的效果，相当于用其对应的变换矩阵（它由用同样的高斯行变换施加于单位矩阵而得到）

由于变换矩阵的行列式等于1，故高斯行变换不改变矩阵的行列式。

广义高斯行变换与高斯行变换具有同样的思想，只不过它用于矩阵写成分块矩阵的场合。这时原始的消去法——通过一行而改变另一行的初等行变换，被推广成一次性通过几行而改变同样数目的另外几行的变换。换言之，原先的将某个数乘以某一行再加到另一行的高斯行变换，被提速到将某个块矩阵乘以分块矩阵的某一行后再加到另一行的广义高斯行变换，这又等价于用其对应的变换块矩阵（将同一变换用于分块的单位矩阵而得到）乘以被施加变换的那个分块矩阵。同样地，广义高斯行变换不改变原矩阵的行列式。正如通常的高斯行变换思想也可以用于矩阵的列运算上，自然也可以进行广义高斯列变换，只需把“将某个块矩阵乘以分块矩阵的某一行然后再加到另一行”的操作改为“将某块矩阵右乘分块矩阵的某一列然后再加到另一列”，其等价的矩阵乘积是将对应的变换块矩阵右乘被变换的分块矩阵，行列式依然是列变换的不变量。

好了，我们可以验证上面的等式(1)和(2)了。具体说来，对行列式等式(1)左端的分块矩阵，将u乘上第二行后再加到第一行，得到变换后的分块矩阵

乘以被施加该变换的矩阵，而此变换矩阵的逆矩阵就是将它表达式中的那个负号去掉后的结果。因此上述的分块矩阵的分解等式(2)得证。只要取矩阵等式(2)两端的行列式，再用到行列式等式(1)，矩阵行列式引理的证明就算大功告成了。

还能更简洁吗？

读者可以感觉到上述关于矩阵行列式引理的第二个证明比较精炼，因为只用了两个公式，两步到位就完成了任务。然而，有没有只用到一个等式就可以一步到位的证明呢？这也是当年我在北京的访问学者办公室里对自己的提问。
其实那时我的头脑里并没有上面的公式(1)和(2)，利用正交概念的“不完整证明”却是学过内积空间的人容易想到的一个证法。然而，我是知道广义高斯行列变换技巧的，我正是坐在办公桌前试图用此法一步到位地证明

然而，让我始料未及的是，新定理的另一个直接应用却导致了关于非负矩阵的Perron-Frobenius理论里，一个对正矩阵最大特征值代数重数断言的直接证明，这个新证明比我到那时为止在有关非负矩阵的书中见过的证明要短得多。这个断言是：正的方阵的谱半径，即所有特征值的最大绝对值（在非负矩阵理论里称为最大特征值，理由是非负矩阵的谱半径总是一个特征值），是代数重数为1的特征值。

书本里给出的这个正矩阵最大特征值为特征多项式简单零点的结果，证明一般很长，有的甚至还借来其他学科的知识。例如，在剑桥大学出版社1997年出版的R. B. Bapat和T. E. S. Raghavan合著的书Nonnegative Matrices and Applications（《非负矩阵及其应用》）中的定理1.4.4(v)的证明，用到了来自博弈论（game theory）的推理；R. Horn和C. R. Johnson于1985年经同一出版社推出的教科书Matrix Analysis（《矩阵分析》），用Schur三角化定理证明了定理8.2.10；在H. Minc的1988年专著Nonnegative Matrices（《非负矩阵》）中，定理4.3的证明是基于微分的思路。这些证明似乎都既不简单，也不简短。
那时，我和我的合作者根据我们多年来对遍历理论中一类正算子数值分析的研究实践，准备写一本英文书《非负矩阵、正算子及其应用》(Nonnegative Matrices, Positive Operators, and Applications)。我一直比较关心有关非负矩阵尤其是随机矩阵的性质，盖因计算遍历理论里著名的乌拉姆方法以及我在博士学位论文中构造的高阶马尔可夫有限维逼近方法，采用的各种映到有限维函数空间上的逼近算子，在密度函数基底下的表示都是随机矩阵。所以，在受谷歌矩阵吸引，碰巧证明出了一个谱摄动定理后，我就好奇它能不能用于简化上一段提到的关于正矩阵最大特征值代数重数好性质的复杂证明。

尾声

十六年的光阴瞬息过去，几年前我注意到，我与合作者这篇2007年的论文的引用次数，压过了我们1996年发表的一篇计算遍历理论领域的文章，当上了我所有学术论文的“引用数冠军”。我当时以为或许是因为论文中的主要定理应用广泛而荣幸被引。然而，借审稿机会我才获悉，文章的引理证明被维基百科的条目选上，论文是由于这个矩阵行列式引理及其极简证明才受到研究者关注。据说有人统计过，全世界浏览量最大的前十名网页中，维基百科位居其一。
大数学家外尔 (Hermann Weyl，1885-1955) 曾有一句名言：“我的工作总是设法将真与美统一起来，但如果二者只能择其一，我通常会选择美。”人们常说“简单就是美”。在数学中，美的定理、美的证明，特征之一是“清楚简洁”。精炼的证明读之令人陶醉，如“根号2非有理数”及“素数无穷多”的论证不能再短，所以，它们既被爱戴数学美的哈代 (Godfrey Harold Hardy，1877-1947) 写进了脍炙人口的A Mathematician’s Apology（《一个数学家的辩白》），也被收进了再版多次的Proofs from THE BOOK（《数学天书中的证明》）。矩阵行列式引理的最短证明像引理本身一样简洁清晰，人们同时欣赏了公式之雅和推理之妙。在维基百科的数学条目里，我们的的确确体会到了数学美！
写于2023年11月12日星期日美国哈蒂斯堡夏日山庄

本文受科普中国·星空计划项目扶持

出品：中国科协科普部

监制：中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

特别提示

1. 进入『返朴』微信公众号底部菜单“精品专栏“，可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号，回复四位数组成的年份+月份，如“1903”，可获取2019年3月的文章索引，以此类推。

版权说明：欢迎个人转发，任何形式的媒体或机构未经授权，不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。