沿着这一思想实验的启示, 爱因斯坦提出了著名的等效原理 (equivalence principle), 即引力场中任何一个时空点附近都存在所谓的局域惯性参照系 (locally inertial reference frame), 其中的物理规律与不存在引力场时的惯性参照系里的物理规律相同[4]。 依据这条原理, 爱因斯坦思想实验中自由下落的人之所以感受不到自己的重量, 是因为他的自由下落使他处于了局域惯性参照系中, 从而引力场仿佛不存在了。
等效原理是一条新原理, 但它的根基是古老的, 深植于被伽利略等人注意到, 并经牛顿万有引力定律所确认的“物体在引力场中的加速度由物体所在之处引力场的场强所决定, 而与它的质量——以及其他性质——无关” 这一规律上。 因为否则的话, 假如组成人体的各种物质在引力场中的加速度因任何性质的差异而各不相同, 则哪怕自由下落也无法 “感受不到自己的重量”, 更遑论其他物理规律与惯性参照系里的物理规律相同了。
等效原理为构建新的引力理论提供了思路, 因为局域惯性参照系里的物理规律既然与不存在引力场时的惯性参照系里的物理规律相同, 那就可以由狭义相对论来描述。 那么引力场中的物理规律是什么呢? 答案就在爱因斯坦那 “一生中最快乐的思想” 里, 也就是 “将相对论推广到加速参照系”。
具体地说, 狭义相对论有一条所谓的 “相对性原理” (principle of relativity), 它要求物理规律在所有惯性参照系中都具有相同形式, 而 “将相对论推广到加速参照系” 则要求物理规律哪怕在非惯性参照系——也就是任意参照系——中也具有相同形式, 这被称为广义相对性原理 (generalized principle of relativity), 其数学表述被称为广义协变原理 (principle of general covariance)。 在此基础上最终构建出来的引力理论则被称为广义相对论 (general relativity)。
依据等效原理, 引力场 “有” 和 “无” 的区别——局域地讲——只是参照系的区别, 从而可以通过从局域惯性参照系到一般参照系的坐标变换来体现, 具体的体现方式则由广义协变原理所确定。 这听起来有些抽象, 做起来其实并不复杂, 因为在狭义相对论之后, 基础物理定律已大都表述为了具有洛仑兹协变性 (Lorentz covariance) 的张量方程, 这种方程距离广义协变原理的要求只有一步之遥, 我们要做的只是将局域惯性参照系中洛仑兹协变的张量方程改写为在任意坐标变换下都成立的所谓广义协变的张量方程即可。 这虽偶尔会出现需通过物理分析加以排除的歧义, 一般而言在数学上是轻而易举的, 往往只需依照所谓的 “最小替换法则” (minimal substitution rule), 将狭义相对论中的闵科夫斯基度规 (Minkowski metric) ημν 换成一般度规 gμν, 将普通导数 ∂μ 换成协变导数 ∇μ即可。 从这个意义上讲, 广义协变原理对物理规律基本不构成约束 (但作为数学要求则是很强的)。 一旦物理规律被表述为广义协变形式, 引力场的影响——即引力效应——也就被涵盖在内了。
不过这一切对于构建广义相对论来说都是外围的东西, 因为漏掉了一个最重要的因素, 那就是引力场本身的规律。 其他物理规律都可以通过将局域惯性参照系中的——也就是狭义相对论中的——物理规律改写为广义协变形式而得到, 唯独引力场本身的规律不行, 因为引力在局域惯性参照系中是不存在的。
那么引力场本身的规律该如何得到呢? 刚才提到的 “最小替换法则” 其实已给出了一个重要提示。 因为 “最小替换法则” 意味着引力效应全都体现在了闵科夫斯基度规与一般度规、 普通导数与协变导数的区别上。 而从数学上讲, 这种区别归根到底就在于度规 (因为普通导数与协变导数的区别实质上亦是度规之别)。 既然引力效应归根到底就体现在度规上, 我们可以猜测, 描述引力场的规律可以用度规 gμν 本身所满足的某个张量方程来描述。
爱因斯坦的研究确认了这一点, 这也是他在创立广义相对论过程中付出的最艰辛的努力。
为了看出究竟什么样的张量方程可以描述引力场, 我们考察一下在没有其他外力的情形下物体在引力场中运动。 依据等效原理, 在局域惯性系中, 该运动是匀速直线运动, 运动方程为:
其中 τ 是所谓的仿射参数 (affine parameter), 对有质量物体来说通常选为固有时 (proper time)。 依据广义协变原理, 引力场中的物体运动方程乃是上述方程的广义协变形式, 也就是众所周知的测地线 (geodesic line) 方程[5]:
dxμ /d2τ +Γμνλ (dxν/dτ) (dxλ/dτ)= 0 (2.5)
其中的 Γμνλ“马甲” 众多, 名称相当混乱, 有时称为克里斯托费尔联络 (Christoffel connection), 有时称为列维-奇维塔联络 (Levi-Civita connection), 有时称为黎曼联络 (Riemannian connection), 有时甚至笼统而不严格地称为联络。 我们姑取其中最著名的人物, 称其为黎曼联络, 它是由度规的导数构成的。 不难证明, 在物体运动速度远小于光速的情形下, 上式的空间部分可近似为:
由于 dxi/d2t 就是物体的加速度, 因此将 (2.6) 式与 (2.3) 式相比较, 并注意到 (2.3) 的右侧乃是引力场的场强, 我们便可得到一个粗略但富有启发性的对应, 那就是黎曼联络对应于引力场的场强[6]。 如果进一步考虑到引力场的场强是引力势的导数, 而黎曼联络则是由度规的导数构成的, 我们还可以得到另一个粗略但富有启发性的对应, 那就是引力势对应于度规。
有了这些启发性的对应, 描述引力场的方程就呼之欲出了, 因为建立在牛顿万有引力定律基础上的引力场方程是所谓的泊松方程 (Poisson's equation):
这里我们略去了牛顿万有引力常数 G。 在本系列中, 这一常数及光速 c 通常将被略去 (相当于采用 c=G=1 的单位制), 只在有特殊需要——比如计算数值——时才会予以恢复 (恢复的方法是量纲分析)。 由于泊松方程 (2.7) 式是关于引力势的二阶线性微分方程, 而我们刚才已经注意到了引力势对应于度规, 因此它启示我们寻找一个关于度规的二阶微分方程, 并且关于二阶导数是线性的。 当然, 它还必须是张量方程, 以便满足广义协变原理。 另一方面, 泊松方程的右侧是作为引力源的物质的质量密度, 这启示我们引进在狭义相对论中已被普遍采用的描述物质分布的能量动量张量 Tμν 作为引力场方程的右侧, 在非相对论近似下, 它的一个分量正是质量密度。
将这些启示综合起来, 引力场方程的形式可确定为右侧是能量动量张量 Tμν , 左侧是一个关于度规 gμν及其导数的二阶张量 (因右侧的能量动量张量是二阶二阶张量, 左侧也必须是二阶张量)。 不仅如此, 左侧的二阶张量还必须只包含度规的不超过二阶的导数, 并且关于二阶导数是线性的。 初看起来, 这样的条件相当宽泛, 但源自广义协变原理的广义协变性极大地限制了方程的形式。 事实上, 在数学上可以证明, 满足上述条件的引力场方程左侧的二阶张量必定具有 αRμν + βgμνR + γgμν 的形式。 这里 Rμν 是所谓的里奇曲率张量 (Ricci curvature tensor), R 是 Rμν 的缩并, 称为曲率标量 (curvature scalar), α、 β 和 γ 则皆为常数。 更令人满意的是, 引力场方程右侧的能量动量张量 Tμν 还必须满足广义协变形式的能量动量守恒定律 ∇μTμν = 0, 这对方程左侧作出了进一步限制, 要求 β=(-1/2)α。 将这些结果综合在一起, 并辅以弱场近似下引力场方程等同于泊松方程这一额外要求 (这一要求可用来确定左右两侧的比例系数), 可将引力场方程——也就是广义相对论的基本方程——最终确定为:
Rμν — (1/2)gμνR — Λgμν = 8πTμν (2.8)
这其中左侧的最后一项——即 Λgμν 项——被称为宇宙学项 (cosmological term), 其中的常数 Λ 被称为宇宙学常数 (cosmological constant)。 宇宙学项从单纯理论推导的角度讲处于一个灰色地带, 因为严格贯彻 “弱场近似下引力场方程等同于泊松方程” 这一要求其实是可以排除这一项的, 但只要宇宙学常数 Λ 足够小, 这一项的存在既不破坏广义协变性, 也不会与经验意义上的泊松方程相矛盾, 因此是可以允许的。 在历史上, 宇宙学项的命运颇有戏剧性, 爱因斯坦最初创立广义相对论时是不包含宇宙学项的, 后来出于寻找一个静态宇宙模型的需要, 他引进了宇宙学项。 等到静态宇宙模型被观测否定之后, 宇宙学项也一度失了宠。 但到了 20 世纪末, 精密的宇宙学观测重新确立了宇宙学项的必要性, 使后者 “王者归来”[7]。
宇宙学项对于宇宙的长远未来有着极重要的影响, 但对于本系列所涉及的话题却关系不大, 因此除非有特殊需要, 我们将予以略去。 略去了宇宙学项的引力场方程为:
Rμν — (1/2)gμνR = 8πTμν (2.9)
这就是本系列将要采用的基本方程, 也称为爱因斯坦场方程 (当然, 包含宇宙学项的场方程也同样称为爱因斯坦场方程), 是爱因斯坦 1915 年得到的[8]相对论的物理规律开始延展的, 因此广义相对论确如爱因斯坦所预期的, 自动解决了将他引导到引力理论上来的牛顿万有引力定律与狭义相对论不相容的问题。 当然, 上面的叙述是高度浓缩和简化了的广义相对论发展史, 且偏于概念发展的逻辑线索而并不严格对应于爱因斯坦的努力。 从单纯历史的角度讲, 广义相对论的发现其实还有很多额外的曲折性, 这里就不赘述了[9]。
爱因斯坦场方程远比电磁场方程复杂, 因为它是非线性的。 不过这是意料中的结果, 因为跟电磁场本身不带电荷不同, 引力场本身就带有能量动量, 从而本身就能产生引力场[10]。 此外, 爱因斯坦场方程还有一个鲜明特点, 那就是右侧有赖于物质, 而左侧只跟时空有关——因为左侧的所有项都是由度规及其导数构成的。 不仅如此, 左侧的里奇张量乃是时空曲率张量 (curvature tensor) 的缩并, 在一定程度上描述了时空的弯曲。 这种漂亮的几何意义, 外加前面提到过的引力效应——具体地说是引力对物质运动的影响——体现在度规上这一结论, 使美国物理学家惠勒 (John Archibald Wheeler) 用了一句很精炼的话来概述广义相对论的特点, 那就是 “时空告诉物质如何运动, 物质告诉时空如何弯曲”。
在爱因斯坦的这种全新的引力理论中, 传统的牛顿引力消失了, 取而代之的是弯曲的时空, 为了纪念爱因斯坦的巨大贡献, 这种时空也被称为爱因斯坦时空。 从牛顿引力到爱因斯坦时空, 是科学史上最激动人心的进展之一。
引力理论跟时空结构的这种交融在等效原理中其实已可窥见端倪, 因为等效原理表明引力场中任何一个时空点附近都存在局域惯性参照系, 而局域惯性参照系中的物理规律由狭义相对论所描述, 其中的度规是闵科夫斯基度规, 这跟微分几何中每点的邻域内存在局域笛卡尔坐标系 (Cartesian coordinate system) 是完全相似的。 两者在数学结构上的相似和交融也就不足为奇了。
从亚里斯多德算起, 经过了 2,200 多年; 从伽利略和牛顿算起, 经过了 200 多年, 我们终于迎来了广义相对论与爱因斯坦时空。 如今又 100 多年过去了, 在这种全新的引力理论和全新的时空中, 很多新兴研究领域已经发展壮大, 引力波就是那样一个领域。
注释
1. 这里要说明的是: 牛顿对万有引力的研究比《自然哲学的数学原理》一书的出版早了约 20 年就开始了, 其间有过错误和不完善。 与牛顿同时代的学者中有数人也猜到了引力的平方反比规律, 而且从历史的角度讲, 他们与牛顿之间并不愉快的互动对牛顿的研究不无助益。 不过万有引力定律的确立涉及到几个很重要的层面, 比如为了证明万有引力定律可以解释天体运动, 需在开普勒定律与万有引力定律之间进行相互推导 (其中用到了牛顿运动定律);又比如万有引力定律的原始适用条件是大小相对于间距可以忽略的物体, 这对天体基本成立, 对地球上的重物下落却并不成立 (因为地球本身显然不满足这一条件), 需额外证明球对称物质分布产生的引力相当于物质全部集中在球心; 而在更一般的物质分布下还需用到微积分手段。 当时能从数学上胜任所有这些的只有牛顿, 因此将万有引力定律的发现归功于牛顿并冠以他的名字是毫不过分的。 另外要补充的是: (2.2) 式给出的只是万有引力的大小, 其方向则由引力的吸引特性所确定, 即每个物体所受来自另一个物体的引力总是指向另一个物体。
2. 当然, 无论加速度还是引力场的场强都是有方向的, (2.3) 式给出的只是大小, 其方向则跟引力的方向一样, 指向质量为 M 的物体 (在更一般的物质分布下则大小和方向都要用微积分手段来计算)。 另外要说明的是: 将这些结果具体应用到地球引力场中的重物下落, 除了用到前一注释提到的 “球对称物质分布产生的引力相当于物质全部集中在球心” 这一结果外, 还隐含了物体的大小及下落的高度相对于物体与地心的距离可以忽略这一近似度很高的额外假设。
3. 对这一发现感兴趣的读者可参阅拙作《那颗星星不在星图上: 寻找太阳系的疆界》 (清华大学出版社 2013 年 12 月出版)。
4. 某些广义相对论著作对等效原理进行了细分, 在那样的细分下, 这里所介绍的等效原理被称为 “强等效原理” (strong equivalence principle)。 另外要提醒读者的是, 等效原理其实允许一些微妙的、 并不妨碍广义相对论的例外, 对这一点感兴趣的读者可参阅拙作 从等效原理到爱因斯坦-嘉当理论, 收录于《因为星星在那里: 科学殿堂的砖与瓦》一书 (清华大学出版社 2015 年 6 月出版)。
5. 有读者也许会问: 测地线方程可以用前面提到的 “最小替换法则” 得到吗? 答案是肯定的。 事实上, 局域惯性参照系中的运动方程 (2.4) 式可以表示为 uρ∂ρuμ = 0 (其中 uμ 是四维速度), 运用 “最小替换法则” 可将之改写为 uρ∇ρuμ = 0, 其分量形式正是 (2.5) 式。
6. 顺便说一下, 由此可以得到等效原理的一种数学表述, 那就是: 在引力场中任何一个时空点附近都存在特殊的坐标系 (即局域惯性参照系), 其中的度规为闵科夫斯基度规, 而黎曼联络为零 (即引力场为零)。
7. 对宇宙学项的历史感兴趣的读者可参阅拙作 宇宙学常数、 超对称及膜宇宙论。
8. 确切地说, 爱因斯坦得到的场方程是 Rμν = -k(Tμν - ½gμνT), 不过它与我们采用的形式只有约定等方面的差别, 实质上是等价的。
9. 对广义相对论的发展历史感兴趣的读者可参阅拙作 希尔伯特与广义相对论场方程, 收录于《小楼与大师: 科学殿堂的人和事》一书 (清华大学出版社 2014 年 6 月出版)。
10. 不过, 引力场本身的能量动量是广义相对论研究中一个很困难的课题, 对这一课题感兴趣的读者可参阅拙作《从奇点到虫洞: 广义相对论专题选讲》 (清华大学出版社 2013 年 12 月出版)。
本文为卢昌海先生最新力作,《赛先生》获授权首发。欲读作者更多文章,可查看卢昌海个人主页www.changhai.org,或点击页面左下角“阅读原文”直达该网站。