爱因斯坦
数学仅仅涉及概念间的相互关系,而不考虑它们与经验之间的关系。物理学也涉及到数学概念,但是,只有当清楚地确定了它们与经验对象的关系之后,这些概念才获得物理内涵。这一点在运动、空间、时间概念上表现得尤为明显。
相对论正是建立在对以上这三个概念前后一贯的解释基础之上。“相对论”这个名称是与如下事实相关的,即:从可能的经验观点来看,运动总是表现为一个物体对于另一个物体的相对运动(比如汽车相对于地面的运动,地球相对于太阳和恒星的运动)。运动绝不会作为“相对于空间的运动”——或者,像有人所表述的——“绝对运动”而被加以观察。“相对性原理”在其最广泛的意义上为如下一句论断所蕴含:所有的物理现象都有这样一个特点,它们未给“绝对运动”概念的引进提供任何依据;或较为简洁却不怎么精确的表述:不存在绝对运动。
从这样一个否定的论断中,我们似乎看不到什么洞见。但事实上,它却是对(可以想象的)自然规律的一个严格限制。在这种意义上,相对论与热力学有着某种类似之处。后者也是基于“不存在永动机”这一否定性论断之上。
相对论的发展历经了“狭义相对论”和“广义相对论”两个阶段。后者假定了前者作为一种极限情形的有效性,它是前者的连贯一致的延续。
A.狭义相对论
经典力学中对空间和时间的物理解释
从物理的观点来看,几何学是一些定律的总和,由这些定律能把相互静止的刚体置于彼此相对的位置上(比如,一个三角形由三条端点永远连接的杆组成)。人们设定用这种解释,欧几里得定律是有效的。在这种解释中,“空间”原则上是一个无限的刚体(或框架),其他的物体是与之相关联的(参照系)。解析几何(笛卡尔)用三个相互正交的刚性杆作为参照体表现空间,在这些刚性杆上通过垂直投影这一熟悉的办法(利用刚体的单位尺度),便测得空间点的“坐标”(x,y,z)。
物理学研究空间和时间中的“事件”。每一个事件不仅有自己的空间坐标x,y,z,还有一个时间值t。后者被认为可利用一个其空间大小可以忽略(作理想周期循环)的钟来测得,这个钟C被看作在坐标系中一点,例如在坐标原点(x=y=z=0)处是静止的,在空间点P(x,y,z)上发生的事件的时刻便被规定为与事件同时的钟C所显示的时刻。在这里,假定“同时”的概念无需专门的定义就有物理上的意义。这种精确性的缺乏似乎是无害的,只因光(其速度在我们日常经验看来几乎是无限的)使得空间上分开的事件的同时性看起来能被立即加以确定。
通过利用光信号来从物理上定义同时性,狭义相对论消除了这个精确性的缺乏。在P点发生事件的时间t就是从该事件发出的光信号到达时钟C时从C上读的时间。考虑到光信号通过这一距离所需事件,对这一时刻进行了修正。在做这种修正时,(假定)光速为常数。
这个定义把空间上分开的两个事件的同时性概念归化为在同一地点发生的两个事件(即光信号到达C和C上的读数)的同时性(符合)。
经典力学以伽利略原理为基础,即:只要其他物体对其没有作用,一个物体总是作直线匀速运动。这一陈述并非对于任意运动的坐标系都是正确的,它仅能适用于所谓的“惯性系”。惯性系互相作直线匀速运动。在经典物理学中,所有定律仅仅对全体惯性系才能说是适用的(狭义相对性原理)。
现在便很容易理解导致产生狭义相对论的那个窘境。经验和理论都逐渐使人确信,光在真空中总是以不变的速度C传播,而与光的颜色及光源运动状态无关(光速恒定原理——以下称为“L—原理”)。然而基本的直观考虑似乎表明同一光线不可能相对所有惯性系都以同样的速度C运动。L—原理似乎同狭义相对性原理发生了矛盾。
但实际上这个矛盾不过只是一个表面现象,它实质上是基于对事件的绝对性,或对空间分开的事件的同时性的偏见之上。我们刚刚看到,一个事件的x,y,z和t目前只能相对于某一个选定的坐标系(惯性系)来确定。如果没有特定的物理假设,从一个惯性系过渡到另一个惯性系而实现事件的x,y,z变换(坐标变换)是不可能的。然而,下面的假定却恰好足以作为一种解决方案;L—原理对所有惯性系都成立(狭义相对性原理对L—原理的应用)。由此而确定的关于x,y,z,t的线性变换称为洛仑兹变换。洛仑兹变换在形式上以由两个无限靠近的事件的坐标差dx,dy,dz,dt构成的表达式 不变为特点(即通过变换之后,由新坐标系中坐标差构成同样的表达式)。
有了洛仑兹变换,狭义相对论原理可以表述为:自然规律对于洛仑兹变换都是不变的(即,若通过x,y,z,t的洛仑兹变换对某个自然规律引进一套新的惯性系,则此自然规律不会改变其形式)。
狭义相对论引发了对空间和时间的物理概念的清晰理解。与之相关的,也引发了对运动着的测量杆和测量钟的行为的认识。它在原则上去掉了绝对同时性的概念,从而也摆脱了牛顿意义上的远距离瞬间作用的概念。它表明了当处理运动速度同光速相比不是小得可以忽略的运动时,如何对运动规律进行修改。它导致了麦克斯韦的电磁场方程组形式上的澄清,尤其是它还引发了对电场和磁场本质上的同一性的理解。它把动量守恒和能量守恒这两个规律统一起来,从而展示了质量和能量的等效性。从形式的观点上看,人们可以这样来刻划狭义相对论的成就:它概括地表明了普适常数c(光速)在自然规律中扮演的较色,同时展示了以时间为一方,空间坐标为另一方,两者进入自然规律的方式之间存在着密切联系。
B.广义相对论
狭义相对论把经典力学的基础限定在一个基本点上,即下列论断:自然规律仅对惯性系成立。“允许的”坐标变换即那些使规律形式不变的变换只有(线性)的洛仑兹变换。这类限制真的有物理事实根据吗?下面的论证令人信服地否定了它。
等效原理。物体具有惯性质量(对加速度的抗性)和重的质量(它决定物体在特定引力场,比如地球表面场中的重量),这两个从定义上看来如此不同的量,但按照经验,是用一个同样的数值来度规的。对此,一定有更深层的原因。这一事实也可这么来表述:不同质量的物体在同一引力场中得到相同的加速度。最后,它也可以这样表述:物体在引力场中的行为可以和没有引力场情况下相同,只要后一情形所用的参照系是一个匀加速坐标系(而不是惯性系)。
因而,似乎没有理由禁止对后一情形作如下的解释。人们把这个坐标系看作是“静止的”,将相对它而存在的“表观”引力场看作是“真实的”。由坐标系的加速度而“产生”的引力场当然具有无限的延展范围,它不可能由有限区域的引力质量产生。然而,若我们要寻找一个类场的(field like)理论,这一事实并不妨碍我们。有了这种解释,惯性系便失去了意义,而且我们获得了关于引力质量和惯性质量等效的“说明”(物质的这一同一性质表现为重量或惯性,由描述方式来决定)。
从形式上考虑,承认相对原来“惯性”坐标作加速运动的坐标系也就意味着承认非线性坐标变换,进而大大推广了不变性的思想,即相对性原理。
首先,利用狭义相对论的结果所做的深入讨论表明,有了这么一种推广,坐标不能再直接解释为测量的结果。只有当坐标差与描述引力场的场量结合起来才能确定事件间可测量的距离。当人们发现自己不得不承认非线性变换作为等效坐标系间的变换之后,最简单的要求看来是承认所有连续的坐标变换(它们形成一个群),也即承认任何以正则函数来描述场的曲线坐标系(广义相对性原理)。
现在不宁理解为何广义相对性原理(基于等效性原理之上)导致了引力理论。有一种特殊的空间,其物理结构(场)我们假设能在狭义相对论基础上被精确得知,它是没有电磁场和物质的空的空间(empty space),它完全由其“度规”性质所决定:以 , , , 表示两个无限接近点(事件)的坐标差,则
(1)
是一个依赖惯性系的特殊选择的可测量的量。若通过广义坐标变换在这个空间中引入新的坐标 , , , ,那么对于同一对点的值便有了另一种表达式:
(2)
式中, 。根据等效原理,组成“对称张量”且为 … 之连续函数的 描述了一种特定的引力场(即能够重新变换为形式(1)的场)。从黎曼[1]对度规空间的研究,我们可以得到 场的精确数学属性(“黎曼条件”)。然而,我们所要寻求的却是能够对“一般”引力场能满足的方程。自然,假定它们也能被描述为 类型的张量场,这种场一般不允许回到形式(1)的变换,即不满足“黎曼条件”,只满足一些稍弱的条件,这些条件恰同黎曼条件一样也独立于坐标系的选择(即是广义不变的)。作简单的形式考查,便能导出与黎曼条件紧密相连的弱条件,这些条件正是纯引力场(存在于物质外面并且没有电磁场)方程。自然,假定它们也能被描述为 类型的张量场,这种场一般不允许回到形式(1)的变换,即不满足“黎曼条件”,只满足一些稍弱的条件,这些条件恰同黎曼条件一样也独立于坐标系的选择(即是广义不变的)。作简单的形式考查,便能导出与黎曼条件紧密相连的弱条件,这些条件正是纯引力场(存在于物质外面并且没有电磁场)方程。
这些方程以近似定律的形式给出了牛顿的引力力学方程,此外还得出一些已为观察所证实的微小效应(星体引力场引起的光线弯曲,引力势对辐射光线频率的影响,行星椭圆轨道的缓慢旋转——水星近日点运动)。进一步,它们又给出了银河系的膨胀运动的解释,而这一运动是那些星系发出的光线的红移所表现出来的。
广义相对论至今仍是不完备的,它只能较为令人满意地把广义相对性原则应用到引力场,而不能用于总场。我们仍不能确切知道在空间中的总场可用什么数学机制来描述,以及总场遵从何种广义不变定律。但有一点似乎可以肯定,即:广义相对性原理将会被证明是解决统一场问题的一个必要而且有效的工具。
为了理解质量和能量相当定律,我们有必要回顾一下两个守恒或称“平衡”原则,这两个相互独立的原理,在相对论以前的物理学中处于一个很高的地位。它们就是能量守恒原理和质量守恒原理。其中第一个[原理]早在十七世纪就由莱布尼兹提出来,而它在19世纪本质上被发展为力学原理的一个推论。
例如,考察一个摆锤在A和B两点间来回摆动的摆。在A和B两点处,质量为m的摆锤比它在路径上的最低点(见图)C 点高出一值h。另一方面,在C点上升的高度没有了,取而代之摆锤有了速度。似乎高度能够完全转换为速度,反之亦然。确切的关系可表为 ,其中g代表重力加速度。在这里,有趣的是,这个关系与摆的长度及摆锤运动路径的形状无关。
意义深远的是,全过程中有某种东西保持恒定,这种东西就是能量。在A点和在B点,它是位能或“势”能;在C点它是运动能量,即“动”能。若此概念正确的话,那么 之和在摆的任一位置必具有相同的数值,只要把h理解为代表高于C的高度,v代表摆在路径上该位置的速度即可。事实证明确实是如此。这个原理的推广给了我们机械能守恒定律。但是当有摩擦阻止摆的时候,会发生什么呢?
答案在对热现象的研究中被找到了。基于热量为不可灭的,从高温物体流向低温物体这一假设的研究,似乎赋予我们了一个“热守恒”原理。另一方面,就像印第安人取火操作中发生的那样,热可由摩擦而“产生”,这从远古时就已为人所知了。长期以来,物理学家未能说清这种热量的产生。只有在“对由摩擦所产生的任一定量的热量必有一与之精确地成比例的数量的能量被消耗”被成功地确立时,他们的困难才得以克服。因而我们得到了“功和热互等”原理。比如对我们的摆而言,机械能逐渐被摩擦转化为热能。
这样一来,机械能守恒原理和热能守恒原理便被合并为一条原理了。物理学家于是确信守恒原理能够进一步推广,以致于包括了化学和电磁过程——一句话,可应用于所有领域。看来,在我们的物力体系中,有个能量的总和,历经任何可能发生的变化依然保持不变。
现在谈谈质量守恒原理。质量是用物体反抗它的加速度的阻力(惯性质量)来加以定义的。它亦可通过对物体称量测得(重力质量)。这两个根本不同的定义居然得出同一个物体质量的数值,这本身就是件惊人的事实。根据质量在任何物理的或化学变化中保持不变的原理,质量似乎应是物体的本质(由于是不变的)属性。加热、熔化、汽化或结合成化学化合物都不会改变其总质量。
几十年前物理学家还接受此原理,但在狭义相对论面前,它却证明是不正确的。因而它和能量守恒原理结合起来——正如大约在60年前,机械能守恒原理同热能守恒原理结合起来一样。我们可以说,先前吞并了热量守恒的能量守恒原理,现在又吞并了质量守恒原理,从而独占了物理学领域。
习惯上,我们用公式 表示质量和能量的互等性(虽然有点不大确切),其中c代表光速,约为186000英里/秒,E为蕴含在静止物体中的能量,m为其质量。质量m的能量等于其质量乘以巨大的光速平方——也就是说,每单位质量对应着一个巨大的能量。
但是,若每克物质都具有偌大的能量,为何如此长期地未被注意到呢?答案很简单,只要没有能量被释放出来,它就不会被观测到。正如一个富得令人难以置信的家伙从不舍得花费或捐出一分钱,便没人能说出他有多富一样。
现在我们把这个关系反过来,可以说能量在数值上每增加E,必然伴随有质量上的增加 。我能很容易地把能量提供给质量——比如,我把它加热10度。那么为何不去测与此变化相关的质量增加,或者重量增加呢?这里的问题在于:在质量增加中,巨大的因子是作为分母出现的,因此,(质量的)增加就太小了,而不能直接测得——即使用最灵敏的天平也测不出来。
为使质量的增加可以测出来,那每单位质量的能量的变化便要非常之大。我们只了解到一种这样数额的单位质量的能量被释放的场合,即放射性裂变。简言之,过程如此进行:具有质量M的原子分裂为两个以巨大的动能离开的质量为M’和M’’的原子。如果我们想象这两个质量停下来静止不动——也就是说,如果我们减损它们的运动的能量——那么,合起来考虑,它们实质上在能量上比原来的原子要少一些。根据互等性原理,裂变产物的质量总和M’+M’’肯定也会比裂变原子原来的质量M少——这与旧的质量守恒原理相冲突。两者的相对差约为1/1000的数量级。
现在,我们实际上不能逐个测得原子的重量,不过却有精确测量它们重量的间接手段。我们同样可以测定传给裂变物M’和M’’的动能。因而,检验和证实互等公式就成为可能。还有,这条定律使得我们可以从精确测得的原子的重量,预先算出恰有多少能量随着我们想象中的任一原子裂变被释放出来。当然,至于裂变反映是否能够发生或者怎样发生,这条定律谈不出什么来。
所发生的事可以借助于我们[提到]的大财主的比喻来加以说明。原子M是一个富有的守财奴,在其一生中未曾花费一个铜板(能量)。但在他的遗嘱中,他把他的财产传给他的儿子M’和M’’,条件是他们分出不足总量(能量或质量)千分之一的那么一小部分给社会。儿子们总共拥有的财富比其父要稍微少一点(质量M’+M’’之和比放射性原子的质量M略少一点)。分给社会的那部分尽管相对来说很少,却还是如此惊人的大(作为动能来考虑),以致罪恶的巨大威胁与之俱来。防止这种威胁已成为我们时代最为迫切的问题。
什么是相对论?
我很高兴能接受你们同事的要求为《泰晤士报》写点关于相对论的东西。在过去学者之间那种主动的交流可悲地衰败了的现在,我欢迎这个向英国天文学家和物理学家们表达我的欣喜之意和感激之情的机会。杰出的科学家仍不惜花费大量的时间和辛劳,并且你们的科学院不惜任何代价,以检验一个战时在你们的敌国得以完成并发表了的理论的推断,这完全符合贵国科学工作的伟大而骄人的传统。尽管考察太阳的引力场对光线的影响是个纯客观的问题,但鉴于它们的工作,我依然忍不住要表达我个人对我的英国同事们的感谢。因为若无这一工作,我几乎不能在我活着时看到我的理论中最重要的推断被检验。
我们可以把物理学中的各种理论进行分类。它们中的大多数都是建构性的(constructive)。它们试图从一个相对简单的形式系统的材料出发,对更为复杂的现象构建出一幅图景来。因而气体的运动理论努力把机械运动、热运动和扩散过程都归于分子运动——即从分子运动的假设出发构建这些过程。当我们宣布我们已经成功地理解了一组自然过程时,我们不外乎是表明一个涵盖这些尚存疑问的(in question)过程的建构性理论被发现了。
与这一类最重要的理论在一起的,还有另一类,我称之为“原理理论”(principle-theories)。它们应用分析的,而非综合的方法。构成它们的基础和出发点的元素并非是假设性地被建构出来的,而是在经验中被发现了的一些东西,它们是自然过程的普遍特性,是能导出数学上用公式表示的标准的原理——独立的过程或理论表述必须满足这些标准。热力学正是从不存在永动机这个普遍的经验事实出发,利用分析的方法来推导出独立事实必须满足的必然条件。
建构性理论的长处在与其完备性、适应性和清晰性,而原理理论的长处则在与逻辑的完美和基础的坚实。
相对论属于后一类理论。为掌握其本质,首先必须熟知它所依赖的原理。不过,在我还没讲这些原理前,必须看到相对论就像一个两层的建筑,一层是狭义相对论,一层是广义相对论。作为广义相对论基础的狭义相对论适用于除引力之外的各种物理现象,广义相对论则提供了引力定律及其与其他自然力的联系。
众所周知,从古希腊时代开始,为了描述一个物体的运动,就需要有另一个为第一个物体所参照的物体。一辆车的运动被认为是相对地面而言,一颗行星的运动是相对可见的恒星的整体而言。在物理学中,使事件在空间上被加以参照的物体称为坐标系。例如伽利略和牛顿的力学定律只有依靠坐标系才能表示为公式。
然而,若要使力学定律成立,坐标系的运动状态便不能是任意的(它必须没有旋转和加速度)。力学中所用的坐标系统称为“惯性系”。根据力学,惯性系的运动状态不是由自然惟一决定。相反,下面的定义却是成立的:相对一个惯性系以直线匀速运动的坐标系也是惯性系。“狭义相对性原理”就意味着这个定义的推广,用以包括任何自然事件:这就是说,每个对于坐标系C有效的普遍自然规律,必定同样适用于相对于C作匀速平移运动的坐标系C’。
狭义相对论孙依赖的第二条原则,便是“真空中光速不变原理”。这条原理认为,光在真空中总是有确定的传播速度(与观察者或光源的运动无关)。物理学家们对这条原理的信任源于麦克斯韦和洛仑兹的电动力学所取得的成就。
上述的两个原理都得到经验事实强有力的支持,但又似乎未能在逻辑上和谐一致。狭义相对论最终通过对运动学的修改——也就是对与空间和时间有关的规律的修改(从物理学观点看)——成功地使它们达到逻辑上的一致。这就让人明白:若不是相对于给定的坐标系而言,谈论两个事件的同时性是毫无意义的。而且,测量装置的形状及钟的运动的速度都与它们相对于坐标系的运动状态有关。
但是旧的物理学,包括伽利略和牛顿的运动定律都不适用于上面提到的相对论性运动学。若上述两原理真的适用的话,自然规律就必须遵循由后者产生出的一些普遍的数学条件。物理学必须适应这些条件。尤其是,科学家得到了关于(飞速运动着的)质点的一个新的运动规律,这一点已被带点粒子的情况极好地证实。狭义相对论最重要的结果是关于物质体系的惯性质量。它表明某体系的惯性必定有赖于其能量含量。从而又直接导致这样一个观念:惯性质量就是潜在的能量。质量守恒原理失去了其独立性,从而与能量守恒原理融为一体。
狭义相对论本来就是麦克斯韦和洛仑兹[2]的电动力学的系统化发展,但它又超越了自身。难道物力规律同坐标系的运动状态无关这一点仅局限于坐标系的相互匀速平移运动吗?大自然与我们的坐标系及其运动有何相干?若是为了达到描述自然的目的,有必要选用任意导入的坐标系的话,那么这个坐标系的运动状态的选择应不受限制,而定律应完全与这种选择无关(广义相对性原理)。
由这样一个早已清楚的事实,即物体的重量和惯性为同一常数所控制(惯性质量和引力质量互等),广义相对性原理的建立变得容易多了。设想有一个相对于另一个在牛顿意义上惯性系作匀速转动的坐标系。按牛顿的教导,出现在该系统的离心力应当被认为是惯性的效应。但这些离心力却完全同重力一样,与物体质量成正比。在这种情况下,难道不可能吗?把坐标系看成是静止的,而把离心力看成是万有引力,这看起来显而易见,但经典力学却不允许这样。
这种过于仓促的考虑表明,广义相对论必须提供引力定律,这个观点的坚定的追随者们证明我们的愿望是合理的。
但路途比人们所想象的更为荆棘密布,因为它要求抛弃欧几里得几何。也就是说,安置在空间中的固定物体所遵循的定律与由欧几里得几何提供给那些物体的定律不完全一样,这正是我们所说的“空间曲率”的意思。因而,诸如“直线”、“平面”等这些基本概念,在物理学中已失去了其确切意义。
在广义相对论中,关于空间和时间的学说,或称运动学,不再是与物理学的其他方面无关的了。物体的几何特性和钟的运动依赖于引力场,这些场本身又是由物质产生的。
从原理上看,新的引力理论同牛顿的理论全然不同。但其实际结果与牛顿理论的结果又如此接近,以致很难找到经验能及的标准来区别它们。迄今为止已发现的有:
(1) 绕太阳的行星椭圆轨道的转动(在水星的例子中已得到证实)。
(2) 引力场引起的光纤弯曲(为英国人的日食照片所证实)[3]。
(3) 当光线从相当大光度的恒星传播到我们这儿时,光谱线向光谱红端偏移(至今未被证实)。
该理论主要的吸引力在于其逻辑的完备性。若有一个由它得到的结论被证明是错误的,它就必须被抛弃。修改它而不破坏整个结构似乎是不可能的。
然而,不要认为牛顿的辉煌成就真的能被这种理论或任何其他理论所取代。作为自然哲学领域中我们整个现代概念结构的基础,其伟大而明晰的思想将始终保持其独特的意义。
什么是相对论?
从原理上看,新的引力理论同牛顿的理论全然不同。但其实际结果与牛顿理论的结果又如此接近,以致很难找到经验能及的标准来区别它们。迄今为止已发现的有:
(1) 绕太阳的行星椭圆轨道的转动(在水星的例子中已得到证实)。
(2) 引力场引起的光纤弯曲(为英国人的日食照片所证实)。
(3) 当光线从相当大光度的恒星传播到我们这儿时,光谱线向光谱红端偏移(至今未被证实)。
外国高深莫测的相对论,约等于中国古老的周易。