跳至正文

线性代数与量子力学:矩阵如何成为物理的语言

🟣 数学严格 · 📅 2026年3月 · ⏱ 阅读约18分钟

1925年,二十四岁的海森堡坐在黑尔戈兰岛一间小旅馆里,打了一整夜的算盘——不是普通的计算,而是用神秘的”乘法不可交换的量”来描述氢原子光谱。他不知道自己发明了什么,但他知道这行得通。几个月后,玻恩一眼认出那些规则:那不过是大学线性代数课讲的矩阵乘法。从那一刻起,线性代数就成了量子力学的母语——不是比喻,是字面意义上的。

这篇文章不是在教你量子力学,也不是在教你线性代数。它要做的,是站在两门学科的交界处,让你看清楚:当物理学家说”量子态”,数学家听到的是”向量”;当物理学家说”可观测量”,数学家听到的是”厄米算符”;当物理学家说”测量结果”,数学家听到的是”本征值”。这门翻译,改变了人类理解现实的方式。

📑 本文目录

量子态是向量:从箭头到无穷维空间

在中学物理里,向量是带方向的箭头:速度向量、力向量。到了大学线性代数,向量的概念被彻底抽象化:任何满足加法和数乘规则的对象都可以叫向量。多项式是向量,函数是向量,量子态——也是向量。

量子力学的第一公设就是:一个量子系统的完整状态由一个向量描述,这个向量活在某个线性空间里。翻译成人话:电子的全部信息——它的位置、动量、自旋——都被一个数学对象编码,这个对象遵循加法和数乘的规则。

关键在于”叠加”。如果 |↑⟩ 是电子自旋向上的状态,|↓⟩ 是自旋向下的状态,那么:

|ψ⟩ = α|↑⟩ + β|↓⟩,其中 |α|² + |β|² = 1

这也是合法的量子态。翻译成人话:电子可以同时”有点朝上”又”有点朝下”,就像两个向量的线性组合构成新向量一样。这不是物理比喻——这就是字面上的向量加法。叠加原理之所以成立,正是因为量子态是线性空间的元素。你可以去量子力学基础一文了解叠加的物理含义,这里我们聚焦它的数学骨架。

希尔伯特空间:量子力学的舞台

不是所有线性空间都适合量子力学。物理学家需要一个有”内积”的空间——也就是说,两个向量之间可以计算”夹角”和”长度”——而且这个空间要足够”完备”,不能有漏洞。满足这些条件的就是希尔伯特空间(Hilbert Space)。

对于有限维量子系统(如两态的电子自旋),希尔伯特空间就是普通的复数向量空间 ℂⁿ。对于连续自由度(如粒子的位置),希尔伯特空间是平方可积函数的集合 L²(ℝ)——无穷维的。

但有一个重要的精确性问题:当物理量(如动量、能量)的取值是连续谱时,标准希尔伯特空间的框架会出现技术麻烦——平面波 e^(ipx) 并不属于 L²(ℝ),因为它在全空间的模方积分是发散的。为此,数学家发展了”配备希尔伯特空间”(rigged Hilbert space)的框架,用一个更精细的三层结构来容纳连续谱。[1] 翻译成人话:标准希尔伯特空间对有界态很好用,但处理自由粒子时需要升级工具箱。

希尔伯特空间的维度本身也是物理资源。一个系统的状态空间维度越高,它能编码的信息就越多——这在量子信息领域有着直接的实践意义。[13] 翻译成人话:更高维的量子系统就像更大的黑板,能写下更多东西。

更深刻的问题是:为什么量子力学偏偏用希尔伯特空间,而不是别的结构?D’Ariano 的工作表明,仅从”可以做实验”的操作性公理出发,希尔伯特空间的形式体系可以被唯一导出[2]——数学不是强加给物理的,而是从物理实验的逻辑结构中自然涌现的。

Dirac 的天才符号:bra 与 ket

1939年,狄拉克发明了一套符号,让全世界的物理学家从此爱上线性代数:bra-ket 记号(也叫狄拉克记号)。

ket(右矢):|ψ⟩,表示希尔伯特空间中的一个向量,也就是量子态本身。
bra(左矢):⟨ψ|,表示 |ψ⟩ 的”对偶”——在数学上是一个线性泛函,作用在 ket 上返回一个复数。

两者合在一起 ⟨φ|ψ⟩ 就是内积——”bracket”(括号)拆开就是 “bra” + “ket”,这也是名字的由来,狄拉克以物理学家少见的幽默感创造了这个双关。

内积 ⟨φ|ψ⟩ 的模方 |⟨φ|ψ⟩|² 就是:系统在 |φ⟩ 状态下测量后得到 |ψ⟩ 状态的概率。翻译成人话:两个量子态有多”相似”,决定了测量时从一个跳到另一个的概率。这是玻恩规则的线性代数版本。

数学家们研究了 bra-ket 记号的精确数学含义,发现它在有限维情况下对应普通的厄米转置,在无穷维连续情况下则需要配备希尔伯特空间框架中的广义函数(即分布)才能严格定义。[6][7][8] 甚至 bra 和 ket 的”量纲”问题也被认真研究过[9]——这说明这套符号尽管优雅,背后的数学并不简单。

算符即观测:厄米矩阵的物理意义

在经典力学中,可观测量(位置、动量、能量)是数字,给定状态就能精确读出。在量子力学中,可观测量变成了作用在希尔伯特空间上的线性算符——即矩阵(在有限维情形下)。

为什么是算符而不是数字?因为量子态是叠加态,同一个量子态对应的测量结果可能有多种可能——算符正是编码这种”一态多值”结构的数学对象。

物理上要求可观测量是实数(能量不能是虚数),对应的数学条件是:算符必须是厄米算符(Hermitian operator),即满足 † = Â,转置后取复共轭等于自身。翻译成人话:厄米矩阵的本征值全是实数,这保证了测量结果必然是实数。

Dirac 早期就看到,量子力学的代数结构——算符的乘法——比经典数字的乘法多了一个关键特征:不可交换性。位置算符 x̂ 和动量算符 p̂ 满足 x̂p̂ ≠ p̂x̂。Bohm 等人进一步指出,这种”q数”(量子数)的代数与代数量子力学以及 Wheeler 的”前几何”思想有深刻关联[3]——非对易的算符代数可能比时空本身更基本。

本征值就是测量结果

这是整个对应关系的核心:量子力学中每一次测量的可能结果,都是对应算符的本征值

本征方程写作:

Â|ψₙ⟩ = aₙ|ψₙ⟩

翻译成人话:算符 Â 作用在特殊的向量 |ψₙ⟩ 上,结果等于这个向量乘以一个数 aₙ。这个数 aₙ 就是本征值,|ψₙ⟩ 叫本征态。测量某个可观测量时,结果只能是 aₙ 之一;测完之后,系统的状态会”坍缩”到对应的本征态 |ψₙ⟩。

这不只是物理规定,而是线性代数的必然。厄米矩阵的谱定理保证:厄米算符的本征态构成希尔伯特空间的一组完备正交基。翻译成人话:所有可能的量子态都可以用测量结果的本征态来展开,就像任意向量可以用基向量分解一样。

本征值问题的数值求解是现代量子多体物理的核心挑战。Rayleigh-Ritz 方法——用一组基函数近似本征向量——是量子化学和凝聚态物理中最常用的技术之一,其收敛性分析需要复杂的线性代数定理支撑。[16] 进入量子计算时代,人们甚至在用量子计算机来求解经典的本征值问题,由此诞生了量子本征值处理(quantum eigenvalue processing)这一新方向。[10][11]

这里有一个关于量子测量问题的深层谜题没有被线性代数解决——为什么一次测量只给出一个本征值,而不是所有可能值的叠加?那是解释问题,不是数学问题。线性代数给出了框架,但不回答为什么。

海森堡:矩阵力学的诞生

1925年夏,海森堡在黑尔戈兰岛养病期间写下了一篇改变物理学的论文。他刻意抛弃了”电子轨道”这种无法直接观测的概念,转而只用可观测量——光谱跃迁频率和强度——来构建理论。他发现这些量满足一种奇怪的乘法规则:不可交换。

海森堡当时不知道这叫矩阵乘法。他只是发现这套规则能正确预测氢原子光谱。玻恩(Max Born)看到手稿时立即认出:这正是他几年前在数学课上学过的矩阵代数。一门二十世纪初数学家发展的抽象工具,就这样意外成了量子力学的语言。[4]

海森堡的矩阵力学后来被薛定谔的波动力学所”超越”——但这是假象。狄拉克和冯·诺依曼证明两者是等价的:波函数是希尔伯特空间中的向量,微分算符是矩阵的无穷维推广。矩阵力学和波动力学是同一个线性代数框架的两种表述。[5]

你可以在波函数一文中看到薛定谔表述的细节;这里的重点是:两种表述之所以等价,正是因为它们都服从同一套线性代数结构。

不对易就是不确定性

量子力学最著名的结论——海森堡不确定性原理——并非实验发现的神秘规律,而是线性代数的必然推论。

位置算符 x̂ 和动量算符 p̂ 满足对易关系:

[x̂, p̂] ≡ x̂p̂ − p̂x̂ = iℏ

翻译成人话:先测位置再测动量,和先测动量再测位置,给出的结果不一样——差一个 iℏ。这不是仪器精度问题,是算符代数的本质。

从这个对易关系出发,用施瓦茨不等式(内积空间的标准定理)可以严格推出:

ΔxΔp ≥ ℏ/2

翻译成人话:位置的测量不确定度乘以动量的测量不确定度,不能小于 ℏ/2。这个下界不是近似,而是精确等式在特殊态(相干态)时取到的下确界。[4]

Hall 等人的工作进一步表明,可以选择不同的”不确定度”度量,使得这个不等式变成精确等式[4]——量子力学的不确定性并非模糊,而是精确定义的数学结构。更多物理直觉可参考不确定性原理

相干态是不确定性下界恰好被饱和的特殊量子态,对应经典力学在量子语言中的最佳近似。Schrödinger 最早提出这一概念,后来在量子光学中被实验实现,如今已延伸到量子引力的研究前沿。[14]

思想实验:如果位置和动量能同时确定

🧠 思想实验:假设 x̂ 和 p̂ 可对易

想象一个平行宇宙,其中位置算符和动量算符满足 [x̂, p̂] = 0。在这个宇宙里,数学告诉我们:两个算符可以同时被对角化,也就是说存在一组基向量,使得每个基态都同时是位置和动量的本征态。

这意味着什么?每个粒子在每个时刻都同时具有确定的位置和确定的动量。听起来这就是经典力学的粒子——你可以同时知道一颗子弹的精确位置和速度,并用牛顿定律预测它的整条轨迹。

但代价是:这个宇宙的原子将无法稳定存在。在我们的宇宙里,电子之所以不落入原子核,正是因为位置和动量的不确定关系——把电子局限在极小空间内,会使动量不确定度爆炸式增大,产生向外的”量子压力”(零点能)。如果 [x̂, p̂] = 0,这种压力消失,电子会螺旋落入原子核,物质在瞬间坍缩。

结论:不对易关系不只是量子力学的数学特征,它是物质能够稳定存在的必要条件。我们能活着讨论这个问题,正是因为 x̂p̂ ≠ p̂x̂。

从矩阵到量子计算机

线性代数与量子力学的婚姻,在二十一世纪催生了一个新领域:量子计算。量子比特(qubit)就是二维希尔伯特空间中的向量;量子门是幺正矩阵;量子算法是精心设计的矩阵序列,让正确答案的概率振幅增大而错误答案的振幅相消。

量子相位估计(Quantum Phase Estimation)是量子算法的核心子程序,本质上是在指数大的希尔伯特空间中做本征值提取——用量子叠加同时探测矩阵的所有本征值,效率远超经典计算机。[12] 这一技术已被推广到处理非厄米矩阵的本征值问题,应用于非厄米物理系统和微分方程求解。[11]

更有趣的是反向流动:量子算法被用来研究量子多体系统本身的本征值问题(量子技术解量子问题)[10],算符在不同希尔伯特空间之间收敛行为的数学研究也在推进[15]——数学、物理和计算机科学三个领域在线性代数这个共同语言上持续对话。

量子力学的终极边界在哪里?当我们试图把量子力学推广到弯曲时空或量子引力时,希尔伯特空间本身的定义开始动摇——在量子时空中,”固定背景上的态空间”这个概念失去意义。Hartle 指出,量子力学可能需要进一步推广,以适应没有固定时空背景的情形。[17] Rovelli 的关系量子力学则走向另一个方向:量子态不是绝对的,而是相对于观察者而定的,本征值也只是关系事实。[18]

也许线性代数不是量子力学的终极母语——但在我们找到更深的语言之前,它是迄今为止最精确、最成功的一种。关于量子自旋这一最纯粹的量子现象如何在线性代数框架中被描述,见量子自旋;关于量子纠缠如何从希尔伯特空间的张量积结构中自然涌现,见量子纠缠


🔑 核心要点

  • 量子态 = 希尔伯特空间中的向量;叠加原理 = 向量加法。
  • 可观测量 = 厄米算符(矩阵);测量结果 = 算符的本征值。
  • 海森堡矩阵力学和薛定谔波动力学是同一个线性代数框架的两种表述,数学等价。
  • 不确定性原理不是实验局限,而是算符不对易的数学必然推论。
  • 量子计算本质上是在指数大的希尔伯特空间中操作矩阵;线性代数是量子技术的工程语言。
  • 物质的稳定存在依赖于位置-动量的不对易关系——这是线性代数给我们最深刻的物理礼物。

参考文献

  1. R. de la Madrid, “The role of the rigged Hilbert space in Quantum Mechanics,” Eur. J. Phys. 26, 287 (2005). DOI: 10.1088/0143-0807/26/2/008
  2. G. M. D’Ariano, “How to Derive the Hilbert-Space Formulation of Quantum Mechanics From Purely Operational Axioms,” (2006). arXiv:quant-ph/0603011
  3. D. J. Bohm et al., “Algebraic Quantum Mechanics and Pregeometry,” AIP Conf. Proc. 810, 314 (2006). DOI: 10.1063/1.2158735
  4. M. J. W. Hall et al., “Quantum mechanics from a Heisenberg-type equality,” Fortschr. Phys. 50, 646 (2002). DOI: 10.1002/1521-3978(200205)50:5/7<646::AID-PROP646>3.0.CO;2-7
  5. S. J. Brodsky, “The Heisenberg Matrix Formulation of Quantum Field Theory,” Fortschr. Phys. 50, 503 (2002). DOI: 10.1002/1521-3978(200205)50:5/7<503::AID-PROP503>3.0.CO;2-2
  6. R. Y. Chiao et al., “Heisenberg’s Introduction of the ‘Collapse of the Wavepacket’ into Quantum Mechanics,” Fortschr. Phys. 50, 614 (2002). DOI: 10.1002/1521-3978(200205)50:5/7<614::AID-PROP614>3.0.CO;2-R
  7. I. I. Cotaescu, “Generalized ‘bra-ket’ formalism,” (1999). arXiv:math-ph/9904029
  8. S. Ohmori et al., “General Construction of Bra-Ket Formalism for Identical Particle Systems in Rigged Hilbert Space Approach,” (2024). arXiv:2403.00234
  9. Y. Gurevich et al., “What are kets?” (2024). arXiv:2405.10055
  10. C. Semay et al., “Do bras and kets have dimensions?” Eur. J. Phys. 42, 015404 (2021). DOI: 10.1088/1361-6404/abbab1
  11. D. Lee, “Quantum techniques for eigenvalue problems,” Eur. Phys. J. A 59, 280 (2023). DOI: 10.1140/epja/s10050-023-01183-5
  12. G. H. Low et al., “Quantum eigenvalue processing,” Proc. FOCS 2024. DOI: 10.1109/FOCS61266.2024.00070
  13. A. Dutkiewicz et al., “Heisenberg-limited quantum phase estimation of multiple eigenvalues with few control qubits,” Quantum 6, 830 (2022). DOI: 10.22331/q-2022-10-06-830
  14. A. Plastino et al., “Quantum state space-dimension as a quantum resource,” Int. J. Quantum Inf. 13, 1550039 (2015). DOI: 10.1142/S0219749915500392
  15. P. Martin-Dussaud, “Searching for Coherent States: From Origins to Quantum Gravity,” Quantum 5, 390 (2021). DOI: 10.22331/q-2021-01-28-390
  16. D. Mugnolo et al., “Convergence of sectorial operators on varying Hilbert space,” Oper. Matrices 7, 1285 (2013). DOI: 10.7153/oam-07-54
  17. M. E. Argentati et al., “Bounds on changes in Ritz values for a perturbed invariant subspace of a Hermitian matrix,” SIAM J. Matrix Anal. Appl. 30, 548 (2008). DOI: 10.1137/070684628
  18. J. B. Hartle, “Generalizing Quantum Mechanics for Quantum Spacetime,” (2006). arXiv:gr-qc/0602013
  19. C. Rovelli, “The Relational Interpretation of Quantum Physics,” (2021). arXiv:2109.09170