上海交大暑期邀请著名美籍华裔理论物理学家 徐一鸿(Anthony Zee)教授讲量子场论。

Anthony Zee

Quantum Field Theory in NutshellFearful Symmetry

上海交大暑期邀请著名美籍华裔理论物理学家 徐一鸿(Anthony Zee)教授讲量子场论。共8节大课,每周2节,共4周。欢迎想要学习量子场论的老师和同学参加讲座,需要较好的高等量子力学预备知识。外校人员请自行安排食宿。

徐一鸿教授目前就职于凯维里理论物理研究所(Kavli Institute for Theoretical Physics)和加州大学圣芭芭拉分校(University of California, Santa Barbara)物理系。

徐一鸿教授著有“Quantum Field Theory in Nutshell”(果壳中的量子场论)、“Einstein Gravity in a Nutshell”(果壳中的爱因斯坦引力)以及科普著作“Fearful Symmetry”(可怕的对称,有中译本)、“An Old Man’s Toy”(老人的玩具,有中译本)等。

课程安排:

果壳中的量子场论——起始编
Quantum Field Theory in Nutshell:Starting

上课时间地点

7月1日-7月24日期间
星期二 第3节-第4节(10:00-11:45)
星期四 第3节-第4节(10:00-11:45)
上海交通大学闵行校区下院100号。

课程目标:

帮助学生初步了解量子场论的基本内容和基本方法,以及在不同领域中的应用。
This is an introduction course on quantum field theory. Quantum field theory is a particularly essential tool when studying quantum mechanics in a relativistic context; it is the central framework that particle physics is built around. But it has also found applications in other contexts, including condensed matter physics and gravitational physics, even in biology. (Our modern understanding of cosmology, for instance, relies crucially on quantum field theory.) Although we will mostly study applications to particle physics in this class, the topic should be interesting and useful for all physics related students.

课程大纲:
(章节对应“Quantum Field Theory in a Nutshell”)

Lecture 1: Who needs QFT? Path integral, from field to force.
Lecture 2: chapters I.5-6, I.7
Lecture 3: chapters I.7-I.9
Lecture 4: chapters I.10, II.1
Lecture 5: chapters II.2-5
Lecture 6: chapters II.6-7
Lecture 7: chapters III.1-3
Lecture 8: chapters IV.1, IV.6

教材及参考资料:

Quantum Field Theory in a Nutshell: (Second Edition) A. Zee, Princeton University Press (国内有英文影印版)

英文授课。

【转】1927年第五届索尔维会议

图片来源:
http://zhidao.baidu.com/question/583919452.html
原始来源:
http://io9.com/5940299/twenty-nine-of-historys-most-iconic-scientists-in-one-photograph—now-in-color
文字来源:
http://www.360doc.com/content/12/0930/13/16546_238889172.shtml

1927年10月,比利时首都布鲁塞尔,第五届索尔维会议照片。彩色高清修复版。

1927年第五届索尔维会议照片彩色高清修复版October 1927 Fifth Solvay International Conference

后排左起:
皮卡尔德(A. Piccard) 亨利厄特(E. Henriot) 埃伦费斯特(P. Ehrenfest) 赫尔岑(Ed. Herzen) 德唐德(Th. de Donder) 薛定谔(E. Schrodinger) 费尔夏费尔特(E. Verschaffelt) 泡利(W. Pauli) 海森堡(W. Heisenberg) 富勒(R. H. Fowler) 布里渊(L. Brillouin)

中排左起:
德拜(P. Debye) 克努森(M. Knudsen) 布拉格(W. L. Bragg) 克莱默(H. A. Kramers) 狄拉克(P. A. M. Dirac) 康普顿(A. H. Compton) 德布罗意(L. de Broglie) 波恩(M. Born) 波尔(N. Bohr)

前排左起:
朗繆尔(I. Langmuir) 普朗克(M. Planck) 居里夫人(Maria Curie) 洛仑兹(H. A. Lorentz) 爱因斯坦(A. Einstein) 朗之万(P. Langevin) 古伊(Ch. E. Guye) 威尔逊(C. T. R. Wilson) 理查森(O. W. Richardson)

黑洞——初学者关于黑洞形成的一个常见误解

广义相对论初学者了解施瓦希(Schwarzschild)黑洞的时候往往产生这种误解:『施瓦希坐标系中黑洞形成过程以及物体落入黑洞都需要无穷长的“坐标时”,所以严格意义上的黑洞是无法形成的。』

m

墨卡托投影,地球两极被映射到无穷远。

这事儿奥本海默(S. Oppenheimer)在1939年就澄清了,世界外部任意位置悬停的观察者确实永远观查不到黑洞视界的形成,也观查不到任何物体在有限时间内落入黑洞视界。但黑洞视界之内的区域确实是存在于时空结构中的一个区域,而下落物体穿越视界时自身所经历的时间也完全是有限的。只不过施瓦希坐标系并不能连续地覆盖到视界之内的区域,这就像利用墨卡托投影(柱面投影)将地球表面投影到柱面上,那么南北两极就将被投影到无穷远,这完全是坐标系的选取造成的,丝毫不意味着地球两极在几何上跟其他地方有什么不同。这种由坐标系选取导致的奇异性被称为坐标奇点,这种奇点其实跟弯曲时空本身没有什么关系。想要同时连续地覆盖到视界内外必须变换到克鲁斯卡坐标系(Kruskal-Szekeres coordinates)或彭罗斯图(Penrose diagram)才行。

k

克鲁斯卡坐标系,连续覆盖黑洞视界内外。

p

彭罗斯图,连续覆盖黑洞视界内外。

对于一个下落物体,其自身的固有时间用施瓦希坐标系的坐标时间来衡量,会在落向视界的过程中变得越来越慢,以至于只能无限接近某个特定的值T。但这个物体自身并不会感受到这种变慢,这个时刻T对物体自身而言跟其他时刻并没有什么区别,没有任何物理机制能够阻止物体自身的固有时间越过时刻T。因此物体的世界线理应继续延伸下去,并不会在视界处中断。只要没有遭遇到无限大的密度或时空曲率(本性奇点),就没有任何物理上说得通的理由使这种延伸发生中断。如果我们把一切测地线都尽最大可能地延伸,直到遭遇本性奇点为止,那么我们就得到了所谓最大解析延拓陀的时空,而克鲁斯卡坐标系和彭罗斯图是描述这种时空非常方便的选择。

在经典广义相对论框架内,持续的引力坍塌确实能够形成黑洞,就是在上述这种最大解析延拓的意义上说的,外部悬停观察者当然不可能在有限时间内看见世界形成的事件,直到这个观察者自己也掉进去为止,但对于四维弯曲时空而言,是必须包含视界以内的区域的。一个质量足够大而体积足够小的物体,最终将没有任何力量能够抵抗引力,会持续不断地坍塌直到形成视界并最终形成奇点为止。说到形成奇点,又会引出历史上另一个持续了很多年的误解:『如果初始条件不满足完美的对称性,奇点就无法形成。就像经典力学中质点的碰撞奇点一样,黑洞奇点只是数学家追求严格性的产物,并不是实际存在的』。对于这种误解,我将在下一篇博文中澄清。

在现代物理学中,很多时候最简单的直觉往往是错的。

我在 @知乎 回答了【怎样解释「薛定谔的猫」,能让一个没有高中数学基础的人理解?】

[我在 @知乎 的回答]

我觉得这里的回答中有许多都没有正确区分『叠加态』和『混合态』。不过很抱歉,我这里并不是在回答楼主的问题,而是试图纠正许多回答中的概念混乱,很难让高中以下的读者理解。

量子力学中任何一个明确的状态(量子态)都有无穷多种方法分解为若干个状态的叠加,就好像一个向量总是有无穷多种方法分解为若干向量一样。如果一个量子态S可以分解为量子态X和Y的叠加态,可以写成S=aX+bY(a和b是两个复数系数)。再次提醒,这种分解有无穷多种方法:S = aX+bY = a’X’+b’Y’+c’Z’+… = …

到了这里,学过向量加法的同学们应该知道,S虽然可以写成X和Y的线性叠加,但S显然既不是X也不是Y,说S既是X又是Y也根本不对,甚至说S部分处于X部分处于Y也非常不合适,因为S在任何不跟S正交的量子态上都有非零的分量。事实上,S是一个跟X和Y都不同的新的量子态。如果你选取了一组正交完备的量子态作为基向量,那么任何一个量子态S都可以在这组基向量上做唯一的分解。这种正交完备的基向量组的选择也不是唯一的,有无穷多种不同的选择。

那么什么是混合态呢?如果系统明明处于某个明确的量子态,但我们却不知道具体是哪一个,只知道系统可能以一定的概率分布处于若干量子态之一,那么这种情况下我们说体系处于这若干量子态的概率混合,简称混合态。但必须明确一点,混合态不是量子态,只是若干量子态上赋予的一个概率分布。一个处于混合态的系统的实际量子态本来是明确的,只是我们不知道具体是哪一个而已,这跟前面解释的叠加态的含义完全不同。

量子力学实验中所谓的测量,就是让『被测量子体系』跟『仪器+观察者+环境』这个大系统发生相互作用。具体的测量方式会在无穷多不同的正交完备基向量组中选择一个特殊的基向量组。例如让电子通过Z方向的非均匀磁场测量电子的自旋,这种测量就会选择Z+和Z-这两个特定的自旋量子态构成的正交完备基向量组。

执行测量操作时,『仪器+观察者+环境』这个大系统跟被测体系的相互作用过程会让被测体系的量子态从其原来所处的量子态迅速演化到测量方式选择的那个特殊 基向量组中的某一个基向量上。那么测量后被测体系的量子态到底会演化到这个特殊基向量组中的哪一个基向量上呢?这同时取决于『被测量子体系』和『仪器+观 察者+环境』二者在测量之前所处的量子态。由于后者是个硕大无朋的宏观体系,其具体的量子态信息我们根本就不可能了解(就算把这个信息告诉我们,存储这个 巨大的信息也可能要占满整个宇宙,更不要说利用这些信息进行计算的难度多大了),所以我们根本就没可能明确计算测量后被测体系到底会进入测量方式所选定的 哪一个基向量上,只能做统计预测。而统计预测的规则很简单:测量后被测体系量子态进入基向量X的概率,正比于测量前被测体系的量子态S在基向量X上投影长 度的平方,这就是量子力学中的测量原理。早年人们在对这个原理的理解很糊涂,导致了波尔和爱因斯坦在这个原理的诠释上旷日持久到死都没结果的争论。后来有 人做了贝尔不等式的实验,实验结果不支持爱因斯坦关于量子力学局域性的观点,但却被大量错误地引申成了波尔战胜了爱因斯坦。事实上波尔对测量原理提出的哥 本哈根诠释在贝尔不等式的实验中根本就不涉及,该诠释不但破坏量子力学的自洽性,也跟近年来的实验结果相悖。这事儿说来话长暂且打住。

还有一件事情,做量子力学实验,通常要将被测量子体系与仪器环境的相互作用彻底隔离,相互间连热量交换都不能有,否则在测量之前被测体系的状态就已经乱掉了。虽然某些实验中如果相互作用非常微弱也可以通过一些手段纠正消除环境干扰,但尽可能地隔绝相互作用是非常重要的。隔离个把原子不长时间是比较容易做到的,目前也可以隔离病毒尺度的物体,但尺度越大就越难。但是把像猫这么大的东西跟外部环境几乎彻底隔绝,其技术难度可以说超出了我对未来科学技术最疯狂的幻想。如果不能做到几乎是完美的隔离,那么被测体系根本就不可能处于测量方法所选择的那组基向量的叠加态,也就谈不上什么薛定谔猫佯谬了。这就是为什么薛定谔猫佯谬提出之后大家始终在争论却没办法直接进行试验验证的原因(最近据说终于成功地在病毒上进行了类似实验)。接下来的讨论中我们假定光年之后我们在技术上终于能够满足上述要求了。

接下来我们就可以谈谈薛定谔猫这个思想实验了。

我们打开盒子进行观察,都可能看到些什么呢?有人觉得打开盒子可能观察到所有可能的量子态只有两个,一个是猫死了,一个是猫活着。事实上这是很严重的误解。即便是猫死了的状态,都有数不清的不同可能,例如死在一角还是另一角等等,猫死和猫活都对应很大很大一批不同的量子态。除此之外,按照量子力学,打开盒子的时候甚至可以有极小但非零的概率里面会出现一只狗,还可能没猫也没狗只有一滩水。虽然这种事情发生的概率极其微小,但量子力学并不绝对禁止盒子中的物质发生这种剧烈重组的可能性。把所有这些量子力学允许我们在打开盒子时看到的状态全算上,才构成我们测量手段所选择的正交完备的基向量组。所以,许多科普文章甚至是早期的学术讨论中认为只有『死猫』、『活猫』这区区两个基向量的说法是完全不符合量子力学的。

如果关上盒子(假设能做到很严格的与世隔绝)的时间不是特别漫长,打开盒子的时候发现里面有只狗或一滩水的可能性几乎是零,最可能看到的是对应死猫或活猫的数不清的量子态之一。但如果盒子关得太久(例如漫长到庞加莱回归周期那样的时间尺度)就难说打开时会看到什么了。

我们很关心的一个问题是,在打开盒子之前,盒内体系的量子态又会是什么呢?事实上,由于盒子中的猫和杀猫装置本身也是一个在量子力学意义上极为巨大的宏观系统,而触发杀猫装置的放射性元素也在跟这个宏观系统发生相互作用,相当于被测量,所以会在这个过程中会迅速演化到杀猫装置所选定的基向量之一:衰变或不衰变,具体演化到哪个状态取决于之前整个系统的量子态。虽然在打开盒子之前,盒内体系时刻都处于明确的量子态,但由于这个系统仍然很巨大,所以我们并没有办法对结果做出明确的预测,只能谈概率。因此在打开盒子之前,猫要么已经被杀死,要么没有被杀死,或者以极低的概率进入了某些稀奇古怪的状态,但并不会处于某种“不死不活”或“稀里糊涂”的量子态。

虽然盒内体系的量子态S是明确的,却几乎不可能刚好处于打开盒子后可能看到的基向量状态之一,而是它们的某种叠加。所以在打开盒子的时候盒内体系的量子态仍然会发生进一步的演化,但这种演化不会像许多科普书上写的那样,从某种猫不死不活的状态嗖~地演化成死猫或活猫的状态,而是从原来猫的死活本来就很明确的量子态以一定的概率分布演化到打开盒子后可能看到的基向量状态之一。而且我们还可以明确一件事儿,如果打开盒子之前盒内体系的量子态S是猫活着的某个状态,那么打开盒子之后盒内体系的量子态几乎肯定会演化到跟S在宏观上看上去几乎没有差别的仍然对应猫活着的量子态,几乎完全没可能演化到对应猫死了的某个量子态。因为对于如此巨大的宏观系统,宏观上能看出差别的两个量子态几乎是完全正交的,宏观上几乎完全看不出差别的两个量子态之间才可能会有明显的非零投影分量。

总结:
薛定谔猫在打开盒子之前并不会处于什么『不死不活』『稀里糊涂』的量子态。一个对应死猫的量子态和一个对应活猫的量子态叠加出来的量子态是一个很奇葩但并不糊涂的量子态,这样的量子态可能对应一只开膛破肚奄奄一息的猫,也可能连个完整的猫都没有。任何一个量子态都可以分解为若干量子态的线性叠加,也就是说,你现在的状态就等价于若干跟你目前状态不同的量子态的叠加,但你并不会因此感到自己稀里糊涂或不死不活。打开盒子,盒子里面的量子态会因为跟外部的相互作用而发生演化,但这个演化并不是从一种不死不活的糊涂量子态演化到有明确死活的量子态,而是从原本死活就很明确的量子态演化到宏观地看上去与原来极其接近的另一个量子态,演化到一个宏观地看上去与原来很不相同的量子态的概率几乎为零。

我求得的全新Einstein场方程精确解

(孙伊2013-12-20于上海交大闵行物理楼)

本文介绍我2011年求得的一个之前未见诸文献的Einstein场方程精确解,它是在远处时空渐进平坦条件下的最一般球对称精确解(注,并非真空或静态的特殊情况,可以处理任何动态非真空情况。以下简称为US解,Universal Spherical)。从US解出发可立即证明Birkhoff定理及其增强版,在静态真空无电荷情况下则立即变成Schwarzschild外部解,代入点电荷电场的能量动量张量则立即变成Reissner-Nordstrom带电球对称解(RN解)。

US解形式如下(具体推导过程请参考我的原始论文JCAP 1101:031,2011或勘误版arXiv:1102.2609):

    \[\large{ds}^2 = -f(r,t)\left(1-\frac{2M(r,t)}{r}\right) {dt}^2+\left(1-\frac{2M(r,t)}{r}\right)^{-1} {dr}^2+r^2 {d\Omega}^2\]

    \[({d\Omega}^2 = {d\theta}^2 + {(\sin \theta)}^2{d\phi}^2)\]

其中f(r,t)M(r,t)的形式后面将给出。有些同学可能会注意到,既然能够描述任意的径向运动,为什么这个解的度规形式里却没有rt交叉项?实际上只要选择适当的坐标就可以做到这一点,不了解这件事的同学可以参考Weinberg的“Gravitation and Cosmology”第11章。

这个解的形式看上去US解的度规形式跟Schwarzschild解很相似,但是项前面多了一个系数f(r,t),且M不再是常数,表示Schwarzschild坐标系中时刻t和半径r之内的总能量(注,这种动态情况下称之为总能量可能不合适。唯一可以肯定的是这是由能量动量张量清晰定义的关于tr的函数,是否能叫做总能量并不重要。):

    \[\large M(r,t)=\int_0^r {4π \tilde{r}^2 \rho(\tilde{r},t)d\tilde{r}}\]

f(r,t)是由密度\rho和径向压强p决定的(注,切向压强p_t不独立于\rhop而被吸收掉了):

    \[ \large f(r,t) = \exp \left\{ -\int_r^\infty 8\pi\tilde{r} \left(1-\frac{2M(\tilde{r},t)}{\tilde{r}}\right)^{-1} \left(\rho(\tilde{r},t)+p(\tilde{r},t)\right)d\tilde{r} \right\} \]

聪明的同学一眼就能看出来,不带电球对称星球的外部真空区\rho(\tilde{r},t)=p(\tilde{r},t)=0,所以f(r,t)=1,由能量守恒可知在外部真空区M是常数,立即回归到Schwarzschild解:

    \[\large{ds}^2 = -\left(1-\frac{2M}{r}\right) {dt}^2+\left(1-\frac{2M}{r}\right)^{-1} {dr}^2+r^2 {d\Omega}^2\]

这其实就是Birkhoff定理:无论球对称星球内部的物质有怎样的径向运动,外部真空区一定满足Schwarzschild外部解。

带电球对称星体的外部真空存在球对称静电场,该静电场的能量密度和压力分别为:

    \[\rho(r)=\frac{Q}{8\pi r^4},p(r)=\frac{-Q}{8\pi r^4}\]

于是仍然有\rho(\tilde{r},t)+p(\tilde{r},t)=0,所以也仍然有f(r,t)=1,而

    \[\large \begin{array}{ll} M(r) &\displaystyle = \int_0^r 4\pi \tilde{r}^2 \rho(\tilde{r},t)d\tilde{r}\\ &\displaystyle = \int_0^\infty 4\pi \tilde{r}^2 \rho(\tilde{r},t)d\tilde{r} - \int_r^\infty 4\pi \tilde{r}^2 \rho(\tilde{r},t)d\tilde{r}\\ &\displaystyle = \mathcal{M} - \frac{\mathcal{Q}^2}{2r} \end{array} \]

注,上式中的\mathcal{M},是全空间总能量,包括全空间的电场能,而\frac{\mathcal{Q}^2}{2r}是半径r以外的总电场能。

这澄清了我之前多年的一个误解:我原以为RN解中那个\mathcal{M}是不包括全空间电场能的,于是如果电荷量特别大以至于\mathcal{Q}>\mathcal{M},奇点就会裸露。现在知道\mathcal{M}是包括全空间电场能的总能量,就算带电粒子除了静电能以外的质量等于0,也不过会使\mathcal{Q}=\mathcal{M},绝不会出现\mathcal{Q}>\mathcal{M}的情况。

现在我们直接得到了带电球对称星球的Reissner-Nordstrom解:

    \[\large{ds}^2 = -\left(1-\frac{2\mathcal{M}}{r}+\frac{\mathcal{Q}^2}{r^2}\right) {dt}^2+\left(1-\frac{2\mathcal{M}}{r}+\frac{\mathcal{Q}^2}{r^2}\right)^{-1} {dr}^2+r^2 {d\Omega}^2\]

这其实是Birkhoff定理的增强形式:无论球对称带电星球内部的物质有怎样的径向运动,外部包含电场的真空区一定满足Reissner-Nordstrom解。

当然,US解不仅能在附加条件下导出上述真空静态解以及诸如理想不可压缩流体球之类的非真空静态解,还能处理非真空区物质的任意径向运动。

我最初求US解的目的是试图处理黑洞蒸发,试图弄清落向蒸发黑洞的物体会经历什么。之前已知的所有非真空球对称精确解都是静态解,而落向蒸发黑洞的物体会置身其辐射场,而辐射场是动态的,所以之前已知的所有精确解都无法处理这种情况。我最终用US解证明只要球对称黑洞的寿命因蒸发而有限,那么无论蒸发过程多复杂,时间多漫长,广义相对论都会禁止任何物体在黑洞蒸发消失之前落入该黑洞。而作为一个逻辑结论,如果形成了的黑洞会蒸发,那么引力坍塌就无法形成黑洞。这件有趣的事以后再讲。

感兴趣的同学可以用Mathematica将US解带入Einstein场方程进行检验,Mathematica程序:BH-Code

附1,球对称条件下能量动量张量{T_\mu}^\nu的非零项:

    \[ \begin{array}{ll} {T_t}^t & = (\partial_r M)/(4\pi r^2 )=\rho\\ {T_r}^r & = p\\ {T_t}^r & = (\partial_t M)/(4\pi r^2 )\\ {T_\Omega}^\Omega & = p_t \end{array} \]

其中{T_\Omega}^\Omega = p_t是切向压力,{T_t}^r是径向能流密度(也是动量密度)

注,在球对称情况下,切向压力p_t不独立于密度\rho和径向压力p,可由\rhop唯一确定,因为切向压力和径向压力共同决定了该处物质的径向加速度。切向压力的具体表达式相当复杂。

附2,下图显示了Einstein场方程部分已知精确解之间的关系,包括我给出的US解:
!exact-solutions

黑洞,要么无法形成,要么不会蒸发。

我2011年在在JCAP上发表了一篇文章:Black hole — never forms, or never evaporates

链接: JCAP, arXiv, DOI, Scholars Portal Journals

我手中未经JCAP排版的修订版,纠正了一些笔误和语法问题:Black hole — never forms, or never evaporates

我的计算表明,如果黑洞会因蒸发而寿命有限(无论其寿命是多么不可思议地漫长),都没有任何物质能够在其蒸发消失之前落入其视界。而这样一来,只要存在蒸发机制,那么真实黑洞就会由于这种机制的存在而无法形成,理论物理学中那个信息丢失困难也不复存在,甚至经典广义相对论中的奇点疑难也会被自然地避免。

除了结论,文中还给出了Einstein Field Equation最一般的球对称解,任何(远方渐进平坦的)球对称解都是其特例,包括Schwarzschild,Reissner-Nordstrom,静态流体球,除此之外还覆盖了任何球对称的动态非真空情况。

这是验证这个最一般球对称解的Mathematica代码:!BH-Code

量子逻辑?仅仅是名字叫做逻辑而已。

有人认为量子力学是无法用『经典逻辑』刻画的,必须引入一种特别的『量子逻辑』才能准确地刻画量子现象,我将论证这是一种偷换概念式的误解。

Griffiths的“Consistent Quantum Theory”第四章对“量子逻辑”做了介绍。但在我看来,这一章在搅混水。这个“量子逻辑”中的“属性”(关于量子态的断言)以及“运算”(与、或、非)跟『经典逻辑』中的同名『属性』和『运算』根本就不是一个意思,而作者在使用“量子逻辑”的时候,将『经典逻辑』中得到的关于量子态的结论强行用同名的“量子逻辑”概念进行解释,得出『经典逻辑』不适用于量子力学的含混结论。为了强调“量子逻辑”跟『经典逻辑』并非是两种分庭抗礼的逻辑,我后面将这种“量子逻辑”全部称为“量子演算”。

在介绍“量子演算”之前,先简要介绍一下数理逻辑中的『属性』(property)和逻辑运算(包括非、与、或等)。在数理逻辑中,『属性』(property)是一个一元关系,它可以作用在论域中的任何一个变元上,返回一个真值。比方说对于实数集合而言,『大于0』『等于5』『平方小于10』等都是实数的属性。无论给出哪一个实数,该实数是否具有属性P都是有定义的。于是,对于任何一个具体的属性P,都对应实数集的一个子集:{具有该属性的实数}。反过来,随便从实数集中取出一个子集S,『属于S』刚好又是一个属性,二者是一一对应的。显然,如果子集S对应属性P,那么『S的补集』就对应属性『非P』,如果子集S、T对应属性P、Q,那么『S交T』就对应属性『P且Q』而『S并T』就对应属性『P或Q』。

接下来介绍一下这个“量子演算”,并且跟以Hilbert空间为论域的『经典逻辑』进行比较。

对于一个量子体系,其状态空间是Hilbert空间。“量子演算”规定:量子体系的一个“属性”对应Hilbert空间的一个子空间,不是子空间的子集不对应任何“属性”。这里千万要注意“量子演算”中这个所谓的“属性”,跟『经典逻辑』中的那个『属性』含义截然不同。因为子空间的补集不是子空间,子空间的正交补空间才是子空间。所以,“量子演算”中这个“属性”只是跟『经典逻辑』中的那个『属性』同名,却完全不符合『经典逻辑』中对『属性』的基本要求,除了恒真属性(对应全Hilbert空间)和恒假属性(对应0子空间)之外其他的“量子演算的属性”都对某些量子态无定义(『无定义』和『假』不一样),子空间的补集也根本不对应任何“量子演算的属性”,而子集的补集总是对应一个『经典逻辑』的『属性』。在我看来这非常误导。

在接下来的讨论中,为了防止混淆,我将把“量子演算”中所有跟『经典逻辑』中重名的概念前面都加上一个字头“*”以示区别,例如“*属性”、“*非”、“*或”等等,这样一切就会变得非常清楚:

在量子演算中,我们定义一个叫“*属性”的东西,任何一个“*属性P”,都对应体系Hilbert空间的一个子空间S,如果量子态\psi属于S,我们就说\psi具有“*属性P”,如果量子态\psi与S正交,我们就说\psi具有“*属性*非P”,对于其他即不属于S又不和S正交的量子态,我们直接规定P无定义。注意,『无定义』和『假』不一样。接下来,我们就可以对“*属性P”定义一个投影算符(projector)\hat{p},凡是属于S的量子态\psi\hat{p} \psi = 1\psi,凡是跟S中所有量子态正交的量子态\phi\hat{p} \phi = 0

但一方面,没有任何理由阻止我们直接用经典逻辑来讨论Hilbert空间中的量子态:量子态的任何『属性P』(注意,这里是不带*前缀的『属性』,特指经典逻辑中的概念)对应Hilbert空间的一个子集S,如果一个量子态\psi属于子集S,我们就说\psi具有『属性P』。显然,对于任何量子态\psi,『属性P』都有定义,要么是真,要么是假,不存在无定义的情况。

接下来,我们在『量子演算』中定义一些『演算』。

一元演算“*非”:对于任何“*属性P”,对应子空间为S,我们定义“*非P”是一个“*属性”,该属性对应的子空间刚好是S的正交补空间。显然,“*非”这个演算跟经典逻辑中的『非』完全不同,『非』对应『补集』,而“*非”对应『正交补空间』。在经典逻辑中,量子态\psi要么具有『属性P』,要么具有『属性非P』,因为『属性P』和『属性非P』对应的两个不交子集的并集就是整个Hilbert空间,任何量子态\psi都在其中。但在“量子演算”中,一个量子态\psi完全可能对“*属性P”和“*属性*非P”都无定义。

二元演算“*与”:对于任何两个“*属性P、Q”对应子空间为S、T,而且P、Q对应的投影算符\hat{p}\hat{q}对易,\hat{p}\hat{q} = \hat{q}\hat{p},那么我们定义“P *与 Q”是一个“*属性R”,R对应的子空间刚好是S和T的交集,因为子空间的交集仍然是子空间,因此当\hat{p}\hat{q}对易时“*与”恰好幸运地等价于『与』。但这里要注意一点,如果\hat{p}\hat{q}不对易,那么我们规定“P *与 Q”无意义,因此还是跟『与』有所不同。这个要求,说白了就是要求两个子空间要满足这样的要求:一个子空间的任何向量向另一个子空间投影,只能投影到两个子空间的公共子空间上,否则就规定“P *与 Q”无意义。这里提供一个直观的几何形像:三维欧氏空间中两个相互垂直且交于一条公共直线的平面满足这个要求,但两个相互斜交的平面不满足这个要求。因为两个相互垂直的平面的投影算符对易,一个平面上的向量向另一个平面投影直接会投到二者的公共直线上,而两个斜交平面的投影算符不对易,一个平面上的向量向另一个平面投影会投影到二者的公共直线之外。

二元演算“*或”:对于任何两个“*属性P、Q”对应子空间为S、T,而且P、Q对应的投影算符\hat{p}\hat{q}对易,\hat{p}\hat{q} = \hat{q}\hat{p},那么我们定义“P *或 Q”是一个“*属性R”,R对应的子空间刚好是S和T的『线性和空间』,由于『子空间的线性和空间』是两个子空间中所有向量的任意线性组合构成的子空间,所以『两个子空间的线性和』跟『两个子空间的并集』完全不同,因此“*或”演算跟『或』截然不同。此外必须注意一点,跟“*与”类似,如果\hat{p}\hat{q}不对易,那么规定“P *或 Q”无意义。

现在,我们可以执行组合运算:“P *与 *非P”这是有意义的,我们得到了『0空间』,任何量子态在该子空间的投影都是0,也就是说没有量子态具有相应的“*属性”。“P *或 *非P”也是有意义的,我们得到了『全空间』,任何量子态在全空间的投影都是其自身,也就是说所有量子态都具有相应的“*属性”。这件事情很好笑,一个量子态\psi可能对“*属性P”和“*属性*非P”都无定义,但是却总是总是具有属性“P *或 *非P”,如果你觉得这很奇怪,那我直接翻译成内积空间的说法你就全明白了:量子态\psi(Hilbert空间的非零向量)可能既不属于子空间S也不属于S的正交补空间,但\psi一定属于『S与S正交补的线性和空间』,因为这个『线性和空间』就是全空间。换言之,这个貌似跟经典逻辑『截然不同』性质,不过是内积空间中显而易见的东西。即便用经典逻辑,我们也一样能得到相同的结论:由于『S』和『S的正交补』的并集未必是全空间,所以完全可以存在量子态\psi\psi既不具有属性『属于S』,也不具有属性『属于S的正交补』,但由于『S和S正交补的和空间』是『全空间』,所以\psi必然具有属性『属于S和S正交补的和空间』。

到现在为止,我们已经可以看出来,这套“量子演算”不过就是把作为『内积空间』的Hilbert空间原本就具有的几种子空间运算『正交补、交、线性和』分别改名为“*非、*与、*或”,并且限制“交、线性和”只能用于投影算符对易的情况,凡是用“量子演算”写出来的东西都可以直接机械地翻译成Hilbert空间的子空间演算,并没有引进任何新内容。

接下来,我们看看作者用这个“量子演算”给出了什么结论:根据前面的“量子演算”规定,如果两个“*属性P、Q”的投影算符\hat{p}\hat{q}非对易,那么“P *与 Q”和“P *或 Q”就没有任何意义。举例说明:说电子的自旋“处于Sx+ *与 处于Sz+”、“处于Sx+ *或 处于Sz+”两种说法都毫无意义(注意,无意义跟『假』完全不是一回事),因为投影算符[Sx+]和[Sz+]不对易,但是“处于Sx+ *与 处于Sx-”和“处于Sx+ *或 处于Sx-”就都有意义,前者取值永远为假,后者取值永远为真。如果这件事情到此为止也就罢了,但问题是Griffiths接下来直接给出结论:说电子自旋『或者处于Sx+或者处于Sz+』是毫无意义的,问题是从书中“量子演算”出发,这些结论仅对对于“量子演算”的“自定义概念”有效,如果把“*属性、*非、*与、*或”直接当成日常语言中的逻辑连词来陈述结论,就偷换了概念。这就相当于:我规定『或』就是『整数加法』,然后告诉大家『1或1的结果是2,这是个逻辑结论』,因为里面这个“或”是我刚刚随便规定的,跟经典逻辑中的『或』没有一毛钱关系。

现在我们可以看看经典逻辑能直接告诉我们什么。由于Hilbert空间中不存在任何一个量子态,这个量子态既是Sx+又是Sz+,因此说电子的自旋『处于Sx+ 与 处于Sz+』就是一个清清楚楚的假命题。这就好像说一个实数『等于3且等于5』必然是个假命题一样,不存在任何实数满足这个条件。另一方面,说电子的自旋『处于Sx+ 或 处于Sz+』逻辑上没有任何问题,例如我让你扔硬币决定是否给电子加一段时间y方向的磁场,初始状态下电子自旋是Sx+,加一段时间y方向磁场就可以让电子的自旋变为Sz+,但你没有告诉我你扔硬币的结果,那么对我而言,电子的自旋确确实实或者『处于Sx+』或者『处于Sz+』,这么说完全有非常明确清晰的意义,没有任何问题。你可能会说,只能在一个方向上测量电子自旋,无法在两个方向上同时测量电子的自旋,如果我在Z方向上测量,就会破坏Sx+,而在X方向上测量,就会破坏Sz+。那又怎样?测量时候当然会造成破坏,但我至少可以保证电子的自旋只可能处于这两个状态之一而不处于其他任何状态,因此如果我在X方向上测量得到了Sx-,那么我就可以断定测量之前电子自旋一定处于Sz+而不是Sx+,这恰恰是我从电子的自旋『处于Sx+ 或 处于Sz+』这件事中能够直接推理出来的。

接下来,我们用一种非常直观的方式重建这种“量子演算”,跟书中所介绍的“量子逻辑”完全等价,但方式是直接建立内积空间的子空间运算到集合的子集运算的对应关系。

Hilbert空间H中,任选一组完备正交基B,B作为包含一组正交基矢的集合,其子集可以执行『交、并、补』运算。而B的任何一个子集中所有的基向量又张成H的一个子空间(很容易看出,同一完备正交基B的任意两个子集所张成的子空间的投影算符都是相互对易的),所以B的子集上的『交、并、补』运算刚好构成有B的子集张成的子空间的『交、线性和、正交补』运算。这样一来B的子集张成的子空间运算和B的子集运算之间就建立了一一对应。

通过这种对应关系,可以立即将量子演算对应到以B为论域的经典逻辑上去。此时B的每一个子集对应论域B上的一个经典逻辑属性,不引起混淆时可以用同一个符号P表示属性P和P对应的B的子集。而B的子集P中所有矢量张成的H的子空间(记为[P])则对应一个量子演算属性(不引起混淆时也记为[P])。定义:如果量子态矢量\psi属于子空间[P],称\psi具有量子演算属性[P],如果\psi与子空间[P]正交,称\psi不具有量子演算属性[P],或称\psi具有[~][P],其他情况无定义不能对\psi谈论[P]。\psi具有量子演算属性[P]意味着\psi能够被P中基矢线性组合出来,\psi具有量子演算属性[~][P]意味着\psi跟P中所有基矢正交。对于每一个量子演算属性[P],都可以定义一个对应的投影算符,该算符将矢量投影到[P]对应的子空间[S]中,在不引起混淆的情况下,我们将这个投影算符也记为[P]。在量子演算下不能对态矢Sz+谈论它是否具有量子演算属性[Sx+],因为Sz+既不属于也不正交于[Sx+],所以是无定义的。投影算符[Sx+]按定义就是|Sx+><Sx+|

如果H中两个子空间的投影算符不对易,那么无论如何不能找到一组完备正交基B,从B中选取两组基向量刚好分别张成这两个子空间。换言之,如果两个子空间的投影算符不对易,这两个子空间的运算就无法通过一组正交完备基对应到B的子集运算上去。这种情况下就不能谈论相应的量子演算『属性』在量子演算意义下的『与』『或』操作。例如在量子演算下『[Sx+]∪[Sz+]』是无意义的,而『[Sz+]∪[Sz-]』是有意义的。

这样我们对于任何一组正交完备基B都能建立量子演算到经典逻辑的等价对应,跟Griffiths书中的量子演算也是等价的。但『以基B为论域的经典逻辑』跟『以H为论域的经典逻辑』仍然有明显区别,因为B只是H的一个子集,所以许多对后者有意义的逻辑命题如果放在前者的语境中将变得毫无意义。这种情况下我们要特别避免混淆这两种不同论域的逻辑,在Griffiths书的第四章就有这种混淆。

另,繁星客栈的季候风老师指出:“量子力学的测量理论指出对可观察量的测量结果是相应算符的谱点,所以以测量结果为变量的开语句的逻辑运算就自然对应到可观察量谱集的集合运算。量子力学的谱分解理论指出,可观察量的谱集的 “交并补” 对应到投影算子的相关运算,从而对应到子空间的 “交,线性和,正交补”。” 量子逻辑可以在\hbar趋于0的极限下自动过渡到经典逻辑,因为此时相空间几乎每个点都对应到一个独立的量子态,这样相空间子集的“交并补” 集合运算就几乎可以用 Hilbert 空间的 “交,线性和,正交补” 运算来模拟。

【量子力学科普】转两圈才还原——从Bloch球面的旋转操作理解自旋1/2

一个qubit的状态可以表达为Bloch球面上一个点。不失一般性,可以选择\Hat{z}方向上的本征态\vert+\rangle,\vert-\rangle将整个Bloch球面上所有的态表达为二者的叠加:\vert\lambda\rangle = \alpha \vert+\rangle + \beta \vert-\rangle = e^{i\gamma}\left(\cos{\frac{\theta}{2}}\vert+\rangle + e^{i\psi} \sin{\frac{\theta}{2}} \vert-\rangle\right),由于全局相位不可观察,所以全局相位角\gamma就没有被表达在Bloch球面上。

(注意,这个\frac{\theta}{2}中的因子\frac{1}{2}并不神秘,因为\theta是Bloch球面上一点在球面坐标中的天顶角,该点对应的量子态在\vert+\rangle,\vert-\rangle两个分量上的归一化系数的绝对值必须是\cos{\frac{\theta}{2}}\sin{\frac{\theta}{2}},这一点在Bloch球面上稍加分析就可知道。)

旋转算子R_{\Hat{n}}\left(\phi\right)相当于将整个Bloch球面绕\Hat{n}轴旋转\phi角。简化问题并且不失一般性,我们考虑z表象下绕z轴的旋转算子:R_{\Hat{z}}\left(\phi\right)=\begin{pmatrix} e^{-i\frac{\phi}{2}} & 0 \\ 0 & e^{i\frac{\phi}{2}} \end{pmatrix}。这里面的因子\frac{1}{2}看上去有些诡异,也正是因为这个因子导致了『转两圈才还原』这种事情。

但事实上这并不奇怪,显然,这个矩阵将\vert+\rangle的相位反向转动了\frac{\phi}{2},而将\vert-\rangle的相位正向转动了\frac{\phi}{2}。这样,二者的相位差就会增大\phi,在Bloch球面上R_{\Hat{z}}\left(\phi\right)\vert\lambda\rangle对应的点刚好是\vert\lambda\rangle所对应的点绕z轴正向旋转\phi的点。也就是说,旋转操作R_{\Hat{n}}\left(\phi\right)的作用表现在Bloch球面上,就是对Bloch球面的普通旋转操作,没有任何神秘之处。

但『转两圈才还原』到底是怎么回事呢?因为这里还有一个被抛弃的全局相因子\frac{\phi}{2},这个相因子由于对单个qubit是不可观察的,所以在Bloch球面上就被扔掉了。

当我们实施旋转操作R_{\Hat{z}}\left(2\pi\right)的时候,全局相因子转动了\pi,只有转动两整圈R_{\Hat{z}}\left(4\pi\right)的时候,全局相因子才转动了一整圈2\pi对于单个qubit,这个全局相因子是完全不可观察的,因此对于单个qubit,我们根本不必关心『转两圈才还原』这回事,无论是把粒子旋转一圈还是把仪器旋转一圈,都不会发现任何可观察的差别。

但是,对于多个自旋1/2的粒子构成的体系,我们只对其中一个进行旋转操作,那么这种操作就会引起不同粒子之间的相位差的变化,这时候『转两圈才还原』这种事情才能出现可观察的效应。

以前我看Feynman或者Dirac所演示的那种『转两圈才还原』的演示实验,觉得非常不理解,因为所有这些演示都要把被旋转的东西连接到一个固定的东西上,而我们通常的旋转没有必要这样做。但现在想想这些演示是恰当的。因为如果仅仅是一个单一的qubit,旋转操作跟普通的旋转没有差别。只有当一个qubit跟某些作为背景的系统关联的时候,转动操作才会引发qubit相对于背景系统的相位差的变化,因此他们的演示应该说是非常恰当的。

解释一下扩散方程

(各向同性的)扩散方程:

    \[\frac{\partial\phi(\vec{r},t)}{\partial t} = \nabla \cdot \big[ D(\phi,\vec{r}) \ \nabla\phi(\vec{r},t) \big]\]

\phi(\vec{r},t)是某点某时刻的浓度,D(\phi,\vec{r})是某点在浓度\phi下的扩散系数。如果扩散系数D是常数,那么扩散方程退化为热传导方程:

    \[\frac{\partial\phi(\vec{r},t)}{\partial t} = D\nabla^2\phi(\vec{r},t)\]

扩散方程很好理解,方程中D(\phi,\vec{r}) \ \nabla\phi(\vec{r},t)就是(负的)扩散过程中的浓度流。某点某时刻浓度流的大小等于该点的(负的)浓度梯度乘以扩散系数。
而(负的)浓度流的散度自然就是浓度随时间的变化率。

事实上扩散方程是可以直接从连续性方程得出的:

    \[\frac{\partial\phi}{\partial t}+\nabla\cdot\mathbf{j}=0\]

如果浓度流正比于该点的(负的)密度梯度(Fick’s law),那么:

    \[\mathbf{j}=-D(\phi)\,\nabla\phi(\vec{r},t)\]

直接带入连续性方程就给出了扩散方程。

对于各向异性扩散,浓度流的方向跟(负的)浓度梯度的方向可能并不重合,此时扩散系数就必须是一个张量,相应的矩阵是对称正定的。

    \[\frac{\partial\phi(\vec{r},t)}{\partial t} = \sum_{i=1}^3\sum_{j=1}^3 \frac{\partial}{\partial x_i}\left(D_{ij}(\phi,\vec{r})\frac{\partial \phi(\vec{r},t)}{\partial x_j}\right)\]

参见:
https://en.wikipedia.org/wiki/Diffusion_equation

Bernoulli’s principle,可压缩和不可压缩流体

Bernoulli描述流体无摩擦的定常流动。

对于不可压缩流体,密度是常数:

    \[{p\over\rho}+{v^2 \over 2}+\Psi=\text{constant}\]

其中
v是流线上某点的流速
p是流线上某点的压力
\Psi是流线上某点的力势(例如在匀强重力场中\Psi=g h
\rho是流体的密度
微分形式:

    \[{dp\over\rho}+{v dv}+d\Psi=0\]

对于可压缩流体,密度随压强而改变\rho=\rho(p)

    \[\int_{p_0}^p\frac{d\tilde{p}}{\rho(\tilde{p})}+\frac{v^2}{2}+\Psi=\text{constant}\]

如果流动过程的时间尺度跟流体达到热平衡的时间尺度相比很短暂,流体团之间来不及充分交换热量,可以近似认为在流动过程中流体团经历的是绝热过程。对于理想气体:

    \[\left(\frac{\gamma}{\gamma-1}\right)\frac{p}{\rho}+\frac{v^2}{2}+\Psi=\text{constant}\]

注意,此时\rho不再是常数,而是压力p的函数

理想气体绝热过程:p V^{\gamma} = \text{constant}
其中\gamma = {C_{P} \over C_{V}} = \frac{f + 2}{f}C_{P}是定压热容,C_{V}是定容热容,f是分子自由度。
V = {M \over \rho}

    \[p \rho^{-\gamma} = \text{constant}\]

    \[p^{1/\gamma} \rho^{-1} = \text{constant}\]

    \[d(p^{1/\gamma} \rho^{-1}) = 0\]

于是我们可以针对理想气体求出Bernoulli定律的微分形式:

    \[d\left(\left(\frac{\gamma}{\gamma-1}\right)\frac{p}{\rho}\right)+d\left(\frac{v^2}{2}\right)+d\Psi=0\]

    \[\left(\frac{\gamma}{\gamma-1}\right)d\left(p \rho^{-1} \right)+{v dv}+d\Psi=0\]

    \[\left(\frac{\gamma}{\gamma-1}\right)d\left(p^{1-1/\gamma} p^{1/\gamma}\rho^{-1} \right)+{v dv}+d\Psi=0\]

    \[\left(\frac{\gamma}{\gamma-1}\right)p^{1/\gamma}\rho^{-1} d\left(p^{1-1/\gamma} \right)+{v dv}+d\Psi=0\]

    \[\left(\frac{\gamma}{\gamma-1}\right)p^{1/\gamma}\rho^{-1} \left(1-1/\gamma\right) p^{-1/\gamma} dp+{v dv}+d\Psi=0\]

    \[{dp\over\rho}+{v dv}+d\Psi=0\]

跟不可压缩流体的微分形式相同,但注意这里面的\rhop的函数。
由于形式上的相似,我们可以考虑在什么条件下可以近似使用不可压缩流体的Bernoulli定律对理想气体压强和流速之间的关系做近似计算。

由于我事先已经知道最终的结果跟流体中的声速相关,这里只是试图证实相关结论,所以这里先将压力和密度做变量替换为声速简化计算,最后再还原成压力。
流体中的声速:

    \[c^2 = {\partial p \over \partial \rho}\]

理想气体绝热过程(声波的传播过程中流体各部分一般来不及充分交换热量):p \rho^{-\gamma} = \text{constant}

    \[d\left( p \rho^{-\gamma} \right) = 0\]

    \[\rho^{-\gamma} dp - \gamma \rho^{-\gamma-1} p d \rho = 0\]

    \[dp = \gamma \rho^{-1} p d \rho = {\partial p \over \partial \rho} d \rho\]

因此:

    \[c^2 = {\partial p \over \partial \rho} = \gamma {p \over \rho}\]

    \[d c^2 = \left( \gamma - 1 \right) {dp \over \rho}\]

带入理想气体Bernoulli方程的微分形式:

    \[{d c^2 \over \left(\gamma-1\right)}+{v dv}+d\Psi=0\]

积分得:

    \[{c^2 \over \left(\gamma-1\right)} + {v^2 \over 2} + \Psi = \text{constant}\]

c_0, p_0, v_0, \rho_0, \Psi_0是某参考点上的状态参量,那么

    \[{\left( c^2-{c_0}^2 \right) \over \left(\gamma-1\right)} + {\left( v^2-{v_0}^2 \right) \over 2} + \Psi-\Psi_0 = 0\]

\Delta = {c_0}^{-2} (\gamma - 1)\left({\left( v^2-{v_0}^2 \right) \over 2} + \Psi-\Psi_0\right)

    \[{c^2 \over {c_0}^2} = 1 - \Delta = {\left(p \over p_0\right)}^{1-{1 \over \gamma}}\]

    \[p = p_0{\left(1 - \Delta\right)}^{\gamma \over {\gamma-1} }\]

Talor展开:

    \[p = p_0 - p_0{\gamma \over {\gamma-1} }\Delta + p_0{1 \over 2}{\gamma \over {\gamma-1} }{1 \over {\gamma-1} }\Delta^2 + O(\Delta^3)\]

其中第一项

    \[p_0{\gamma \over {\gamma-1} }\Delta = \rho_0 \left({\left( v^2-{v_0}^2 \right) \over 2} + \Psi-\Psi_0\right)\]

刚好是不可压缩流体Bernoulli定律给出的结果。
第二项以及后面的是相对于不可压缩流体的修正项,这里可以估计修正的大小:

    \[p_0{1 \over 2}{\gamma \over {\gamma-1} }{1 \over {\gamma-1} }\Delta^2 = p_0{\gamma \over 2}{\left({\left( v^2-{v_0}^2 \right) \over {2 {c_0}^2}} + {{\Psi-\Psi_0} \over {c_0}^2}\right)}^2 \]

如果只考虑速度变化引起的压强变化修正量:

    \[p_0{\gamma \over 2}{{{\left( v^2/2-{v_0}^2/2 \right)}^2 \over {c_0}^4}}\]

很容易算出,如果流体的最大速度不超过参考点声速的0.3倍(0.3Mach),那么由于速度变化引起的压强修正量大概只有千分之1-2(\gamma的典型范围在1-2之间)。

如果只考虑势差变化的变化引起的修正项:

    \[p_0{\gamma \over 2}{\left({{\Psi-\Psi_0} \over {c_0}^2}\right)}^2\]

很容易算出,如果自由落体经该势差的速度变化量小于参考点声速的0.3倍(0.3Mach),那么由于势差引起的压强修正量也只有千分之1-2。

对于普通空气,只要空气的流速低于100m/s,且高度差小于500m,那么就可以放心地使用不可压缩流体的Bernoulli定律,误差只有千分之1-2。
不过千万注意,无论是不可压缩流体还是可压缩流体,Bernoulli定律描述的都是粘性效应可忽略的流体,粘性效应不可忽略的情况是不能用的。

Wikipedia上的资料:
Bernoulli’s principle
提到了两类广为流传的关于Bernoulli定律的误解:
Misunderstandings about the generation of lift
Misapplications of Bernoulli’s principle in common classroom demonstrations

量子芝诺实验的结果disfavor哥本哈根学派对测量原理的波函数坍塌诠释

自从我系统性地学习了量子力学基本原理,就始终认为波函数坍塌是一个完全错误的诠释。测量原理的这种诠释在逻辑上根本就不可能跟量子力学其他原理相容。测量过程破坏微观量子系统演化的幺正性。而这种破坏仅仅发生在微观量子系统跟宏观仪器和环境相互作用的过程中。而我们都知道幺正演化仅对于孤立系统才成立。根据量子力学,只要你把所有参与相互作用的系统都考虑进来,演化的幺正性压根就不会被破坏。我始终认为,只要量子力学中去掉测量原理,压根就用不着任何诠释。当然这并不意味着我们不需要测量原理,只是测量原理不算是量子力学理论框架内的原理,而是一个类似于统计物理学等几率假设那样的统计假设,跟量子力学理论框架之间是独立的。

近20年内有关量子力学基础的实验越来越清晰地disfavor波函数坍塌解释。孙昌璞院士写了一个胶片介绍了相关的进展。

有人认为量子力学原理中最基本的假设是测量原理,是它让算符和波函数之类的概念具有了物理上可以观测的意义,我过去也曾经认同过这个说法。但我后来想了想,量子力学原理中去掉测量原理仍然不会失去物理上的意义,因为还有Hamiltonian的具体形式。在量子力学的基本原理中丝毫没有假设Hamiltonian的具体形式,Hamiltonian的形式必须额外引入,而且必须通过实验来确定。而且Hamiltonian的形式也能够在物理上产生可观测的效果,因为测量过程涉及到被观测系统如何通过相互作用影响观测仪器的读数,这自然是量子力学演化方程能够唯一决定的事情。事实上在这一点上量子力学跟分析力学完全相似,分析力学中唯一的经验假设就是Hamiltonian(或Lagrangian)的形式,分析力学本身丝毫没有对Hamiltonian的形式作出假设,但分析力学中只要给定了Hamiltonian就变成了一个真正的经验科学理论,一切就有了物理意义。但是我们没法用量子力学精确地计算一个包括仪器和环境在内的巨大的宏观体系的演化,而且最严重的问题是我们没法精确地了解仪器和环境这个宏观系统的量子态,至多只能通过宏观热力学状态给出一些统计信息。

在量子力学创立初期,人们对这个问题完全没有办法处理,所以才引入了测量原理这个“多余”的原理(因为去掉测量原理之后的量子力学是“完备”的,只要给定Hamiltonian和初始量子态,去掉测量原理的量子力学可以决定一个孤立系统任何时刻的量子态,包含了该时刻物理系统的全部信息),有了这个原理,人们才能够对实验结果作出计算。

当我们观测一个微观量子体系,我们所选择的观测手段就会确定一个测量表象,观测过程中宏观仪器和量子体系的相互作用会将量子体系的状态诱导到测量表象的某个本征态上(或极其靠近该本征态)。但宏观仪器具体会将被测量子体系的状态诱导到测量表象的哪一个本征态上,这件事就敏感地依赖于宏观仪器环境测量前所处的量子态。由于我们根本没办法知道宏观仪器和环境(包括我们自身)这个宏观系统测量之前所处的具体量子态,所以我们根本不可能对测量结果作出精确的预测。但我们可以做一些统计,当我们完全不关心宏观仪器环境所处的量子态,对宏观仪器所有可能的量子态做统计,就必须得到跟测量原理一样的统计结果:如果测量前被测微观量子体系的量子态是\psi,那么宏观仪器环境那些『将会把被测体系状态从\psi诱导到测量表象下第i个本征态|i>』的量子态的数量,正比于\psi在|i>上投影的平方(请原谅,这句话有点绕),当然,目前我们只能对非常特殊的系统做出这种计算。

这里不能不说说薛定谔猫佯谬。

许多人都在纠结于死猫和活猫的叠加态到底是个什么东西这样的问题上。对于基本粒子,我们很容易理解这一点,因为量子物理学中粒子并不是一个点,而是空间中的一个分布,你当然可以用点状的 [\delta] 函数来叠加出任何一个连续分布,但这并不意味着点状分数具有什么特殊的地位,你可以任意选择一种正交完备的分布,叠加出粒子所有可能的状态。

当人们遇到宏观物体的叠加态,就全都傻眼了。粒子可以是一个分布,猫怎么分布?人们无法想象一个处于死活叠加态的猫是个什么东西。人们在理解基本粒子叠加态的时候,能够把这个叠加态当成是一个明确独立的状态,虽然它能够分解为另外两个状态的叠加,但这种分解是随意的,并不是唯一的,在某个表象下的本征态并不比它们叠加出来的状态有任何地位上的优越性。人们并不会把叠加态当成多个状态的概率混合(混态)。而我发现对于薛定谔猫,绝大部分讨论都把死猫和活猫的叠加理解为一种类似于混态的东西:猫既死又活。

事实上,我们自身的状态都可以在某个表象下分解。你当前的状态,总是可以拿一个跟你目前状态不同但你仍然活着的状态,以及某个你死了的状态,再加上某个不知道是什么的状态,叠加出来。也就是说,你本来就处于既死又活又?的状态叠加出来,但你对此有任何感觉么?

反过来,死猫和活猫叠加出来的状态并不是一只既死又活的猫,而是一个明确的状态,这个状态可能对应一只死猫,也可能对应一只活猫,甚至可能根本没有猫却有10只老鼠,也可能是一只生病的猫或者甚至是两只三只猫。一个对应死猫的具体量子态和一个对应活猫的具体量子态叠加后到底是个什么状态,我们并不能轻易说出来,因为这个宏观体系的Hilbert空间结构我们几乎一无所知,Hamiltonian也过于复杂,但我们知道叠加出来的量子态一定是一个明确的『纯态』而不是既死又活不知死活的某种『混态』。

这样一来,薛定谔猫佯谬其实根本就不存在什么既死又活的困难,两种状态的叠加态根本就不是什么猫既死又活的状态,只是到底将是什么样的状态我们并不十分清楚。当我们打开盒子的时候,我们当然会跟盒子里的体系相互作用,但对于盒子中的宏观系统,我们打开盒子观看盒子内部状态这种测量操作所选定的测量表象的『本征态』根本就不是只有死猫和活猫两个基向量,因为猫这个体系太大。我们观察盒子这个测量操作选定的测量表象的基向量数量极其巨大,而观测过程会让盒子中的猫的量子态被诱导到这个数量极为巨大的基向量之一,但可以肯定的是,其中任何一个基向量都不会对应什么『猫既死又活』的这种混态。

薛定谔猫佯谬并没有什么怪异之处,但量子力学中确实存在诡异之处,也就是EPR对,隐形传态的基础。但这个诡异之处在数学上是如此清晰明确,完全不像测量原理那样,由于引入了矛盾而导致了大量含混不清的哲学争论。

对我而言,波函数坍塌是一个很“不诚实”的诠释。事实是我们既不知道宏观仪器环境跟被测微观系统相互作用的细节,也不清楚仪器环境这个宏观系统的量子态细节。这种情况下老老实实地承认这一点就可以了。在承认这一点之后,还可以诚实地告诉大家虽然我们不清楚这些细节,但我们仍然必须计算观测结果,我们通过实验观察总结出了一条非常好用的经验规律,就是所谓的测量原理。在我们不了解仪器环境量子态以及不了解仪器环境和被测微观系统相互作用细节的情况下,这条原理能够告诉我们测量结果以及测量之后微观体系所处的可能量子态。我觉得那些乱七八糟的关于测量原理的各种哲学诠释就是哥本哈根对测量原理的这种很不诚实的过度诠释导致的。

我丝毫不是说测量原理不重要,它是一条跟实验结果相联系的至关重要的经验规律,我相信即便在遥远的将来我们也不可能离开这条经验规律。但这条原理应该被理解为由于我们根本无从精确了解仪器环境这个宏观系统的量子态的情况下,还要预测实验结果而不得不依赖的一条统计假设,其地位就像统计物理学中的等概率假设一样。我们很清楚等概率假设对于非各态历经的系统不可能严格成立,但对于足够大足够复杂的系统,我们从来没发现这条原理导致了实验上可观察的偏差。

在几乎所有涉及量子力学的科普宣传中哥本哈根诠释都是铺天盖地的,而那些不承认哥本哈根解释的物理学家之中也有许多人整天鼓吹的都是多世界平行宇宙这样的解释,特别发明了诸如量子永生之类的赚眼球的童话故事。从这件事情上可以看出:人们需要的并不是科学理论,而是吃惊。我个人认为波函数坍塌的哥本哈根诠释已经完全破产了,但其恶劣影响将会继续持续很长很长时间,仍然会有大批人在这个问题上胡扯下去。

PS:有人问波函数坍塌跟量子力学之间为什么是不相容的,这里做个说明:

只要你把包括仪器和环境等所有参与相互作用的物理系统都考虑进来,整个系统(G)就成为一个孤立系统,对G直接应用量子力学,其态矢严格按照量子力学演化方程演化,无论是测量前还是测量过程中还是测量后。而G可以分为两个子系统:被测量子系统(S)、仪器和环境(包括我们)(E),在测量之前和测量之后,由于E和S之间没有任何相互作用,所以E和S各自的演化也是幺正的。而测量过程就是E和S发生相互作用产生纠缠的过程,在这个过程中G的演化始终是幺正的,但子系统E和S在这个过程中都是开放的,因此E和S各自的演化都不是幺正的,这也就是测量过程中被测系统的演化非幺正性的起源。由于按照量子力学G的演化始终是幺正的,因此E对S测量后G的状态是完全确定的,S作为G的子系统,在测量后被诱导进入什么量子态,也必然是完全决定的。只是对于身处G中的我们而言,并不清楚宏观仪器环境(包括我们自身)E在测量前的具体量子态,也没法对巨大的宏观系统G计算其演化结果,所以我们才完全没法精确计算S在测量之后将会进入什么状态。但我们无论如何都要让理论给出实验上可以检验的预言,所以我们才需要引入一个统计假设:测量原理。

而波函数坍塌解释则将S在测量过程中发生的非幺正演化解释为波函数莫名其妙的坍塌,断言S在测量之后的状态不能由S和E在测量之前的状态所唯一决定。而根据量子力学,如果G在测量前后始终在幺正演化,那么测量后G的状态当然是由测量前G的状态完全决定的,G的子系统S的状态不可能无法由测量前E和S的初态所完全决定。所以这在逻辑上是根本不可能调和的矛盾,你要么承认量子力学,同时承认我们能力有限,既不能明确地了解E的状态,也无法计算U的演化,所以只能测量后S的状态做统计预言,要么承认波函数坍塌解释,认为测量过程不符合量子力学描述,会凭空创造出不确定性(上帝的骰子)。

【物理科普】热力学第二定律的起源和热力学时间箭头

本文的读者是有一些统计物理学基础但仍然对热力学第二定律的来源感到疑惑的同学。

目前我们所知道的微观世界的物理规律都是可逆【注1】的,但与此同时,热力学第二定告诉我们物理系统在宏观上不可逆,任何处于非平衡态的宏观孤立系统似乎都会不断义无反顾地向熵极大的平衡态演化,没人见过相反的过程。这看上去是一个严重的矛盾:微观上我们已知的所有物理规律都是可逆的,那么宏观上的不可逆性到底是从什么地方冒出来的呢?难道是因为我们所掌握的微观物理规律有错需要修正?如果宏观上如此明显的不可逆性起源于微观物理规律的不可逆性,为什么我们在微观上却从来观查不到?难道说微观物理规律本来只有极其微小的不可逆性以至于我们从未观察到,却由于某种原因在宏观尺度上被剧烈地放大了么?

本文要向同学们说明这样一件事:宏观物理规律的不可逆性完全不必起源于微观物理规律的不可逆性,在微观物理规律完全可逆的前提下,我们照样能看到宏观物理规律的不可逆性,而且这件事情非常自然。

先解释一下两个概念:“宏观状态”、“微观状态”。

经典力学中,微观状态对应相空间中的点,包括系统中每个微粒的位置和动量,相空间是包含所有可能微观状态的集合。量子力学中,微观状态(量子态)对应希尔伯特空间中的矢量,希尔伯特空间是包含所有可能微观状态的集合。如果微观物理规律是可逆的,那么给定物理系统某个时刻的微观状态,物理规律就可以唯一地确定系统未来或过去的状态。

而物理系统的宏观状态则是一组给定的宏观测量仪器(例如温度计、压力表、测距仪、照相机、眼耳鼻舌口皮肤等等)的可分辨状态。如果若干不同的微观状态对于这组仪器完全无法分辨的,就说这这些微观状态都对应同一宏观状态。

因此,宏观热力学状态对具有指定能量的微观状态集(等能量面)构成了一个粗粒划分,等能量面上对应同一宏观状态的所有微观状态构成了一个“状态粗粒”,我们称这种划分为“粗粒化”。粗粒化一般是不均匀的,不同状态粗粒包含的微观状态数量(或体积)多少不一相差极大。最大的宏观状态粗粒就是那个所谓的热平衡状态对应的状态粗粒。

当我们说某个物理系统处于某个宏观状态,其实是说系统所处的微观状态属于对应该宏观状态的那个状态粗粒,但我们并不能确定具体是哪个微观状态。熵就是衡量这种不确定性的大小的量。有统计物理学基础的同学看到这里立即能想到波尔兹曼的熵的微观定义S = k \ln \Omega,其中S是熵,k是波尔兹曼常数,\Omega是该宏观状态对应的微观状态数【注2】。

不均匀粗粒化的一个直接后果就是:即便微观物理规律完全是可逆的,但由于大的粗粒包含更多的微观状态,因此从小状态粗粒出发进入大状态粗粒的概率就大于相反过程的概率。由于宏观上大状态粗粒对应高熵宏观状态,小状态粗粒对应低熵宏观状态,因此系统从低熵状态出发进入高熵状态的概率就大于相反过程的概率。所以,如果系统最初位于某个熵极低的宏观状态,那么系统就会以极大的概率向高熵宏观状态演化。

也就是说,热力学第二定律来源于粗粒化的非均匀性,而不可逆性则源于宇宙当前所处的低熵状态。

事实上,庞加莱的无限回归定理【注3】表明,只要一个孤立物理系统曾经熵增,经过足够长的时间就一定会熵减。但在绝大部分时间,孤立系统都在熵极大的热平衡态附近来回晃悠(涨落),经过很久很久才会极其罕见但迅速地“不小心”涨落到低熵状态,但接下来就会迅速地回到高熵状态。跟漫长的热平衡阶段相比,低熵状态的阶段只是一些极为短暂的瞬间。对于宇宙来说,这个低熵瞬间的长度都比大爆炸以来的宇宙年龄长得多,而热平衡阶段则不可思议地漫长。

在孤立系统从高熵状态涨落到低熵状态的过程中,熵随着微观物理时间参数(不妨称为“物理时间”)的增加而减少,也就是说此时热力学第二定律所确定的热力学时间箭头跟微观状态演化的物理时间的规定方向相反。既然如此,我们可能看到整个宇宙发生大范围熵减的过程么?很不幸,完全不能。我们的心理时间箭头是由热力学时间箭头决定的,对我们而言宇宙的“过去”总是对应低熵状态,宇宙的“未来”总是对应高熵状态,我们能记住低熵的过去,却记不住高熵的未来。即便宇宙的熵随着物理时间的增加而减少,我们也会把物理时间增加的方向当成过去,把物理时间减少的方向当成未来,以至于只能看到熵增。事实上,微观物理时间的方向规定本来就是随意的,我们完全可以认为今天宇宙的熵正在随着物理时间的增加而减少,但由于我们的心理时间方向跟热力学时间方向相同,以至于我们仍然以为宇宙的熵在增加。

这里有一个很好的类比:无论你在南极还是在北极,你都会发现重力方向是“向下”的,但南极上看来向下的方向在北极上看显然是向上的,既然如此我们站在北极的时候为什么不会认为重力是向上的呢?那是因为我们规定物体下落的方向就是下方,而物体下落的方向恰恰重力方向决定的,所以无论你站在地球上什么地方,你都会认为重力是向下的。同样,无论宇宙的熵随着微观物理时间的流逝增加还是减少,你都会发现时间方向是“向未来”的,因为心理上所谓的“未来”方向恰恰是宇宙的熵增方向决定的。

有人可能会问,既然低熵状态这么罕见,为什么我们今天的宇宙还处于低熵状态?无论低熵状态多么罕见,只要经过足够长(真的非常非常长)的时间,宇宙总是会很“不小心”地涨落回低熵状态,而只有在这些阶段才能存在生命。

微观物理规律的时间可逆性和宏观热力学时间方向性之间,没有任何难以调和的矛盾。

【注1】有些同学可能不清楚『可逆』和『时间反演对称』之间的区别。『时间反演对称』是说系统的物理规律在时间参数取负(t变成-t)时保持形式完全不变,通俗地说如果你给这样的系统拍一段录像,那么倒放这段录像时你看不到任何物理规律被破坏。而『可逆』是说从系统的当前状态不但可以唯一确定后续状态,还可以唯一倒推出先前状态,通俗地说,两个不同微观状态经过一段时间不会变成同一微观状态(信息丢失),一个微观状态经过一段时间也不会不确定地进入两个不同微观状态之一(信息增加)。可逆的系统未必时间反演对称,时间反演对称的系统也未必可逆。在量子力学中,可逆性对应的是“幺正性”。

【注2】在信息论中,概率为p的事件的信息量是-\ln p,而系统的熵定义为所有事件的信息对其发生的概率加权求和:S = \sum\limits_i {- p_i \ln p_i},如果系统等概率地处于\Omega个状态之一(此时p_i = 1 / \Omega),那么系统的熵就是 S = k \ln \Omega。所以信息论中的熵和统计物理中的熵,除了差一个玻尔兹曼常数k之外,意思是完全相同的。

【注3】庞加莱无限回归定理:如果等能量面容积有限,那么只要经过足够长的时间,一个孤立物理系统的微观状态将任意次回到任意靠近初始状态的地方。于是物理系统的微观状态实际上可以无数次任意靠近任何一个曾经路过的微观状态。注意,千万不要把无限回归定理和各态历经假设混为一谈,各态历经要求只要经过足够长的时间,一个孤立的物理系统的微观状态将任意次任意靠近等能量面上的任意微观状态。二者的区别是,无线回归可能仅仅对等能量面上的一个连通的子集能够做到各态历经,并不一定对整个等能量面各态历经。

——————————————————————————————————
附:
我用程序模拟运行了一个由若干硬币构成的孤立的玩具动力系统。

其中每个硬币有正面反面两个状态,n个硬币构成的系统有2^n个不同的微观状态,可以由一个n位的二进制串来标记,例如001011101...1001。而系统的宏观物理量则是正面硬币的数量(假设我们的宏观仪器只能观测到正面的总数,无法看清每一个硬币的正反面),于是系统对于这套宏观仪器来说有n+1个不同的宏观状态,可以用S_i(i=0,1,2...n)来标记。显然,有0个正面的宏观状态S_0和有n个正面的宏观状态S_n对应的微观状态最少,分别只有一个,而正面数量在\lfloor n/2 \rfloor\lceil n/2 \rceil宏观状态对应的微观状态数最多,是\left( \begin{array}{c} n \\ \lfloor n/2 \rfloor \end{array} \right)

系统的动力学规律这样设定:对应每一个具体的微观状态,有一个唯一的前驱状态和一个唯一的后续状态,要求前驱和后继状态只有一个硬币的正反与当前状态不同,在这个限制下完全随机设定。对所有的微观状态做了这样的设定之后,状态空间中的2^n个状态通过前驱后续的关系就构成了若干个闭合回路,任意选取其中一个状态迁移的回路,就可以观察系统熵的变化。

下图是一个由9个硬币构成的玩具动力系统的熵变过程,横坐标是物理时间,纵坐标是系统当时的熵。该系统的微观状态数是2^9=512,而我们随机构造的状态迁移回路长度为98。可以看到,在这个状态回路中,系统大部分时间都游荡在最大熵状态附近,少数情况下系统会游荡到低熵状态,对应图中那个尖尖的深谷。
9coins-entropy
如果把硬币数量增加到100,那么典型的状态回路长度就会变得不可思议地巨大(数量级上与2^{100}相差不远),随机生成的动力学状态回路长度会过于巨大以至于我们几乎没可能在有生之年看到一个随机状态回路的完整周期。但我们可以看看这个状态回路中极为短暂的一个低熵瞬间。下图显示了100个硬币构成的动力系统游荡到低熵状态前后约300个时间单位的瞬间。
100coins-entropy(300iterations)
下图显示了该系统从0熵宏观状态开始的400,000个步骤的熵变,可以看到除了从0熵出发的瞬间,系统始终在最大熵状态附近游荡,我们基本上没可能在有生之年看到该系统再次回到0熵状态。
100coins-entropy(400000iterations)

我对热力学第二定律的统计解释

(有待补充修改)

我们的观测手段往往没有办法了解被观察的系统所处的具体的微观状态,许许多多微观状态对于一种特定的观测手段而言是无差别的。例如,我们用一个温度计来观察某个系统的温度,如果温度的变化太小以至于完全无法影响温度计的读数,那么对于这种特定的观测手段而言,这两个只有微小差异的温度之间就是完全无法区分的。即便我们用一大堆各种各样的仪器去观察系统,只要系统的微观状态改变不足以让任何一个仪器读数发生改变,那么这些微观状态的变化对于这一组仪器而言就是不可区分的。

因此,我们可以定义一个叫做『宏观态』的概念:给定一组具体的物理仪器,当被测体系的两个微观态s0,s1完全无法被这组仪器的读数所区分的时候,我们称这两个微观状态属于(由这组仪器所确定的)同一宏观态M,对应同一宏观态M的所有不同微观态的集合记为S_M。由被测系统的仪器读数所确定的宏观态对系统的全体微观状态集S构成了一个等价类划分:S=\bigcup S_M。除极特殊的情况,仪器所确定的宏观态对微观状态的划分很难是均匀的,不同的宏观状态对应的微观状态数可能有很大差别。而对于每一个宏观状态,由于我们丢失了具体微观状态信息,那么其熵按照波尔兹曼熵的定义就是其微观状态数的对数。

说到由仪器读数所确定的宏观态,有人可能会有异议,因为仪器本身也是一个热力学系统,也具有不确定性。即便是同一个微观态,如果处于两个宏观态的交界附近,那么仪器的读数未必能完全确定。这并不是个严重的问题,我们可以谈论一个微观态对某个由仪器读数所确定的宏观态的『隶属度』。这个隶属度定义为该微观态使仪器刚好产生某个特定宏观态读数的概率。这样一来,仪器读数所确定的宏观态对微观态空间的划分的边界就模糊了,但即便如此,宏观态对微观态的划分一般也不会均匀,而这对于后面的讨论已经足够。这种情况下,属于某个宏观态的微观态的状态数就需要把所有微观态按照对这个宏观态的隶属度进行求和。

如果系统的初始状态是某个微观状态数很小的宏观态M0,那么在等几率假设之下,系统从该宏观态演化到某个微观状态数很大的宏观状态M1的概率总是远大于从M0到M0或从M1到M0的概率。假设一个宏观状态M所对应的微观状态数是N(M),熵S(M)=ln(N(M)),那么从M0出发,经过足够长的时间(时间必须足够长,使宏观状态演化过程的序列相关性无法被明显观察到),到达M1的概率与到达M2的概率的比值就应该是N(M1)/N(M2)=exp{S(M1)-S(M2)}。也就是说,如果两个宏观态的熵差异很大,那么从低熵状态演化到高熵状态的概率远大于相反的过程。

当然,等几率假设有可能是过强的一个假设。只要等能量面面积有限,那么Poincaré回归定理告(Poincaré recurrence theorem)诉我们只要经历足够长的时间,系统状态能任意接近初始状态。在这个意义上,可以将这些能够能够被任意接近的状态称为『可到达』的状态(注意,可到达未必代表真的可以在有限时间内到达,只是能够在有限时间内任意靠近的意思)。但系统的微观态未必总是能走遍整个等能量面,从某个特定的初始状态出发,可能只能遍历等能量面上的一个区域,其他区域永远走不到。因此这些互不连通但内部却联通的区域又构成了对等能量面的一个划分。而宏观态本身也是对状态空间的划分,顺便也就会划分等能量面上每一个连通区域。同样,除了特殊情况,仪器所决定的这种划分对等能量面某个连通区域的划分一般而言是不均匀的,根据前面的推理,系统从低熵宏观态演化到高熵宏观态的概率远大于相反的过程。不过这里的熵跟前面所说的熵有所不同,前面所说的熵是整个能量面上对应某宏观态的微观状态总数的对数,而这里的熵则是能量面上一个特定的连通区域对某该宏观态的微观状态数的对数。我们希望仪器读数所确定的宏观态对二者划分的微观态状态数基本成正比,这样系综理论就不会给出有问题的结论。如果连通区域形状极其复杂,向树根一样散布在能量面上,就可能可以满足上述要求。

我现在只能说,我们知道如何算并且算过的系统中,尚未遇到违反上述条件约束的情况。

这就是我对热力学第二定律的统计解释。

——————————————————

待补充内容:

Poincaré recurrence theorem细节:Note also that nothing prevents the system from returning to its starting point before all the phase volume is exhausted. A trivial example of this is the harmonic oscillator. Systems that do cover all available phase volume are called ergodic.

由于相空间的动力学相当于不可压缩流体,所以从任何一个大的宏观状态粗粒出发,大状态粗粒中能够到达某个小状态粗粒的微观状态数量至多跟小状态粗粒中的微观状态数相等,因此大状态粗粒中必然存在一些不能到达该小状态粗粒的微观状态,这些微观状态要么会回到大状态粗粒自身,要么进入其他状态粗粒。

夏至宏的经典多体问题非碰撞奇点解简介

经典多体问题是指在牛顿力学和牛顿引力理论框架下研究多个具有固定质量的质点所构成系统的演化规律的问题。对于这样一个经典力学系统,是否只要给定初始条件(所有质点的位置和速度),就可以精确预测体系今后任意时刻的状态呢?并非如此,如果初始条件能够导致质点间的碰撞,碰撞之后系统的演化就无法用经典力学来回答,包含碰撞的解叫做碰撞奇点解。Poincare曾经考虑过这样一个问题:经典多体系统是否存在非碰撞的奇点解?但很久都没有人能回答。直到夏至宏给出了第一个例子。

这里要注意,所谓非碰撞奇点并非给定初始状态而不能确定轨迹(至少不是直观想象的那样),而是轨迹会在有限时间内发散,其中部分或全部质点的速度或动能也发散,这并不破坏能量守恒,因为经典引力质点系中,引力场中引力势能可以无限制地降低,刚好跟无限制地增加的动能相平衡。而且这些解必须要求引力是超距作用,没有相对论效应和量子效应,质点可以无限制地靠近,只要不是直接重叠就不会碰撞。

例如夏至宏的给出的解中,有一个测度为0的初始条件集合,只要初始条件在这个集合中,就可以确保系统的轨迹在有限时间内震荡发散,速度和动能也在有限时间内发散,当然,引力势能也会在有限时间内向负无穷大发散。

夏至宏的解中有五个质点,四个质点具有相同质量M1M2M3M4,另一个质点m质量很小(但并不能忽略)。假设有两个水平的平面,一上一下(这两个平面的位置并不是一成不变的)。M1M2在上面平面里面相互绕转,而且是椭圆轨道,距离时而远时而近,而M3M4在下面平面里面以类似的方式相互绕转。质点m在上下两个平面之间震荡。当m从下运动到上平面时,M1M2距离不是特别近,当m穿过上平面受到M1M2的吸引而再次回到上平面,M1M2刚好变得非常近,m刚好从中间穿过,这样就会把m向下加速射出,此时上M1M2被迫上升,上平面也就跟着上升了,而且M1M2绕转的距离更近周期更短了。接下来的过程就是m向下穿过下平面,此时M3M4并不太近,但是当m继续向下并且受到M3M4吸引转头回到下平面,M3M4也变得非常靠近,m从当中穿过,被加速向上射出,此时M3M4同时被迫向下,下平面也就下降了,而且M3M4绕转的距离也更近周期更短了。……

只要初始条件适当而精确地设定,可以让这个过程变得越来越快,上下平面越来越迅速地远离,m的速度也越来越快,而且m速度的增加比两个平面距离增加的速度还快,虽然两个平面距离越来越远,但m往返上下平面的时间间隔却也越来越短,与此同时,上平面的M1M2之间的距离变得越来越近,周期越来越短,下平面的M3M4也类似。最终的结果是,两平面在有限时间内跑到无穷远,5个质点的速度在有限时间内达到无穷大。

在某种意义上说,这种非碰撞奇点也算是在给定初始条件,在有限时间之后,就无法预测其轨迹了,但这种无法预测是因为发散的速度和位置。但这种解实际上仍然只是数学上有趣的解,要求引力超距作用,质点是完美的几何点,没有任何相对论和量子效应,在如此苛刻的条件下,初始状态还必须从一个0测度的集合中精心选择才行。甚至这个所谓的『非碰撞』,指的也就是在到达那个特定时刻之前才没有碰撞。在无限趋于那个时刻的时候,为了提供无穷大的动能,实际上M1M2之间和M3M4之间的距离纷纷趋于0。在我看来认为在该时刻发生了碰撞也未尝不可。稍微想一想就可以知道,经典引力场质点系中,想要让任何一个质点的动能达到无穷大,都必须至少有一对质点无限靠近,靠消耗无穷多的引力势能才能提供无穷大的动能。

参考文献:
http://www.ams.org/notices/199505/saari-2.pdf

对量子力学之中不确定关系的解释

(需要读者多少学过一点量子物理学)

按照量子力学的理论模型,对于一个具体的量子系统来说,是『量子态』而不是位置或动量等物理量,完整地刻画了一个量子系统的状态。

但是,对于观察者而言,量子态并不直接可见,只有通过测量操作(这是跟被测量体系之间的一个相互作用过程)才能获取关于量子态的部分信息,我们称这些量为物理量(例如位置、动量等)。

但问题是位置和动量跟量子态之间并没有简单的对应关系,对于任何一个具体给定的确定位置,我们确实可以找到一个量子态,使这个量子态刚好具备给定的确定位置,我们将这个量子态称为对应该位置的位置本征态。对于任意具体给定的确定动量也是如此,我们将具备给定确定动量的量子态称为对应该动量的动量本征态。

不过量子态还有个特性:任何两个确定量子态的叠加仍然是一个确定的量子态,而且这个叠加出来的新量子态跟原来的两个量子态一样都是基本的量子态,跟前两者并没有地位上的差别。例如A态和B态叠加出C态,不仅仅可以把C态看成是A态和B态的叠加,也可以把A态看成是C态和B态的叠加,还可以把B态看成是C态和A态的叠加,A、B、C三个态的地位是平权的。这样一来,两个或更多不同位置本征态(对应不同的具体位置)叠加出来的量子态就不再对应任何具体的位置,不再是位置本征态。

您可能会想,本征态和非本征态地位总该不同吧, 似乎只有具有确定位置的本征态才配称得上是确定的量子态,不具有确定位置的量子态只是『同时』处于若干个本征态的一个不确定的状态。这个想法貌似不错,但问题是任何一个量子态都即可以作为本征态,也可以作为非本征态,这取决于『表象』。这个『表象』就是(希尔伯特空间的)某个正交坐标系,而本征态就相当于表象坐标系的基矢。学过矢量分析的同学都知道,正交坐标系可以任意选择,对于任何一个矢量,都可以找到一个以该矢量为基矢的正交坐标系,也都可以找到一个不以该矢量为基矢的正交坐标系。其实,前面提到的位置本征态就是位置表象下的基矢,而动量本征态就是动量表象下的基矢。此外,动量本征态在位置表象下并不是基矢,因此动量本征态不对应确定的位置,反之亦然。换言之,只要一个量子态具有明确的位置,那么该量子态就是位置表象的一个基矢,而这个基矢在动量表象下不是基矢,自然不可能对应一个明确的动量,反之亦然。也就是说,任何实际量子系统的任何明确状态,本身就不会同时具有明确的位置和动量。

如果你试图用测量位置的仪器去测量处于某个量子态的粒子的位置,即便粒子原来所处的量子态并不对应任何具体的位置,测量操作中仪器跟粒子之间的相互作用过程也会强迫粒子从原来的量子态变迁到一个新的量子态,这个新的量子态恰好具有一个确定的位置,于是你的测量结果也就测得了一个确定的位置。这跟你的仪器是用来测量位置的有关,如果你的仪器是用来测量动量的,测量则会强迫粒子从原来的量子态变迁到一个具有确定动量的量子态。在这个测量过程中,原来的老量子态的信息的一部分被丢掉了,测量之后的新量子态对应某个明确的物理量,而这个物理量并不能完整刻画测量之前的老量子态。

你可能会问,测量一个所处量子态的位置不确定的粒子的位置,会迫使这个粒子进入具有哪个具有确定位置的量子态呢?量子力学的测量原理回答了这个问题:测量之后粒子进入某个具有确定位置的量子态的概率刚好正比于原量子态在具有该确定位置的量子态方向上投影的模平方。

在完全没有谈及测量原理的情况下,前面已经说明一个完全确定的量子态不可能同时具备确定的位置和动量,具体计算就可以知道位置动量不确定度的乘积有一个下限。虽然无需使用测量原理就可以得到不确定原理,但是这个不确定原理由于并不涉及测量,从而未必就导致大量测量结果样本的统计方差也满足不确定原理。而测量原理则限定了特定测量结果的概率分布与量子态态矢在该测量结果所对应的态矢(就是测量仪器所选择的那套表象的基矢)方向的投影之间的关系,经过数学推导就可以进一步确定大量测量结果样本的统计方差与不确定原理给出的不确定性有相同的数值,而不会出现虽然量子态本身的不确定性是这么大,但大量测量结果样本的统计方差却更大或者更小的情况。

黑洞——要么无法形成,要么不会蒸发

我在JCAP上发表了一篇文章:Black hole — never forms, or never evaporates
链接: JCAP, arXiv, DOI, Scholars Portal Journals

这是我手中未经JCAP排版的最新版本,纠正了一些笔误和语法错误:Black hole — never forms, or never evaporates

除了结论,文中还给出了Einstein Field Equation最一般的球对称解,任何球对称解都是其特例,包括Schwarzschild,Reissner-Nordstrom,静态流体球,除此之外还覆盖了所有非真空的有径向运动的情况。

目前已知的引用:
Christian Corda and Herman J. Mosquera Cuesta, Irreversible gravitational collapse: black stars or black holes?

讨论:
Physics Stack Exchange: If blackhole never forms, how important will be to study blackhole paradoxes

相对论König定理的简单证明

König定理:质点系的总动能等于质心动能加上所有质点相对于质心的动能。
以前看到过一种相对论情况下的证明,反复使用速度变换公式,很繁琐。其实利用总能量、动能、静质量的关系,在相对论中该定理的证明比经典力学容易得多。
以下约定所有质心系中的物理量都使用上标c。注意,质点系的质心系就是那个刚好使质点系总动量等于零的惯性系。该惯性系就是相对于质心静止的惯性系。

  1. 某惯性系S中质心总动能K_0等于质心总能量E减去质心在质心系中的静质量M^c(这对于任何物体都有效):

        \[K_0 = E-M^c\]

  2. 质心静质量M^c等于质心系中所有质点各自的能量e^c_i之和,也就等于所有质点静质量m^0_i之和加上所有质点在质心系中的动能k^c_i之和:

        \[M^c = \Sigma e^c_i = \Sigma (m^0_i + k^c_i)\]

  3. 质心总能量E等于所有质点的各自的能量e_i之和,也就等于所有质点的静质量m^0_i之和加上所有质点的动能k_i之和:

        \[E = \Sigma e_i = \Sigma (m^0_i + k_i)\]

  4. 总动能K等于其中每个质点的动能k_i之和:

        \[K = \Sigma k_i\]

所以:

    \[K_0 = E-M^c = \Sigma (k_i - k^c_i) = K - \Sigma k^c_i\]

也就是K = K_0 + \Sigma k^c_i,质点系的总动能等于质心动能加上所有质点相对于质心的动能。

如果你对步骤1中把计算动能的公式直接用于质点系不放心,只需证明如果n个质点的质点系满足该关系那么新增一个质点仍然满足这个关系,立即就可以通过数学归纳法证明任意个质点的质点系都满足这个关系(单个质点时该关系被自然满足)。一旦有了这个关系,剩下的就是加加减减。

Notes on Einstein Field Equation

Metric tensor:

    \[g_{\mu\nu} = g_{\nu\mu}\]

    \[g^{\mu\sigma} g_{\nu\sigma} = \delta^\mu_\nu\]

    \[g^{\mu\nu} g_{\mu\nu} = \delta^\mu_\mu = D\]

(D: dimension of the spacetime)

Christoffel symbol:

    \[\Gamma^\lambda_{\mu\nu} = \frac{1}{2} g^{\lambda\sigma}(\partial_\mu g_{\nu\sigma} + \partial_\nu g_{\sigma\mu} - \partial_\sigma g_{\mu\nu})\]

Riemann tensor:

    \[{R^\rho}_{\sigma\mu\nu} = \partial_\mu \Gamma^\rho_{\nu\sigma} - \partial_\nu \Gamma^\rho_{\mu\sigma} + \Gamma^\rho_{\mu\lambda} \Gamma^\lambda_{\nu\sigma} - \Gamma^\rho_{\nu\lambda} \Gamma^\lambda_{\mu\sigma}\]

Ricci tensor:

    \[R_{\mu\nu} = {R^\lambda}_{\mu\lambda\nu}\]

Ricci scalar (curvature scalar):

    \[R = {R^\mu}_\mu = g^{\mu\nu} R_{\mu\nu}\]

Trace of energy-momentum tensor:

    \[T = {T^\mu}_\mu = g^{\mu\nu} T_{\mu\nu}\]

Einstein field equation:

    \[R_{\mu\nu} - \frac{1}{2} R g_{\mu\nu} = 8 \pi T_{\mu\nu}\]

or

    \[R_{\mu\nu} = 8 \pi \left(T_{\mu\nu} - \frac{1}{2} T g_{\mu\nu} \right)\]

Torsion tensor (have nothing to do with energy-momentum tensor T_{\mu\nu}):

    \[{T^\lambda}_{\mu\nu} = \Gamma^\lambda_{\mu\nu} - \Gamma^\lambda_{\nu\mu} = 2 \Gamma^\lambda_{[\mu\nu]}\]

Properties of the Riemann tensor (R_{\rho\sigma\mu\nu}=g_{\rho\lambda} {R^{\lambda}}_{\sigma\mu\nu}):

    \[R_{\rho\sigma\mu\nu} = -R_{\sigma\rho\mu\nu}\]

(antisymmetric in first two indices)

    \[R_{\rho\sigma\mu\nu} = -R_{\rho\sigma\nu\mu}\]

(antisymmetric in last two indices)

    \[R_{\rho\sigma\mu\nu} = R_{\mu\nu\rho\sigma}\]

(invariant under interchange of the first and last pair of indices)

    \[R_{\rho\sigma\mu\nu} + R_{\rho\mu\nu\sigma} + R_{\rho\nu\sigma\mu} = 0\]

or

    \[R_{\rho[\sigma\mu\nu]} = 0\]

    \[R_{[\rho\sigma\mu\nu]} = 0\]

Properties of the Ricci tensor:

    \[R_{\mu\nu} = R_{\nu\mu}\]

Relation between R and T:

    \[R = -8 \pi T\]

Einstein tensor:

    \[G_{\mu\nu} = R_{\mu\nu} - \frac{1}{2} R g_{\mu\nu}\]

so Einstein field equation can be rewritten as:

    \[G_{\mu\nu} = 8 \pi T_{\mu\nu}\]

Geodesic equation:

    \[\frac{d^2 x^\mu}{{d\lambda}^2} + \Gamma^\mu_{\rho\sigma} \frac{d x^\rho}{d \lambda} \frac{d x^\sigma}{d \lambda} = 0\]

Covariant derivative:

    \[\nabla_\sigma V^\mu = \partial_\sigma V^\mu + {\Gamma_\sigma}^\mu_\lambda V^\lambda\]

    \[\nabla_\sigma W_\nu = \partial_\sigma W_\nu + {\Gamma_\sigma}^\lambda_\nu W_\lambda\]

    \[\nabla_\sigma {T^{\mu_1 \mu_2 \ldots \mu_k}}_{\nu_1 \nu_2 \ldots \nu_k} = \partial_\sigma {T^{\mu_1 \mu_2 \ldots \mu_k}}_{\nu_1 \nu_2 \ldots \nu_k}\\ ~~~~ + {\Gamma_\sigma}^{\mu_1}_{\lambda} {T^{\lambda \mu_2 \ldots \mu_k}}_{\nu_1 \nu_2 \ldots \nu_k} + {\Gamma_\sigma}^{\mu_2}_{\lambda} {T^{\mu_1 \lambda \ldots \mu_k}}_{\nu_1 \nu_2 \ldots \nu_k} + \ldots\\ ~~~~ - {\Gamma_\sigma}^{\lambda}_{\nu_1} {T^{\mu_1 \mu_2 \ldots \mu_k}}_{\lambda \nu_2 \ldots \nu_k} - {\Gamma_\sigma}^{\lambda}_{\nu_2} {T^{\mu_1 \mu_2 \ldots \mu_k}}_{\nu_1 \lambda \ldots \nu_k} - \ldots\]

Energy-momentum tensor:

    \[\nabla_\mu T^{\mu\nu}=0\]

从计算观点开始……(草稿)

  • 孤立物理体系

所谓孤立物理体系,是指这个体系完全不受其他体系影响,体系的可能状态由体系自身的物理规律所决定。假定为体系选择的一组状态参数的所有取值构成的集和为S,那么物理规律就限定了这个集和中那些状态是物理规律所允许的,相当于是对集和S的一个约束。可以记为:
K[s], s\in S
其中,K是一个判断,K[s]为真当且仅当状态s\in S是物理规律所允许的。
将所有这样的状态构成的集合记为K[S],显然有K[S]\subseteq S
如果我们的状态参数选取得非常好,参数空间中每一个参数都对应一个符合物理规律的状态,我们就全知了。可惜我们做不到,我们所选择的状态参数所构成的参数空间总是远大于物理规律所允许的状态集。退而求其次,我们希望找到一种等价关系,这种等价关系将状态空间划分为若干个等价类,所有物理规律允许可以共存的现象事件都仅仅属于其中一个等价类,而这个等价类也仅仅包含物理规律允许的现象事件。这样,我们只要找到了这个等价类中的一个代表状态,就可以确定整个等价类。这就是通过初值条件或者边界条件来求解物理体系的方法。

一个简单的例子:一个沿直线匀速运动的粒子,其状态由(x,t)标记,运动方程为x=v t+x_0,那么仅当(x,t)满足这个运动方程时,我们才认为由(x,t)所标记的状态才是物理规律所允许的状态。这个例子中所有物理规律所允许的状态的集和刚好构成了粒子的世界线。再举个一维经典标量场的例子:场A的状态由函数A(x,t)决定。仅当(A,x,t)满足场方程\frac{\partial^2 A}{{\partial t}^2}-\frac{\partial^2 A}{{\partial x}^2}=0和某个边界条件(例如初始条件A(x,0)=A_0(x))时,我们才认为A(x,t)是物理规律所允许的状态。

但上述模型对于物理学家来说只是运动学(Kinematic)模型,只有当你了解了宇宙状态的所有细节才能给出这个运动学方程,而这些细节恰恰是我们希望能够通过方程预言的。换言之这种抽象的运动学模型没什么用。物理学家希望的是:当我了解了宇宙局部的某些信息之后,我可以通过这些信息推算出另一些局部甚至全局的信息。这就要求我们建立所谓的动力学(Dynamical)模型。如果我们知道了宇宙的全部运动学信息,那么动力学模型总是可以导出的,但我们了解到的只是一些局部的信息。

以一维匀速直线运动为例,当我们知道了某个(x_0,t_0)是合法物理状态,那么从动力学方程\frac{dx}{dt}=v就可以推算出其他的合法物理状态,这个方程告诉我们,如果(x_0,t_0)是合法物理状态,那么(x+dx,t+dt)要满足什么条件才是合法的物理状态。也就是说,该动力学方程给出了(x_0,t_0)(x+dx,t+dt)必须满足的关系,积分后就可以得出(x_0,t_0)和任意(x_1,t_1)的关系。物理学的动力学视角写成数学方程就是:
D[S_0,S]=K[S],~where~S_0\subset K[S]
限定了S_0和K[S]必须满足的关系。显然,最平凡的情况是S_0=K[S],但物理学家希望从一组尽可能小的S_0出发,通过D能够得出整个K[S]。比方说匀速直线运动的例子中,从任何一个单独的(x_0,t_0)就可以得到所有合法的物理状态。而在上述的一维经典场论中,单独的一个(A,x,t)是得不出所有合法物理状态的,必须了解一组状态,比方说了解t为某个定值的时候所有x对应的A(初值问题),或者了解曲线f(x,t)=0上所有的A(边值问题),或者了解曲线f(x,t)=0上所有的\partial A/\partial t, \partial A/\partial x(边值问题)。

在经典绝对时空观之中,时间是一个非常特殊的状态参数,所有其他的状态参数都可以写成时间的函数,对于实数、复数、向量、张量等形式的物理量,都可以表达为时间的函数,对于许多物理问题而言,我们都可以根据初值来决定今后的演化:
D[K[S]|_{t=t_0}, S]=K[S]
这样一来,这就是所谓经典的机械决定论的视角。进一步,我们可以把这种方程写成关于时间的演化方程:
K[S]|_{t^+}=F[K[S]|_t]
如果模型中的时间是连续的,那么可以直接表达为微分方程,令s(t)=K[S]|_t
\partial s/\partial t=f(s,t)
在相对论之中,时间不再具有特殊地位,不同参考系也没有一个标准时间,但大家仍然希望能够在时间上做出预言,一个办法是给出物理量在某个完整的类空超曲面上的值,以至于所有的类时世界线都会与这个类空超曲面相交,就可以决定整个时空流形的物理量了。

另一方面,最初用来标记系统状态的状态参量可能具有若干对称性……(待续)

虽然真正的孤立体系要求完全不受外界影响,以至于这样的体系不能从外部通过相互作用来观测,但最初人们认为我们总是可以设法在技术上降低观测对体系的影响,使被观测的体系几乎跟孤立体系没有区别。但近代物理学让人们改变了这种想法,当我们对被观测体系的了解越来越精细,就不得不越来越多地与之相互作用。这种情况下我们需要的是一个相互作用的理论模型,而不是一个孤立体系的理论模型。……(待续)

量子力学实验中往往把宇宙划分为3个部分:被测系统S,观察者和仪器O,环境E。通常要求S只跟O相互作用,但不允许受到E干扰。量子力学的原理体系中扣掉测量原理,描述的就是一个孤立体系的演化。本来应该能够通过孤立体系的演化方程得出一个相互作用的方程,然后计算出观察者观察被测体系将会得到什么结果,但最初大家不知道怎样算,没人会求解整个宇宙的Schr?dinger方程。于是物理学家从实验中得到了一条经验规律:测量原理。遗憾的是测量原理被上升到了量子力学基本原理的地位,引发了Einstein和Bohr旷日持久的争论。到了近代人们逐渐发现测量原理在许多条件下是可以导出的,而且导出的结果比测量原理所给出的细节更多。

————(可逆性、对称性、熵增、可观察量、规范……)

————(引入动机的数学模型,然后是偏好的评价函数,心理,行为,经济,博弈,生态系统,社会……)

  • 开放的物理体系,相互作用

一个孤立体系可以被人为地通过边界划分为两个子系统,这两个子系统通过边界发生相互作用。每一个子系统的所有合法状态自然仍然由整个系统的运动学方程所谓一决定,但我们需要的是得到其中一个子系统的方程,这个方程只跟这个子系统的状态以及另一个子系统在边界上的状态有关……(待续)

  • 孤立机器

所谓孤立机器,就是指这样一种东西:其任意时刻的状态演化方式完全取决于该时刻的状态。
将孤立机器的状态记为S,时间记为t,后继(Successor)时间记为t^+(比方说在t连续的情况下,t^+:=t+dt,离散情况下t^+:=t+1),演化规律记为U,那么上述定义相应的数学模型为:
S(t^+) =U[S(t)]
经典力学中的Hamilton方程就是描述这种孤立机器的方程。在Hamilton力学中,体系的状态用所有粒子的位置和动量来标记,而Hamilton方程则决定了体系状态的演化机制。
(p,q)(t+dt) = (p,q)(t) + \left(-\frac{\partial H}{\partial q}, +\frac{\partial H}{\partial p}\right)dt
还有量子力学方程\left| \psi (t) \right\rangle = e^{-\mathrm{i}H t}\left| \psi (0) \right\rangle,此时U = e^{-\mathrm{i}H t}

  • 机器

所谓机器,就是指这样一种东西:

  1. 跟环境之间有一个分界线
  2. 环境在边界上的状态作为机器输入可以改变机器状态
  3. 机器在边界上的状态作为机器输出可以改变环境状态
  4. 任何时刻其行为和内部状态的变迁完全由该时刻的内部状态和环境输入唯一决定

如果环境也是一台机器,那么可以将环境的状态记为E,那么相应的数学模型为:
S(t^+) = U[S(t), \partial E(t)]
E(t^+) = U[E(t), \partial S(t)]

孤立机器是机器的特例,如果将环境和机器当作一个孤立整体,那么它又会变为一台孤立机器:
(S,E)(t^+) = (S(t^+),E(t^+)) = (U[S(t),\partial E(t)],U[E(t),\partial S(t)]) = U[(S,E)(t)]
如果把系统作为一个整体考虑,那么无论在机器和环境之间如何划界,对结果都是无影响的。

  • 离散的孤立机器

所谓离散的机器,就是上述孤立机器定义中,状态变迁是按步骤跳变的,具有可数内部状态。
对于这样的机器,我们可以用步骤编号i代替时间t,用i+1代替t^+。于是其数学模型为:
S_{i+1} =U[S_i]

  • 离散的机器

所谓离散的机器,就是上述机器定义中,状态变迁是按步骤跳变的,具有可数内部状态,对环境输入的分类能力也是可数的。
这样一台机器,其时间由步骤标记,记为i,于是:
环境从边界给机器的输入记为\partial E_i,机器从边界对环境的输出记为\partial S_i
S_{i+1} = U[S_i, \partial E_i]
E_{i+1} = U[E_i, \partial S_i]

  • 有限状态机器

如果离散的机器的状态数量是有限的,而且只能对环境输入做有限种分类,就叫做有限状态机器。但环境的状态可以是无限的,我们利用有限的时间和资源能够制造出这种机器。图灵机就是一种这样的机器。

  • 图灵机

图灵机是一台有限状态的机器,对于图灵机来说,其环境就是一条无限长的格子纸带(因此环境拥有无限种状态),这个纸带的每一个格子都存贮一个符号,符号的种类是有限的。每一个步骤中,图灵机停泊在纸带上一个特定的位置,可以从这个位置读取符号,然后根据自身状态和读取到的符号唯一地作出一个动作,动作包括向当前位置写入一个符号,然后向左或向右移动一个格子,将自身状态迁移到新的状态。

除此之外,图灵机有一个特殊状态:起始状态,作为每一次执行计算任务的过程的初始状态。还有一组状态作为结束状态,其中一部分被标志为接受,另一部分被标记为拒绝,表示计算任务执行的后果。

可以证明,凡是能够用有限状态机器完成的计算任务,用图灵机都可以完成。还有人进一步证明,通常的神经网络计算模型的计算能力完全等价于图灵机,所谓通常的神经网络计算模型是指这样的神经网络:每一个神经元仅仅有有限种(典型是两种)兴奋状态。

但物理系统经常不是有限状态机器,因此不能简单地说所有的物理系统都等价于图灵机。但是,如果一个由连续参数描述的物理系统,如果对于人类来说可以通过物理量来区分的状态是有限的(比如由于热噪声的存在导致的测量误差),那么这个物理系统对于人类来说计算能力就并不比一个有限状态机器更强。

Feynman路径积分实际上就是传统光学的Huygens-Fresnel原理

Feynman路径积分和Huygens-Fresnel原理都可以用Green’s Function和Fourier transform进行计算。

Next Page »