我对热力学第二定律的统计解释

(有待补充修改)

我们的观测手段往往没有办法了解被观察的系统所处的具体的微观状态,许许多多微观状态对于一种特定的观测手段而言是无差别的。例如,我们用一个温度计来观察某个系统的温度,如果温度的变化太小以至于完全无法影响温度计的读数,那么对于这种特定的观测手段而言,这两个只有微小差异的温度之间就是完全无法区分的。即便我们用一大堆各种各样的仪器去观察系统,只要系统的微观状态改变不足以让任何一个仪器读数发生改变,那么这些微观状态的变化对于这一组仪器而言就是不可区分的。

因此,我们可以定义一个叫做『宏观态』的概念:给定一组具体的物理仪器,当被测体系的两个微观态s0,s1完全无法被这组仪器的读数所区分的时候,我们称这两个微观状态属于(由这组仪器所确定的)同一宏观态M,对应同一宏观态M的所有不同微观态的集合记为S_M。由被测系统的仪器读数所确定的宏观态对系统的全体微观状态集S构成了一个等价类划分:S=\bigcup S_M。除极特殊的情况,仪器所确定的宏观态对微观状态的划分很难是均匀的,不同的宏观状态对应的微观状态数可能有很大差别。而对于每一个宏观状态,由于我们丢失了具体微观状态信息,那么其熵按照波尔兹曼熵的定义就是其微观状态数的对数。

说到由仪器读数所确定的宏观态,有人可能会有异议,因为仪器本身也是一个热力学系统,也具有不确定性。即便是同一个微观态,如果处于两个宏观态的交界附近,那么仪器的读数未必能完全确定。这并不是个严重的问题,我们可以谈论一个微观态对某个由仪器读数所确定的宏观态的『隶属度』。这个隶属度定义为该微观态使仪器刚好产生某个特定宏观态读数的概率。这样一来,仪器读数所确定的宏观态对微观态空间的划分的边界就模糊了,但即便如此,宏观态对微观态的划分一般也不会均匀,而这对于后面的讨论已经足够。这种情况下,属于某个宏观态的微观态的状态数就需要把所有微观态按照对这个宏观态的隶属度进行求和。

如果系统的初始状态是某个微观状态数很小的宏观态M0,那么在等几率假设之下,系统从该宏观态演化到某个微观状态数很大的宏观状态M1的概率总是远大于从M0到M0或从M1到M0的概率。假设一个宏观状态M所对应的微观状态数是N(M),熵S(M)=ln(N(M)),那么从M0出发,经过足够长的时间(时间必须足够长,使宏观状态演化过程的序列相关性无法被明显观察到),到达M1的概率与到达M2的概率的比值就应该是N(M1)/N(M2)=exp{S(M1)-S(M2)}。也就是说,如果两个宏观态的熵差异很大,那么从低熵状态演化到高熵状态的概率远大于相反的过程。

当然,等几率假设有可能是过强的一个假设。只要等能量面面积有限,那么Poincaré回归定理告(Poincaré recurrence theorem)诉我们只要经历足够长的时间,系统状态能任意接近初始状态。在这个意义上,可以将这些能够能够被任意接近的状态称为『可到达』的状态(注意,可到达未必代表真的可以在有限时间内到达,只是能够在有限时间内任意靠近的意思)。但系统的微观态未必总是能走遍整个等能量面,从某个特定的初始状态出发,可能只能遍历等能量面上的一个区域,其他区域永远走不到。因此这些互不连通但内部却联通的区域又构成了对等能量面的一个划分。而宏观态本身也是对状态空间的划分,顺便也就会划分等能量面上每一个连通区域。同样,除了特殊情况,仪器所决定的这种划分对等能量面某个连通区域的划分一般而言是不均匀的,根据前面的推理,系统从低熵宏观态演化到高熵宏观态的概率远大于相反的过程。不过这里的熵跟前面所说的熵有所不同,前面所说的熵是整个能量面上对应某宏观态的微观状态总数的对数,而这里的熵则是能量面上一个特定的连通区域对某该宏观态的微观状态数的对数。我们希望仪器读数所确定的宏观态对二者划分的微观态状态数基本成正比,这样系综理论就不会给出有问题的结论。如果连通区域形状极其复杂,向树根一样散布在能量面上,就可能可以满足上述要求。

我现在只能说,我们知道如何算并且算过的系统中,尚未遇到违反上述条件约束的情况。

这就是我对热力学第二定律的统计解释。

——————————————————

待补充内容:

Poincaré recurrence theorem细节:Note also that nothing prevents the system from returning to its starting point before all the phase volume is exhausted. A trivial example of this is the harmonic oscillator. Systems that do cover all available phase volume are called ergodic.

由于相空间的动力学相当于不可压缩流体,所以从任何一个大的宏观状态粗粒出发,大状态粗粒中能够到达某个小状态粗粒的微观状态数量至多跟小状态粗粒中的微观状态数相等,因此大状态粗粒中必然存在一些不能到达该小状态粗粒的微观状态,这些微观状态要么会回到大状态粗粒自身,要么进入其他状态粗粒。

Benford’s Law

Benford’s Law

我们平常所遇到的各种非零的数字之中(例如各种物理、数学常数),首位非零数字是1、2、3……9的概率都相同么?感觉上似乎如此,但实际上并不是这样,采用r进制时,首位数字为k(0<k<r)概率差不多是log_r(k+1) - log_r(k) = log_r \frac{k+1}{k}。这就是所谓Benford’s Law。

Wikipedia上有这个法则的若干种解释:

<Benford’s Law>

一个比较直观的解释是:当我们改换单位制时,首位数字的分布应该不变,这就是所谓scale invariance。如何分布才能保证这一点呢?由于我们考虑的是非零的数字,那么总可以将数字写成[1,10)的有效数字部分x乘以10的某个指数(科学计数法)。扔掉10的指数,对有效数字x取以10为底的对数,就得到[0,1)区间分布的一个数y=log_{10}x,假设y的分布密度函数为f(Y)。如果我们改变单位制,就相当于将x乘上一个常数c,如果乘积cx大于等于10,就得再次约化到[1,10)区间,这相当于把y循环右移了log_{10}c,分布函数f(Y)在这种循环右移的情况下应该保持不变,由于循环右移的偏移量是任意的,所以概率密度f(Y)必须是[0,1)上均匀分布的。有了这个分布,我们就可以估计首位数字是k的概率了。x的首位数字是k就要求x落在区间[k,k+1),也就是y落在[ log_{10}(k),log_{10}(k+1) ),不失一般性,用r进制代替10进制,首位数字是k的概率就是log_r(k+1) - log_r(k) = log_r \frac{k+1}{k}

转载,数学反例

千万不要迷信规律:大反例合集

wwwckq 发表于 2011-7-27 10:59:00

 

        数学猜想并不总是对的,错误的数学猜想不占少数。关键在于,有时反例太大,找出反例实在是太困难了。这篇日志收集了很多大反例的例子,里面提到的规律看上去非常诱人,要试到相当大的数时才会出现第一个反例。

千万不要迷信规律

      圆上有 n 个点,两两之间连线后,最多可以把整个圆分成多少块?

      

       上图显示的就是 n 分别为 2 3 4 的情况。可以看到,圆分别被划分成了 2 块、 4 块、 8 块。规律似乎非常明显:圆周上每多一个点,划分出来的区域数就会翻一倍。


事实上真的是这样吗?让我们看看当 n = 5 时的情况:

      

       果然不出所料,整个圆被分成了 16 块,区域数依旧满足 2n-1
的规律。此时,大家都会觉得证据已经充分,不必继续往下验证了吧。偏偏就在 n = 6 时,意外出现了:

      

      此时区域数只有 31 个。

最有名的素数生成公式

       1772 年,Euler 曾经发现,当 n 是正整数时, n2 + n + 41 似乎总是素数。事实上,n 1 一直取到 39,算出来的结果分别是:

43, 47, 53, 61, 71, 83, 97, 113, 131, 151, 173, 197, 223, 251, 281,
313, 347, 383, 421, 461, 503, 547, 593, 641, 691, 743, 797, 853,
911, 971, 1033, 1097, 1163, 1231, 1301, 1373, 1447, 1523, 1601

        这些数全都是素数。第一次例外发生在 n = 40 的时候,此时 402 + 40 + 41 = 402 + 40 + 40 + 1 = (40 + 1)(40 + 1) = 41 × 41

xn – 1 的因式分解

    x2 – 1 分解因式后等于 (x + 1)(x – 1) x20 – 1 分解因式后等于

(x – 1) (x + 1) (x2 + 1) (x4 – x3 + x2 – x + 1) (x4 + x3 + x2 + x + 1) (x8 – x6 + x4 – x2 + 1)

        对于所有的正整数 n xn – 1 因式分解后各项系数都只有可能是 1 或者 -1 吗?据说有人曾经算到了 x100 – 1 ,均没有发现反例,终于放心大胆地做出了这个猜想。悲剧的是,这个猜想是错误的,第一个反例出现在 n = 105 的情况, x105 – 1 分解出来等于

(x – 1) (x2 + x + 1) (x4 + x3 + x2 + x + 1) (x6 + x5 + x4 + x3 + x2 + x + 1)
(x8 – x7 + x5 – x4 + x3 – x + 1) (x12 – x11 + x9 – x8 + x6 – x4 + x3 – x + 1)
(x24 – x23 + x19 – x18 + x17 – x16 + x14 – x13 + x12 – x11 + x10 – x8 + x7 – x6 + x5 – x + 1)
(x48 + x47 + x46 – x43 – x422 x41 – x40 – x39 + x36 + x35 + x34 + x33 + x32 + x31 – x28
– x26 – x24 – x22 – x20 + x17 + x16 + x15 + x14 + x13 + x12 – x9 – x82 x7 – x6 – x5 + x2 + x + 1)

2 为底的伪素数

      下面是当 n 较小的时候, n 2n – 2 的值。

      

       似乎有这样的规律: n 能整除 2n – 2 ,当且仅当 n 是一个素数。如果真是这样的话,我们无疑有了一种超级高效的素数判定算法( 2n
可以用二分法速算,期间可以不断模 n )。国外数学界一直传有中国人 2000 多年前就发现了这一规律的说法,后来发现其实是对《九章算术》一书的错误翻译造成的。再后来人们发现,这个规律竟然是错误的。第一个反例是 n = 341,此时 341 能够整除 2341 – 2 ,但 341 = 11 × 31

       事实上,根据 Fermat 小定理,如果 p 是素数,那么 p 一定能整除 2n – 2。不过,它的逆定理却是不成立的,上面提到的 341 便是一例。我们把这种数叫做以 2 为底的伪素数。由于这种素数判定法的反例出人意料的少,我们完全可以用它来做一个概率型的素数判定算法。事实上,著名的
Miller-Rabin
素性测试算法就是用的这个原理。

Perrin 伪素数

       定义 f(n) = f(n – 2) + f(n – 3) ,其中 f(1) = 0 f(2) = 2 f(3) = 3 。这个数列叫做 Perrin 数列。

      

       似乎有这么一个规律: n 能整除 Perrin 数列的第 n f(n) ,当且仅当 n 是一个素数。如果这个规律成立的话,我们也将获得一个效率非常高的素数检验方法。根据
MathWorld
的描述,1899 Perrin 本人曾经做过试验,随后 Malo 1900 年, Escot 1901 年,以及 Jarden 1966 年都做过搜索,均未发现任何反例。直到 1982 年, Adams Shanks 才发现第一个反例 n = 271 441 ,它等于 521 × 521 ,却也能整除 f(271 441) 。下一个反例则发生在 n = 904 631 的时候,再下一个反例则是 n = 16 532 714 。这种反例被称为 Perrin 伪素数。

最经典的大反例

      说到大反例,这是我最喜欢举的例子。下面是大于 1 的正整数分解质因数后的结果:

2 = 2
3 = 3
4 = 2 × 2
5 = 5
6 = 2 × 3
7 = 7
8 = 2 × 2 × 2
9 = 3 × 3
10 = 2 × 5

       其中,46910 包含偶数个质因子,其余的数都包含奇数个质因子。你会发现,在上面的列表中一行一行地看下来,不管看到什么位置,包含奇数个质因子的数都要多一些。 1919 年,George Pólya 猜想,质因子个数为奇数的情况不会少于 50% 。也就是说,对于任意一个大于 1 的自然数 n ,从 2 n 的数中有奇数个质因子的数不少于有偶数个质因子的数。这便是著名的 Pólya 猜想。

        Pólya 猜想看上去非常合理——每个有偶数个质因子的数,必然都已经提前经历过了有奇数个质因子这一步。不过,这个猜想却一直未能得到一个严格的数学证明。到
1958 年,英国数学家 C. B. Haselgrove 发现, Pólya 猜想竟然是错误的。他证明了 Pólya 猜想存在反例,从而推翻了这个猜想。不过,Haselgrove 仅仅是证明了反例的存在性,并没有算出这个反例的具体值。Haselgrove 估计,这个反例至少也是一个 361 位数。

        1960 年,R. Sherman Lehman 给出了一个确凿的反例:n = 906 180 359。而 Pólya 猜想的最小反例则是到了 1980 年才发现的:n = 906 150 257

Fermat 大定理还能推广吗?

       Fermat 大定理说,当 n > 2 时,方程 xn + yn = zn
没有正整数解。 Euler 曾经猜想,当 n > k 时,方程 x1n + x2n + … + xkn = yn
都没有正整数解。 1986 年,Noam Elkies 给出了方程 x4 + y4 + z4 = w4
的一个正整数解,从而推翻了这个猜想。这个反例是:2 682 4404 + 15 365 6394 + 18 796 7604 = 20 615 6734

XX 型平方数

      11, 22, 33, 44, 55, 66, 77, 88, 99, 1010, 1111, 1212, … 都不是完全平方数。有没有什么数,把它连写两次后,正好是一个完全平方数呢?有。第一个这样的数是 13 223 140 496 ,把它连写两次将得到 1 322 314 049 613 223 140 496 ,是 36 363 636 364 的平方。第二个这样的数则是 20 661 157 025 ,它对应了 45 454 545 455 的平方。更多信息可见
http://oeis.org/A102567

总是相等吗?

      下面是 n 为正整数时, 2 / (21/n – 1) 取上整的结果与 2n / ln(2) 取下整的结果:

      

       这两者的结果总是相等吗?不是的。第一个反例是 n = 777 451 915 729 368,前者算出来的结果是 2 243 252 046 704 767 ,但后者是 2 243 252 046 704 766 。下一个反例则出现在 n = 140 894 092 055 857 794 的时候。更多信息可见
http://oeis.org/A129935

至今仍未找到的反例

       有没有什么猜想,明明已经被推翻了,所有人都知道存在反例,但因为反例实在是太大了,直到现在仍然没有找到呢?有。下面这张表展示了 n 取不同值时 pi(n) li(n) 的值,其中 pi(n) 表示不超过 n 的素数的个数,li(n) 则是对数积分0n dx/ln(x)

      

       pi(n) 是否永远小于 li(n) 呢?1914 年,Littlewood 证明了存在一个大数 n 使得 pi(n) ≥ li(n) ,不过却并没有给出一个具体的 n 值来。1955 年,Skewes 给出了这样的 n 值的一个上界:在 10^(10^(10^963)) 以内,必有一个满足 pi(n) ≥ li(n) n

      虽然数学家们正在不断地改进上界(目前的上界大约是 e727.9513
),但仍然无法找出一个具体的 n 来。原因很简单——这个反例实在是太大了。

主要来源:
http://redd.it/iikk4
http://www.guokr.com/article/9688/
http://mathoverflow.net/questions/15444

如果你对此感兴趣,不要错过数学史上的一篇经典论文:The Strong Law of Small Numbers

这篇日志今后将不断更新……

方舟子的信仰和价值偏见

(本文主要是从我的一些论坛帖子拼凑而成,一时懒得梳理所以结构会显得有些混乱。)
事先声明:跟方舟子的几乎所有论敌相比,方舟子兜售的价值观私货非常少。不要以为我这里指出了方舟子的一点点价值观私货,就表示我反对方舟子并且支持他的任何一个敌人,方舟子几乎所有的敌人兜售的价值观私货都比方舟子多太多了。反过来,前面这段声明也并不表示我支持方舟子。

方舟子:我的“偏执”你不懂

凤凰网资讯:你做事和做人,信奉的准则是什么?

方舟子:我喜欢跟人说,“脑中有科学,心中有道义”,做事情要有理性、科学的态度,同时要顾及到社会的正义,两方面都要顾及到。

凤凰网资讯:科学算是你的信仰吗?

方舟子:我不认为自己有信仰,你可以说我相信科学、道义,但科学与信仰又是矛盾的。所谓信仰是盲目的相信,即使有相反的证据也要去相信,而科学最讲证据、逻辑,所以我一直不讲什么信仰。

方舟子曾经说自己是强无神论者,而罗素是弱无神论者。事实上罗素是无信仰者,而方舟子是有信仰者。无信仰者不会是一个无神论者,他们会漠视抽象造物主是否存在这样的超经验问题,比无神论者对神的态度更加冷漠。强无神论者经常采纳的一条规则是:『如果没有证据支持某种对象的存在,那么该对象就不存在』,这实际上只是强行规定『不存在』等价于『没有证据支持其存在』。但『没有证据支持其存在』就是『没有证据支持其存在』,跟『不存在』并不是一个意思,非要改个名字叫做『不存在』,就得把原来的『不存在』换成另一个名字,除了搅乱概念制造歧义之外没有其他效果。

现在回到方舟子强调的科学与道义。科学方法并不是一个可相信的东西。讲证据和逻辑的情况下根本无需『相信』科学。如果所谓『相信科学』包含了超出『讲证据和逻辑』的含义,那么这部分超出的含义跟任何其他的信仰一样是信仰。另一方面,所谓的『道义』,就是价值观偏见。人人都有个人偏好,但如果把自己的偏好当作标准,认为『人人应该遵守』就是价值观忽悠。道义就是伪装成标准的个人偏好(参考:< 关于价值观>)。方舟子在学术打假的时候,曾经对学术造假者做过一些道德批判,正如我关于道德的分析所说的,道德批判是完全不讲理的忽悠。如果他能说清楚是什么原因导致某些人学术造假,而不是对这些人进行道德批判,就不是忽悠。请注意,我并不是说『不应该忽悠』,我只是在指出『某些行为实际上是忽悠』。不过这种忽悠在我看来相当情有可原,做道德批判的人几乎没有一个能意识到自己的这种行为是忽悠,更何况跟绝大多数人相比,方舟子并不是单纯的做道德批判,他的许多打假工作都是很讲证据的,道德批判只占极少的一部分。

只有『假设』才能被『相信』,而『讲逻辑讲证据』并不是个『假设』,没法被相信,否则就成了病句。我不会告诉你科学理论比宗教信仰『更优』,因为比较『更优』需要评价标准,而指定一个评价标准,你又面临着为什么这个标准比其他标准『优越』的问题(参考:< 关于价值观>)。

科学为什么要讲逻辑讲证据,并不是因为我们相信逻辑和证据。

1.逻辑这东西你没法相信。逻辑就是语言约定的精确化,之所以要精确化语言约定,就是为了消除歧义和自相矛盾。如果不消除歧义和自相矛盾,那么用语言表达出来的任何主张都等价于该主张的反面。如果你不喜欢逻辑,那么可以约定一套自己的语言。当然,为了避免你自己约定的语言从同样的条件出发会得出相互冲突的结论,你照样必须消除歧义和自相矛盾。只要你发明一种这样的语言约定,我们就可以用你发明的语言约定来讨论问题。当然,如果你发明的语言约定等价于现有的某种逻辑,你的发明也就多余了。

我根本不需要相信逻辑。如果我相信逻辑,而对方不相信逻辑,那么只要我使用逻辑论证,对方就可以质疑你凭什么认为使用逻辑的论证是有效的。而此时我除了告诉对方我相信逻辑(但对方显然不买账),我还有任何其他办法么?我对逻辑压根就谈不上相信,我跟别人辩论也从来不怕对方不讲逻辑,只要对方不讲逻辑,我就可以以其人之道还治其人之身,直接利用对方的前提否定对方的主张。你不相信逻辑当然可以,因为我都谈不上相信逻辑,但如果你还真的敢不讲逻辑,那么就别怕自扇耳光。

2.理论的有效性是科学理论的目标,并不是我们相信科学理论更有效,而是我们正在寻找更加有效的理论。这里要注意,并不是说我们『应该』去寻找更加有效的理论,这又是一个价值判断,这里说的是如果你想要追求更加有效的理论,那么你需要做什么。为了比较理论的有效性,就要通过证据,如果不讲证据,那么有效性就可以随便设定,任何一个理论都可以比另一个理论更有效或者更无效。所有诸如无神论、存在不依赖于意识的外部世界、自我的存在之类的假定,科学理论都完全不需要。

证据和有效性的关系,可以看我以前发的一些论坛帖子:http://www.fxkz.net/viewthread.php?tid=3041&page=4#pid48135

什么情况下实验构成对理论的『支持性证据』。

首先,一个实验结果构成对理论的支持,跟完全证实理论显然是两回事。只要实验不能完全覆盖理论,或者存在统计误差,那么实验就不能完全证实理论。经验科学的理论从来都无法被完全证实,但可以有支持性证据。

其次,实验结果要支持理论,必须满足两个条件:
1.实验跟理论相关。
2.实验结果跟理论断言一致(包括统计上一致)。

什么叫实验跟理论相关?就是要求实验必须是按照理论的约束条件进行设计的。如果没有这一条,那么世界上任何一个实验都可以作为世界上任何一个理论的证据或反例,因为理论的概念和关系可以任意映射到实验中的概念和关系中,总能找到某些映射方法让实验结果跟理论断言一致,也总能找到某些映射方法让实验结果跟理论断言相反。

但什么样的理论才能够允许实验设计符合其约束?当然要求理论必须给出其中概念和关系的可操作描述或定义,实验者才有可能根据这些描述或定义设计具体的实验操作(技术困难是另一个问题)。反之如果理论对其中的概念和关系压根不给出可操作的描述或定义,那么实验者就没办法根据理论的约束设计实验。就算有人做了实验,实验里面也涉及了某些跟理论中同名的概念,跟理论也未必有什么关系。

第二条无需解释。

只有上述两条都满足了,你才可以说实验构成了对理论的支持。

夏至宏的经典多体问题非碰撞奇点解简介

经典多体问题是指在牛顿力学和牛顿引力理论框架下研究多个具有固定质量的质点所构成系统的演化规律的问题。对于这样一个经典力学系统,是否只要给定初始条件(所有质点的位置和速度),就可以精确预测体系今后任意时刻的状态呢?并非如此,如果初始条件能够导致质点间的碰撞,碰撞之后系统的演化就无法用经典力学来回答,包含碰撞的解叫做碰撞奇点解。Poincare曾经考虑过这样一个问题:经典多体系统是否存在非碰撞的奇点解?但很久都没有人能回答。直到夏至宏给出了第一个例子。

这里要注意,所谓非碰撞奇点并非给定初始状态而不能确定轨迹(至少不是直观想象的那样),而是轨迹会在有限时间内发散,其中部分或全部质点的速度或动能也发散,这并不破坏能量守恒,因为经典引力质点系中,引力场中引力势能可以无限制地降低,刚好跟无限制地增加的动能相平衡。而且这些解必须要求引力是超距作用,没有相对论效应和量子效应,质点可以无限制地靠近,只要不是直接重叠就不会碰撞。

例如夏至宏的给出的解中,有一个测度为0的初始条件集合,只要初始条件在这个集合中,就可以确保系统的轨迹在有限时间内震荡发散,速度和动能也在有限时间内发散,当然,引力势能也会在有限时间内向负无穷大发散。

夏至宏的解中有五个质点,四个质点具有相同质量M1M2M3M4,另一个质点m质量很小(但并不能忽略)。假设有两个水平的平面,一上一下(这两个平面的位置并不是一成不变的)。M1M2在上面平面里面相互绕转,而且是椭圆轨道,距离时而远时而近,而M3M4在下面平面里面以类似的方式相互绕转。质点m在上下两个平面之间震荡。当m从下运动到上平面时,M1M2距离不是特别近,当m穿过上平面受到M1M2的吸引而再次回到上平面,M1M2刚好变得非常近,m刚好从中间穿过,这样就会把m向下加速射出,此时上M1M2被迫上升,上平面也就跟着上升了,而且M1M2绕转的距离更近周期更短了。接下来的过程就是m向下穿过下平面,此时M3M4并不太近,但是当m继续向下并且受到M3M4吸引转头回到下平面,M3M4也变得非常靠近,m从当中穿过,被加速向上射出,此时M3M4同时被迫向下,下平面也就下降了,而且M3M4绕转的距离也更近周期更短了。……

只要初始条件适当而精确地设定,可以让这个过程变得越来越快,上下平面越来越迅速地远离,m的速度也越来越快,而且m速度的增加比两个平面距离增加的速度还快,虽然两个平面距离越来越远,但m往返上下平面的时间间隔却也越来越短,与此同时,上平面的M1M2之间的距离变得越来越近,周期越来越短,下平面的M3M4也类似。最终的结果是,两平面在有限时间内跑到无穷远,5个质点的速度在有限时间内达到无穷大。

在某种意义上说,这种非碰撞奇点也算是在给定初始条件,在有限时间之后,就无法预测其轨迹了,但这种无法预测是因为发散的速度和位置。但这种解实际上仍然只是数学上有趣的解,要求引力超距作用,质点是完美的几何点,没有任何相对论和量子效应,在如此苛刻的条件下,初始状态还必须从一个0测度的集合中精心选择才行。甚至这个所谓的『非碰撞』,指的也就是在到达那个特定时刻之前才没有碰撞。在无限趋于那个时刻的时候,为了提供无穷大的动能,实际上M1M2之间和M3M4之间的距离纷纷趋于0。在我看来认为在该时刻发生了碰撞也未尝不可。稍微想一想就可以知道,经典引力场质点系中,想要让任何一个质点的动能达到无穷大,都必须至少有一对质点无限靠近,靠消耗无穷多的引力势能才能提供无穷大的动能。

参考文献:
http://www.ams.org/notices/199505/saari-2.pdf

连转带评:纽科姆悖论

有人在新繁星客栈上提到了这个悖论,并且点名叫我帮忙解答。我完全没觉得这个悖论有任何难度,但还是将这个悖论贴在我这里供大家娱乐消遣。
后面是我在新繁星客栈的答复,有所改动。

原文链接

一直没搞懂:纽科姆悖论
或者叫:“外星人悖论”

M:一天,一个由外层空间来的超级生物欧米加在地球着陆。

M:欧米加搞出一个设备来研究人的大脑。他可以十分准确地预言每一个人在二者择一时会选择哪一个。

M:欧米加用两个大箱子检验了很多人。箱子A是透明的,总是装着1千美元。箱子B不透明,它要么装着1百万美元,要么空着。

M:欧米加告诉每一个受试者。

欧米加:你有两种选择,一种是你拿走两个箱子,可以获得其中的东西。可是,当我预计你这样做时,我就让箱子B空着。你就只能得到1千美元。

欧米加:另一种选择是只拿一个箱子B。如果我预计你这样做时,我就放进箱子B中1百万美元。你能得到全部款子。

M:这个男人决定只拿箱子B。他的理由是——

男:我已看见欧米加尝试了几百次,每次他都预计对了。凡是拿两个箱子的人,只能得到l千美元。所以我只拿箱子B,就可变成一个百万富翁。

M:这个女孩决定要拿两个箱子,她的理由是——

女:欧米加已经做完了他的预言,并已离开。箱子不会再变了。如果是空的,它还是空的。如果它是有钱的,它还是有钱。所以我要拿两个箱子,就可以得到里面所有的钱。

M:你认为谁的决定最好?两种看法不可能都对。哪一种错了?它为何错了?这是一个新的悖论,而专家们还不知道如何解决它。

这个悖论是哲学家经常争论的很多预言悖论中最新的,也是最棘手的。它是物理学家威廉·纽科姆发明的,称为纽科姆悖论。哈佛大学的哲学家罗伯特·诺吉克首先发表并分析了这个悖论。他分析的依据主要是数学家称之为“博弈论”或“对策论”的法则。

男孩决定只拿B箱是很容易理解的。为了使女孩的论据明显起来,要记住欧米加已经走了。箱子里也许有钱,也许空着,这是不会再改变的。如果有钱,它仍然有钱;如果空着,它仍然空着。让我们思考一下这两种情况。

如果B中有钱,女孩只拿箱子B,她得到1百万美元。如果她两个箱子都要,就会得到1百万加1千元。

如果B箱空着,她只拿B箱,就什么也得不到。但如果她拿两个箱子,她就至少得到1千美元。

因此,每一种情况下,女孩拿两个箱子都多得1千元。

这条悖论,是试验一个人是否相信自由意志论的“石蕊试纸”类型的悖论。对这个悖论的反应公平地区分出,愿意拿两个箱子的是自由意志论信徒,愿意拿B箱者是决定论(宿命论)信徒。而另一些人则争辩道:不管未来是完全决定的,还是不是完全决定的,这个悖论所要求的条件却是矛盾的。

对这些争论观点的讨论可参见马丁·加德勒在1973年《科学美国人》7月号的数学游戏专栏,以及诺吉克教授发表在同一刊物1974年3月号同一专栏的文章。由于这一悖论还未解决,故它是学生讨论的极好课题。你将发现课堂里对这个悖论的反应是活跃的,十分有益的。

——————————————————————————————
我的解答:

这条悖论,是试验一个人是否相信自由意志论的“石蕊试纸”类型的悖论。对这个悖论的反应公平地区分出,愿意拿两个箱子的是自由意志论信徒,愿意拿B箱者是决定论(宿命论)信徒。而另一些人则争辩道:不管未来是完全决定的,还是不是完全决定的,这个悖论所要求的条件却是矛盾的。

这段评论,看了我后面的分析就可以知道全是一派胡言。我不懂什么叫自由意志论什么叫宿命论,我一个人就可以得出几种不同的答案。而且这个悖论的条件并不是自相矛盾的,而是问题的条件根本就不完备,以至于加入不同的约束条件就可以产生不同的答案。

先引入几种不同的先知(暂且不管其物理上是否能够存在):

第一类先知:精确地知道未来的一切,包括完全精确地知道自己未来的行为。这是个『只读』的先知,他有能力精确预知整个世界的未来,但却完全无法对世界施加任何一丝一毫的影响,甚至完全无法对自己的行为做一丝一毫的改变。这样的先知无法『选择』告诉别人未来会发生什么(当然,他可能预测到自己把未来告诉别人,于是他就只能按照自己的预测吧未来告诉别人。但问题是他还可能预测到自己将要告诉别人的信息是错的,但自己却对此无能为力)。这种先知甚至都不能对未来将要发生在自己身上的事情做任何提前准备,比方说预测到有人要在自己背后捅一刀于是很紧张,但他甚至无法让自己的呼吸或心跳加快,无法让每一个神经信号的传递有任何不同。这种先知很悲剧,他只是一个单纯的观察者,不能对世界施加任何影响,甚至无法『选择』让别人知道自己是个先知。

第二类先知:有能力预测未来,但预测完全准确的前提条件是自己也完全精确地按照自己先前的预测行事,但问题是他也可以在任何时刻选择在不精确按照自己先前的预测行事(比方说先前的预测中自己并没有把未来会发生什么告诉别人,但现在却选择告诉别人),那么就会导致未来不再与自己先前的预测精确相同,而且时间越久与先前的预测偏离可能就越大。事实上,他并不一定要吧未来告诉别人,就可以对未来造成影响,比方说由于知道了未来,他关于未来的知识发生了变化,于是脑袋里面某些神经电信号改变了,经过一系列连锁反应就会造成对未来的影响。当然,既然不考虑物理上的限制,你也可以进一步假定这个先知可以将对未来的预测信息存储在宇宙之外,这些知识的存储对我们的宇宙绝对不会造成一丝一毫的影响。或者,你可以反过来假定只要这个先知存储关于未来的知识就必然改变其大脑的物理状态以至于必然对世界造成影响。这样一开这第2类先知又可以分成两类,我们不妨称前者为2A后者为2B。

对于先知2A,在他决定完全按照自己的预测行为的时候,他之前对世界的预测就完全准确无需更新。一旦他选择不按照自己事先对自己行为的预测行事,那么从这个时刻起,世界的未来就不再符合其先前的预测,于是他此时就要立即更新自己关于未来的预测知识。于是每当他选择不按照自己先前对自己行为的预测行事,他对未来的预测就会立即更新。比方说先前预测自己并没有将世界的未来告诉别人,而某个时刻他突然决定告诉别人了,那么他对未来的预测就会立即更新。假设这个先知很要面子,不希望别人发现自己说出的话是错的,那么一旦他发现只要自己把预测告诉别人,自己所预测的事情在这个告知行为影响下就不会发生,那么他就会立即改为选择什么都不说,即便在不说的情况下自己对未来的预测本来是对的。什么时候他恰好发现只要自己将预测结果告诉别人,自己预测的事情就会成真,这种情况下它就会精确地按照自己对自己行为的预测行事,包括说出对未来的预测,于是预测成真。

对于先知2B,这个先知也很悲剧,他每一个时刻对未来的预测都会改变其头脑中的知识以至于改变头脑的物理状态,经过连锁反应影响一段时间以后的世界,使世界的未来跟其脑袋里面当前的知识不同,既然如此他此时此刻关于未来的知识立即就得更新,这是造成了一个自反馈回路,如果运气不好,这个先知就会成为一个真正的2B,脑子里看到的未来始终处于疯狂的甚至无限迅速的变化之中。但是,也有可能没有这么糟糕,自反馈回路有可能真的有自洽的不动点,也就是说,他脑袋的状态疯狂地变来变去之后,突然进入这样一个状态,这个状态中他脑袋里关于未来的只是刚好精确地与在他脑袋当前状态的影响之下实际上会发生的未来完全精确相同,一旦进入这种状态,他的脑袋里面就总是能够准确地看到未来,而且他脑袋状态随时间的演化也确保总是能跟其预测相同。但是一旦进入这种情况,2B先知就蜕化成了A类先知,他无法做出与自己预测不同的事情。

第三类先知:没能力精确预测整个世界的未来,却有能力任意按照自己的随意操纵整个世界,比方说他可以让任何人以为自己真的想做某件事而去做某件事,创造各种各样的神迹等等。当然,也可能有些话他没有能力使之变成现实,比方说这种自相矛盾的话:『我将会让自己在彻底失去操纵世界能力变成普通人之后仍然可以按照自己的意愿任意操纵世界』,这样的话他可以选择不说。

当然,你也可以编造出其他类型的先知,只要你有本事确保逻辑自洽就可以。

现在,我给感兴趣的同学留一道思考题:试把上述几种先知带入这个所谓纽科姆悖论之中,而且可以几种不同的方式来假设这个先知的动机,然后在每一种情况下分析这个悖论看看会得到什么样的结果。

道德

道德是这样一种东西:如果你违背其准则而被人发现,就很可能遭到来自他人的惩罚。

最初,你违背某条道德准则,往往会受到别人(例如父母师长)的惩罚。经过多次训练,你就得到了一条经验知识:违反该道德准则很容易受到惩罚。有了这条经验知识,你每一次试图违反该道德准则,就会担心是否会受罚,从而约束自己的行为。在这个过程中你也会发现在没人发现的情况下自己不会受到惩罚,从而形成侥幸心理,因此在无人监督的情况下人们更倾向于打破道德准则。

最初的自我约束来自于对行为可能后果的利害分析,但这种比较分析需要以花费精力为代价,如果你的生存环境总是使利害分析的代价超过无条件遵守该道德准则,你就会获得新的经验知识:花精力做这种利害分析往往得不偿失。于是你在试图通过利害分析决定是否遵守该道德准则之前,会面临一个新的决定:是否有必要做这个利害分析?而你的新经验告诉你:这样做往往得不偿失。此时你就会养成无条件遵守该道德准则的习惯,连判断是否有必要做利害分析的精力都省了。这种情况下可以说对于该道德准则你已经具备了强烈的道德习惯。

如果你已经习惯于无条件接受某道德的约束,那么你还可能给自己的这种选择寻找许多冠冕堂皇的理由,甚至可以利用这些理由要求别人遵守该道德,并从这种约束别人的活动中获益。这种情况下,可以说对于该道德你已经具备了强烈的道德感或责任感或使命感等等。因此,上述情况下道德感的形成是因为先前能从中获利,但形成之后未必将继续从中获利。

当然,逻辑上也允许这样的可能:人对某些道德的遵守直接来自于本能,根本不是从上述学习过程中获得的。如果你刚好很『运气』地天生就具有某种道德感,这种情况下你之所以遵守该道德仅仅是因为你的『运气』。如果你有该道德感是因为运气,按照日常语言的习惯,是很难说你比不具备这种运气的别人更『高尚』的,于是你就没有充分的借口对别人不遵守道德的行为进行批判。既然你是因为天生喜欢而遵守该道德,又如何才能批评别人因为天生不喜欢而违背该道德呢?

如果我们进一步追溯先天道德的来源,那么就进入了生物演化领域。要么你是因为发生了某种基因突变而喜欢某道德,要么是从先辈哪里遗传了该道德。如果该道德的遗传是物竞天择的结果,那是因为你先辈中那些因基因突变或混合而喜欢上遵守该道德的份子们幸运地在物竞天择过程中获得了更多生存繁衍的机会。于是这就又回到了前面说过的情况:道德感的形成是因为先前能从中获利,但形成之后未必将继续从中获利。无论哪种情况,道德批判都是找不到任何站得住脚的借口的。

道德批判实际上就是在说:我不喜欢你,因为我不喜欢你所以我不喜欢你,我要求别人跟我一起惩罚你,谁跟我一起惩罚你,我就喜欢谁,谁不跟我一起惩罚你,那么我连他一起不喜欢,并且要求别人一起惩罚他。换言之,道德批判从根儿上是不讲道理的,只是装作很有道理。

这里我要提醒大家注意:上述关于道德的讨论,丝毫没有『道德批判是不好的或错误的行为』的意思,我只是指出『道德批判根本不讲道理』这个事实。对于能够通过道德批判达成自己意愿的人而言,他当然可以认为『道德批判是好的』。另一方面,由于这个世界上存在我这种『见到别人不讲道理却假装很有道理就可能很喜欢指出』的怪癖分子,在许多情况下『道德批判』这种行为的期望收益就会有所降低,而风险却有所增加。

最后,来点趣味性强的:

电影『蝙蝠侠前传2:黑暗骑士』中有个桥段:片中大反派“小丑”在两艘满载的客船中做了个社会实验。他声称:两艘船上都有炸弹,任何人下船就同时引爆两艘船,每艘船上都有能引爆另一艘船上炸弹的遥控器。如果他在午夜12点之前看到有一艘船被引爆,就让另一艘船的人生还,否则就同时引爆两艘船。“死理性派”的文章『除了蝙蝠侠,我们还能用什么战胜小丑?』对此做了一个有趣的博弈论分析。文中考虑了道德约束,还考虑到因小丑并非万能而阴谋可能失败等可能。

如果这两船不都是人,一群是地球人,一群是异形,炸死对方而活着回到自己的社会丝毫都不会受到惩罚,双方还会因为道德感而拒绝按钮么?如果换成一群是人,一群是猩猩呢(假设我们成功地让猩猩理解了这个按钮的含义)?一群是白人,一群是黑人呢?一群911受害者,一群是基地组织呢?一群是中国人,一群是日本人呢?一群是你和你的亲人和孩子们,一群是陌生人呢?

关于价值观

一个人决定是否做一件事情取决于他对做这件事的效果的预期是否更符合他的愿望。而这个过程中有两个环节:预期做这件事的效果,判断该效果是否更符合自己的愿望。预期做一件事的效果,需要经验知识,而判断一个效果是否符合自己愿望,需要一个评价方法,也就是所谓的『个体偏好』。需要注意的是,人在这两个环节上都可能会犯错误,个人无效的经验知识会对结果做无效预期,而个人经历导致的种种偏见可能会蒙蔽对自己真实愿望的认识。

一个人的价值观就是他比较好坏或善恶程度的评价方法。价值观本来也是个体偏好,但往往特指个体偏好中关于希望别人怎么做的那部分。许多人认为好坏(或者善恶)是有客观标准的,因此他们认为基于这种客观标准的评价方法才能作为社会的道德标准。然而并非所有人都采纳了相同好坏标准,而到底采纳哪一种好坏标准,仍然取决于其个体偏好。这种情况下如果大家要决定是否实施某种政策,就要评价实施和不实施哪个更好。由于大家的评价方法不同,不同的人对哪个更好的判断就可能发生冲突。此时如果你试图证明某种评价方法比其他的评价方法更好,那么你就引入了一个新的评价方法:评价方法的评价方法。而对于这个评价方法的评价方法,仍然并非所有人都相同,于是就要引入更高级别的评价方法。无论你引入多少级别的评价方法,你最终的评价方法都照样是你个人的主观偏好,因此谈论一个至高无上的客观普适的价值评判标准压根就是自相矛盾的。

有些人知道这一点之后就会非常害怕,他们害怕没有一个天然的至高无上的所有人都只能接受无法拒绝的价值观作为终极的道德标准,害怕自己无法有效论证自己心目中那个更理想的社会真的更好,害怕如果大家都这样认为这个社会就会乱套陷入水深火热的状态。换言之,是对混乱的恐惧导致他们不敢接受上述事实,无论他们为了拒绝接受上述事实所寻找的理由是什么,上述事实都不会改变。事实上他们并不能证明没有这个至高无上的标准价值观,社会就会必然进入他们所担心的状态。事实上,正如前面所论证的,这种至高无上的终极标准价值观压根就无法存在,而这个社会和整个生物界在这种状况下照样自发出现了各种秩序并演化到今天的状态。就算今天的世界并不处于你理想中的最佳状态,也不是因为缺少那个终极标准,更不会因为那个终极标准消失了,这个世界就变得更差,因为这个终极标准压根就无法存在。

你可能会问,既然没有这样的标准,我们的政策应该怎么制定?这里首先澄清一个词汇:谈论『应该』还是『不应该』必须指明所追求的目标。只有已经给定了一个目标,我们才能讨论研究在这个目标之下,是否应该实施某个政策。也就是说,如果实施某政策的效果比不执行更能达成这个目标,那么在这个目标之下某政策就应该实施,否则再该目标之下就不应该实施。而预测实施某政策的效果比不执行是否更能达成某个目标,就是一个经验科学问题,需要通过科学方法来做出预测,如果现有的科学方法无法可靠预测,就没有必要先入为主地做出判定。暂不做出判定并不等于连尝试都不能做。尝试就是赌博,即便不确定后果有时也不妨试试运气。当然,到底玩多大要量力而行。尝试过了,无论失败与成功,都可以积累有关的经验知识以帮助今后的决策。但这里有一点要特别注意,某一次赌运气赌赢了,不一定是因为你的方法有效,赢了一次就断定自己的方法有效是欺骗自己。

接下来,就要讨论目标本身了。由于目标可以用来衡量一个政策的效果好坏,所以这个这个目标其实还是一个评价方法,用来评价比较不同的社会状态。但问题是谁来确定这个目标?前面不是说过不存在至高无上的终极目标么?的确如此,政策的目标也并不是终极目标,它可能符合某些人的意愿,却也可能同时违背另外一些人的意愿。只要一个人知道该目标符合其意愿,他就会赞同,反之就会反对。这样一来就出现了有冲突的派别,派别间就要进行博弈。博弈的结果可能是一方获胜而镇压了另一方的诉求,严重时会爆发战争(经验告诉我们这种事更容易在极权制度中发生),也可能是双方达成妥协,如愿以偿的一方自愿提供一些好处补贴意愿被违背的一方减弱甚至消除其反对的意愿,于是皆大欢喜(经验告诉我们这种事更容易在议会制度中发生)。

(不过即便是今天许多发达国家的议会民主制度,虽然相对于极权制度可以避免很多内部的暴力冲突,但政府往往还是会经常以谎言做出承诺,尤其是那些关于平等正义之类的承诺,并且政府为了维护这种谎言经常要使整个国家付出越来越巨大的代价。另一方面民众也往往因为信仰等各种偏见而支持违背其自身真实意愿或反对符合其自身真是意愿的政策。发达国家的诸多社会和经济问题中有很多都与那些普遍的价值观偏见有关。)

此外,正如前面说过的,个人决策的两个环节都可能出错:对效果做预期和评价预期效果,社会制度决策也同样如此。一个无效社会科学理论就可能对政策的后果做出严重偏离的预期,而理论却声称该预期是高度可靠的,于是在制度实施了之后才发现结果严重偏离预期。另一方面许多人自己没有能力判断一个政策目标是否符合自身的偏好,而且特别容易地被某些人忽悠,所以许多人都会选择追求与自己的偏好相悖的政策目标。如果你想要避免这种情况发生,那么就设法学会判断一个政策目标是否符合你自身的偏好,如果这对你太难,那就设法学会判断别人是否在忽悠你,如果这仍然太难,那就设法寻找跟你的偏好不冲突且比你更善于判断政策的人,然后听他的建议。如果前面这些你都做不到,就只好到我这里来看看我说了什么,但千万要小心别上了我的当,尽管我也会在这里写一些有助于避免上当的文字。当然,你还可以选择自己狗屁不通还刚愎自用,被别人骗去当冤大头还要谢谢人家。

判断一个政策是否符合自己的偏好,除了对政策的结果能够做有效的预期,还需要了解自己的偏好。许多人其实并不总是清楚地知道自己内心真的想要什么。比方说那些具有强烈的『责任感』、『使命感』的『伟大』的人们有许多『伟大』的追求,比方说全人类的幸福,最大多数人的幸福,最大程度的公平正义、拯救这个正在腐烂的世界等等,并且相信自己的此类个体偏好高于那些只想要自己过上舒服日子的人(请回顾本文开头关于价值观的讨论)。但所有这些『伟大』的个体偏好,都是可以追根溯源的,没有人天生就会追求这么抽象的目标,这些目标是通过学习或者思考得来的。换言之,这些目标都是为了实现其他的一些更基本的目标而思考出来的,而这些更基本的目标才是你真正试图追求的东西,这些『伟大而抽象』的目标只是为了实现那些更基本的目标的手段,我们不妨将这些抽象的目标叫做衍生目标。一个人本想追求目标A,但经过学习或思考发现实现目标B有助于实现A,于是他就可能暂时将A放下而将B作为一个衍生目标来追求。过了一段时间他可能自己都忘了自己是为了追求目标A才去追求目标B的,甚至有可能出现这样的情况:自己当时以为追求B有助于实现A但实际上自己的这个判断基于一个无效的理论,或者在当年的特定条件下追求B确实有助于实现A但时过境迁今天继续追求B反而会妨碍目标A。不妨将出现这种情况且当事人不自知的情况称为『迷失』。一个迷失了自己心中真实目标的人,就往往会为了那些衍生目标做出导致违背自己基本目标的事情,也就是违背了自己的真实意愿,俗称『事与愿违』。

关于如何确定自己的真实意愿并且避免迷失,这个话题可以展开,在这里先用比较简短的讨论做一个引导。想要避免迷失引起的严重事与愿违的后果,需要时而反省自己所追求的那些东西是为了达成什么目的,并且设法弄清楚这样做是否真的有助于达成这些目的,当自己所追求的衍生目标和自己更基本的目标发生悖离的时候,就要利用新的更有效的理论知识来调整衍生目标。到了这里有人可能会质疑,一个人完全可能会用新的更好目标替代老目标,从而不再追求老目标,因为新目标更『高尚』『伟大』。如果你是这样想的,那么请你进一步想想为什么你会认为新的目标比老的目标更好,这意味着你有一个位于新老目标之上的评价方法,而这个评价方法本身显然也提供了目标,而且显然具有更高的优先级,否则你无法用这个评价方法来决定新老目标哪个更好。如果你不断地追根溯源,就会到达本能需求的层次,例如食欲。如果你问自己追求食欲的满足是为了达成什么目标,你的回答只能是:我就是喜欢,吃饱了爽,饿着不爽。此时无法进一步回答求爽又是是为了达成自己的什么目标,求爽给你提供了最基本的目标。虽然对于你而言,没有比求爽更基本的目标,因此不能问求爽是为了达成什么目标,但可以问是什么样的原因导致你试图求爽,这是一个经验科学问题,而演化生物学、神经生理学、心理学等学科可以对这个问题做不同角度的研究。不过这里我们必须澄清一点:如果你只是想要了解自己的真实需求,那么你根本无需关心是什么样的原因导致你试图求爽,因为这个问题的答案只是给出了你试图求爽的原因,并不会给你求爽提供更深层次的目标。在佛教中有一句话大概是『心外求法求而不得』,大概表达了类似的意思。想要了解自己的内心,无需了解以外部世界为对象的那些经验科学知识。(注,此处我引用了佛教的话,完全不代表我对佛学理论的赞同。)

概念的含义

许多科学文化人都在做这种事情:试图通过调查研究弄清楚一个本来就没有『标准含义』的概念的标准含义。许多人,包括许多科研人员都以为,如果一个概念的含义不清楚,可以通过研究来弄清楚这个概念的『真正』或『本质』的含义,甚至进一步认为处于雏形中的科学都有这种特点:概念不清楚,只能通过研究来逐步澄清。

这才不是科学研究,而是强行规定,这种所谓的研究只是为了给自己所选择的那种规定寻找看似合理的借口。这就是罗尔斯在《正义论》中讨论公平和正义时所做的事情。自己强行规定什么叫公平正义当然可以,但问题是既然你是在强行规定,那么即便在这种规定之下你论证了为了实现这种公平正义需要每个人遵守什么样的规则,也丝毫没能论证别人就应该遵守你给出的这些规则,你只不过在强行规定别人应该遵守你对他们的要求。

这就好比我凭空创造一个概念名叫王六蛋(连英文翻译我都想好了:Basdart),我自己也不知道这个概念指什么,而我却试图通过调查研究来弄清楚这个王六蛋具体是什么意思。我当然可以给这个王六蛋找到越来越明确的意思,但这并不是通过科学研究来澄清王六蛋的意思,而是在强行规定王六蛋是什么意思。

仅当一个概念有明确的含义,只是由于某种原因你事先不知道或不清楚这种已经存在的明确含义,你才能通过科学研究来弄清楚其含义。比方说张三嘴里所说的正义你不知道具体指什么,这时候你可以通过科学方法研究清楚张三所说的正义有哪些具体的意思。如果一个概念大家的理解有许多不同,那么你就无法通过调查研究弄清楚大家各种不同的理解背后的那个『本质』的含义。但这些不同含义的交集还是并集你都可以谈,你也可以谈持某种理解的人数有多少,哪一种含义更贴近原始词源等等,但你不能因此就说经过科学研究判断出某种含义是正确的,你只能说明你的文字中采用了哪种含义,他的文字中采用了哪种含义。不同的理解就是不同的理解,对同一概念理解不同的人之间的交流需要做的是翻译,而不是强行规定谁理解比别人的理解更对。当然,如果你的理解跟大众语言习惯偏离太大,那么为了方便你可以学会大众主流的理解然后把自己的想法翻译成主流的含义跟大家交流,指望别人都学会你自己独创的语言在操作上往往是不现实的。

此外,概念的含义会随着语言演化,比方说一个原来就有的概念,后来由于科学研究,被科学理论中某个明确的新含义替代了,这并不意味着科学研究将原来的概念研究清楚了,仅仅意味着大家为了节省符号避免创造新词,借用了原来的老词,借用当然最好借用含义贴近的,这样才容易理解。例如鱼这个概念,在现代生物分类法出现之前许多人的理解就是水里游的,所以对他们而言鲸鱼鱿鱼章鱼鲍鱼甲鱼都是鱼。后来生物学借用了鱼这个词汇,专门用来代表主要生活在水中有鳃有鳍的脊椎动物,这丝毫都不意味着人么原来对鱼的理解是错的,仅仅意味着生物学借用了一个原来就有具体含义的名词并且赋予了与其原来的含义不同的新含义。因此,如果一个人说『鲸鱼』,并不意味着他理解错了,只是意味着他没有使用作为生物学术语的那个『鱼』,但如果他说“在生物学中鲸被分类为鱼”,那才是错的。

如果大家原来对某个词的含义有各自的理解,那么相互交流的时候就会遇到障碍。而在科学研究中使用科学术语最大的好处是设法消除了歧义。这里所谓的消除歧义决不是说一个概念的某个含义比其他含义更对,因此我们将其他的含义说成是错的。如果两概念含义真的不同,却经常需要同时放在一起说事儿,科研过程中就得制造不同的术语对它们加以区分,有时候对其中一个含义采用了原来的名字,而另一个含义采用了新名字。

公平正义良知就是这种有无穷多种含义的垃圾堆概念,谁都从垃圾堆里捡起来一坨认为这就是本质。公平正义良知这种东西谁都会说,只要有任何人说“我们要追求公平正义”我都他妈同意,虽然我从来就没同意过追求他所理解的那种公平正义。这种屁话最大的好处就在于:任何一个人听到这种屁话都会按照自己喜欢的方式赋予自己的含义,所以这种屁话可以引起所有人共鸣。就因为这种屁话的含义大家可以照自己喜欢的方式理解,就相当于一个带有自由变量而没有明确含义的判断“我们要追求伟大的X”一样,无论你想追求什么,你都可以把它带入X,从而让这句话引起你的共鸣,这就是为什么对公众做价值观忽悠能屡屡得逞的原因,大家居然真的以为赞同同一句没有明确含义的屁话的人全是一伙的。

说到这里我要提醒大家注意,我可没说『忽悠』是坏的,就算我不喜欢忽悠,我的评判标准也不是至高无上的。对于一个能够通过忽悠获取自己所需的人而言,忽悠显然是好的。由于我并不认为我的价值判断比一个忽悠分子的价值判断更正确,你可能就要问既然如此为什么我还要揭穿这种忽悠,我的回答是:我就是喜欢揭穿别人的忽悠。之所以我会喜欢这个,有许多原因,比方说我讨厌别人忽悠我,所以见到忽悠我的就想抽丫,比方说我还喜欢出风头,见到有人忽悠其他人我经常会想显摆一下自己的逻辑水平,而且只要我以为丫无法对我造成人身威胁,那么丫被越多人认为牛逼收拾丫我就会越开心,等等。所以我的动机丝毫都谈不上高尚伟大,当然对我而言高尚伟大之类的词跟公平正义一样,本身就是伪装成客观评价的个人主观偏好,所以对我而言你说你喜欢我比你说我高尚伟大受用的多,用后者夸我我就当你行骗。话说回来,别管我的动机在你看来多么恶劣,只要我说的话逻辑严密无懈可击,你就无法因为我动机不良而驳斥我所说出的事实。(本段参考:关于价值观

——————————————————————————————————
补记:感谢某个没看懂这篇文章的数学博士,在其糊涂言论的启发下,我需要再补充一些内容,帮助他和其他人理解。

我这里先澄清一个本文中的一个没有特别澄清的概念『明确』。因为他质疑『什么叫概念明确?明确到什么程度算明确?明确不明确是你定的?』。这是我的回答:明确到在推理过程中不会造成由同样的前提导出相互冲突的不同结论,就算是『明确』。明确不明确是不是我定的?当然不是,这是我在我的文章里面所使用的约定。如果你不同意我这样使用『明确』一词,那么没关系,你可以创造一个新词,比方说用『mingque』来代替我所使用的『明确』,我的整篇文章所表达的东西不受影响。请注意,我不是在要求任何人做任何调查研究必须先有明确的概念,而是论证『试图通过调查研究弄清楚一个本来就没有『标准含义』的概念的标准含义』是不可能的。

接下来我们讨论数学博士的质疑。

这位数学博士说:集合概念不恰恰在朴素集合论公理系统中有矛盾?在欧几里得的公理系统中不就缺少两千年来都没有明确的公理?数学家在概念不明确的时候照样用这个概念,做出了杰出成就,消除集合概念的不明确,不恰恰表明“概念不清楚,只能通过研究来逐步澄清”吗?

我文中的原话说得很清楚:『试图通过调查研究弄清楚一个本来就没有『标准含义』的概念的标准含义』才是不可能的,而且后面还说了『仅当一个概念有明确的含义,只是由于某种原因你事先不知道或不清楚这种已经存在的明确含义,你才能通过科学研究来弄清楚其含义。比方说张三嘴里所说的正义你不知道具体指什么,这时候你可以通过科学方法研究清楚张三所说的正义有哪些具体的意思』。

数学家并不能通过调查研究来弄清楚一个本来就没有『标准含义』的『集合』的概念的『标准含义』,而是将集合的若干种不同含义拆开,分别明确限定。你不能说NBG、ZFC、NFU等公理系统中的任何一个所严格限定的含义是『标准含义』,因为这样你就需要引入一个判断什么是『标准含义』的规则,但这个规则谁来定?这就又回到了我另一篇文章『关于价值观』中所说的那种情况,就算有个国际标准组织硬说某个含义是标准的别人也一样可以不同意而采用其他理解。

我们再来看看数学家们干了什么。数学家在最初使用集合的时候,人们所遇到的问题中对集合这个概念的使用是『朴素』的,那时候没有什么数学问题中需要使用过以自身为元素的集合,对集合的使用也都是很简单的。这种情况下朴素的集合中集合这个概念完全是足够明确的,因为这种情况下集合这个概念的含义根本不会导致相同前提导出不同结果。当时数学家只是默认随便什么东西都可以放在一块儿构成一个集合。那么集合自身跟其他的东西放在一块儿是否可以构成集合呢?不知道在很久以前有没有人考虑过这件事,但至少在罗素的时代之前我没听说过。

但在罗素提出罗素悖论前的一段时间,数学家们已经开始越来越深入地研究数学基础了,此时数学家们构造了各种各样稀奇古怪的数学结构和问题,其中有些情况允许集合作为自身的元素,或者无限制地要求对应任何一个属性的集合存在。到了这个时期,近代数学家们所使用的这个『集合』已经跟古代数学家对『集合』的理解不再完全相同了。在这个时期如果你再跟别人说集合,那么你所说的集合和别人听到的集合就未必是一个意思了。但大家最初不知道这些含义之间居然是相互矛盾的。此时罗素发现了其中的问题,如果对集合的这些新的含义不加限制,那么就可以利用集合论制造悖论,这就是著名的罗素悖论。之后数学家就把集合的这些不能相容的含义拆开,构造了若干集合论的公理系统,包括NBG、ZFC、NFU等等。在其中每一个集合论公理系统中,都对集合这个概念的性质做了严格的限定,比方说规定是否允许一个集合将自身作为元素。这些公理系统都可以排除罗素悖论。这难道能够算是『试图通过调查研究弄清楚一个本来就没有『标准含义』的概念的标准含义』么?相反,这是『概念有歧义,通过调查研究来区分这些不同的含义』。

谈到概念的歧义,还有一件事情要补充:苹果香蕉桔子等等都是水果,水果也同时代表这些食物的集合,但这是否意味着水果这个词是有歧义的呢?当然,日常语言中水果这个词确实可能有歧义,比方说有人认为西红柿就是水果,但有人认为西红柿不是水果。但这个歧义并不是因为水果这个词可以指代一类东西而不是仅仅指代一个东西。这样的名词叫集合名词,一个集合名词如果始终指代同一个集合,就没有歧义。那么什么是有歧义的名词呢?比方说电视,这个词有时候指代电视机(买台电视),有时候指代电视节目(看电视),这就是歧义。但这个歧义不是个严重问题,在上下文中很容易就看出它到底指什么,因此可以说在『买台电视』『看电视』这样的上下文中电视这个词是没有歧义的,如果你到了一个不熟悉的地方,有人突然说『好漂亮的猫!在电视上!』这时候你就未必能仅仅通过这句话判断出是电视节目里出现了猫还是电视机上趴着一只猫了,这时候歧义就真的出现了。就算是水果都是这样,你让别人帮你买点水果吃,但你不喜欢吃西红柿,你心中认为西红柿不是水果,而帮你买东西的人认为西红柿是水果,结果买了一堆西红柿,这也是歧义。但正如前面说过的,水果这个词并不是因为作为集合名词而有歧义,而是因为在你这里指代不包含西红柿的一个集合,而在买东西的人那里指代包含西红柿的另一个集合。