论π(N)的理论正确值,孪生素数有无穷多组。

更新时间:2023-04-19 06:55:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1 论π(N)的理论正确值,孪生素数有无穷多组,1974定理是伪科学。 作者简介:陈礼,四川资中人,1943年生,高级工程师。1962年考入北京航空学院飞机发动机设计专业,毕业后在国防军工系统工作30余年,现居住在北京。电话号码130********,电子信箱1660183949@c7809a29dd36a32d73758142 。我于2004年开始研究哥德巴赫猜想,2007年取得突破,2009年4月在中国农业科学技术出版社出版了专著“素数逐次排除论——用逐次排除法证明哥德巴赫猜想等一系列素数猜想”,此书现在在新华书店和当当网、卓越网上公开销售,欢迎大家关注着本书以及我这里的这篇文章。

第一节、前言

π(N)这个符号,表示在自然数[1,N]区间内实际存在的素数的总数量。

我们知道,要确定π(N),必须把[1,N]区间自然数中的复合数全部排除。我们设S m 是小于N 的最大素数,假定m 个素数2=S 1<…<S k <…<S m <N 已预先确定。 设π(N ,S m )为[1,N]区间不被前m 个素数整除的自然数(都是素数)的数量。 显然,有关系式 π(N)=π(N ,S m )+m 可能有人说,数学家研究π(N) 有很长历史了,素数定理的提出已经二百多年了,为什么今天还要研究π(N)的理论正确值呢?难道这个问题至今没有解决吗?

我认为,π(N)的理论正确值的问题至今没有解决,这个问题很有必要继续研究。 因为,素数定理研究的只是π(N)的估计值而不是π(N)的理论正确值。

我通过对剩余数系列分布规律的研究,已经得出了π(N)的理论正确值。

而且,更重要的是,通过对这个问题的讨论,我要向大家推荐一个研究素数问题的崭新方法——逐次排除法及剩余数理论,许多复杂的素数问题都可以迎刃而解。

作为逐次排除法的应用,我们很容易证明孪生素数和n 生素数组都有无穷多组。 我在学习中还发现Hensley 和Richards 的所谓1974定理是一个伪科学,故在此予以揭穿和批判,此谬论必须全世界共讨之,人人有责,欢迎大家参加讨论。

第二节、π(N)估计值的公式

我认为,迄今为止,数学前辈们对π(N)的主要研究成果是:

一、公元1792年,年仅15岁的天才数学家高斯先生通过艰苦探索,第一个认识到素数的分布率和自然对数的倒数成正比,这是人类对素数分布规律认识的重大突破。

1849年12月,高斯在给天文学家恩克的信中说道:“1792年或1793年……。我最初做的事情之一是把我的注意力集中在不断降低的素数分布率上,为此我计算了几个一千中的素数分布,并把结果记在所附的白页上。我很快发现,尽管有波动起伏,但这个分布率平均地接近于其对数的倒数……。但是,我最后在快做到一百万时放弃了。”(见《素数之恋》第51页)

据此,数学家得出了举世公认的素数定理:

π(N)~N

N N N lg 3026.2ln = (2-1) 必须指出,当年的小高斯先生研究的是某个连续一千个自然数中的素数的分布率,高斯先生信中黑体字说的对数应该是自然对数,显然,任何连续一千个自然数中素数的

2 分布率会随着自然数的增大而变小。例如,此一千个自然数如果在自然数50万附近时,则其中素数的分布率就应该接近于50万的自然对数的倒数,如果此一千个自然数在自然数100万附近时,素数的分布率就应该接近于100万的自然对数的倒数。

我们注意到,(2-1)式中[1,N]区间的π(N)值是按区间最大自然数N 处局部的素数分布率来计算的,而这个局部素数分布率应该是整个[1,N]区间里最小的,可见,按(2-1)式计算的π( N) 值肯定应该比实际值要偏小一些,实践也证明了这点。

所以,我认为,把(2-1)式作为π(N)的下偏差值可能是比较合理的。

由于(2-1)式的计算值都比实际值小,高斯先生还提出了一个对数积分式:

)(x π~?=x

u

du Lix 2ln )(+∞→x 。 (2-2) 我们用分部积分法,公式(2-2)可展开为下面的解析式:

)1()(ln 2)(ln ln 32-++++=n x x x x x x Lix !???

? ??++1)(ln )(ln n n x x O x x (2-3) 显然,公式(2-2)是对公式(2-1)的修正,它在理论推导上也很有道理。

实践证明,与实际值相比,公式(2-2)比较准确,公式(2-1)的误差比较大。 高斯先生是世界三大数学家之一,他无疑一定是聪明绝顶的人。但是,十五岁的少年高斯就能发现素数分布的规律,绝不仅仅在于他的聪明,还在于他的勤奋和从实践中求真知的正确的认识观。在同龄人可能还成天贪玩的时候,他居然能花那么大的力量,不断地在一千个、一千个自然数的范围内寻找素数的分布规律。要知道,那时并没有较大范围的素数表,每个较大素数的身份都必须由他亲自确定,这是何等艰苦的劳动啊!可是,现在有些数学家,可能只满足于公式的推导论证,至于得出的结论是否正确他们可能不大关心,有几个人能像当年的小高斯那样脚踏实地的真正下苦功夫啊!

二、1798年,数学家勒让德出版了一本名为《论数论》的书,书中他在自己所作的

某些素数计算的基础上猜想:)(x π~

B

x A x +ln ,其中数A 、B 待确定。在这本书以后的版本中,他把这个猜想改进为(他未能证明):)(x π~A x x -ln ,对于大的x 值,这里的A 趋向于某个接近1.08366的数。(见《素数之恋》一书52页~53页)。

必须指出,的确是勒让德先生第一个公开发表了对π(N )的研究成果。

当然,实际上高斯先生研究素数定理出成果的时间还更早一些,但是,高斯先生当时并没有公开发表其成果。

勒让德先生的这个公式也可认为是对公式(2-1)的修正,分母中减去A=1.08366,相当于用大约N/3的自然对数值进行计算,因为0986.13ln =。显然,勒让德公式的计算值要比公式(2-1)大一些,其对公式(2-1)的放大作用是1+B%:

A x x -ln ÷x x ln =A

x A A x x -+=-ln 1ln ln =1+B% 但是,当自然数很大时,其放大作用已经很不明显了,有关B 值见下表所示:

三、在黎曼猜想正确的前提下,黎曼先生的黎曼函数)()()(/11n n x Li n n x R ∑∞==μ给出)(x π的非常好的逼近,……(见《博大精深的素数》173页)。所谓黎曼函数,实际上是

3 黎曼先生1859年的著名研究成果公式的一部分,是该公式的第一项。因为:

)()(/11n n x Li n n ∑∞=μ=-)(x Li -)(212/1x Li -)(313/1x Li +)(515/1x Li +)(6

16/1x Li 所以,黎曼函数是对公式(2-2)的修正,由于在n =2、3、5时会产生较大的负项,所以,黎曼函数的计算值都应该比公式(2-2)小,有时甚至比π(x )的实际值还小。

四、关于公式(2-1)、(2-2)的误差范围:

1、俄罗斯著名数学家车比雪夫在1850年发表论文,用初等方法证明了:π(N)与N N ln 的差距上下不可能超过大约10%,即N N N N N ln 10555.1)(ln 92129.0<<π 。 (见 《博大精深的素数》170页和《素数之恋》123页)

2、1901年,瑞典数学家科赫证明,如果黎曼猜想(RH )成立,那么

)ln ()()(x x O x Li x +=π (2-4)

(见《素数之恋》237页)。

3、因为,目前人类已知的π(N )的确切值都大于

N

N ln 且都小于)(x Li ,所以,不少数学家认为π(N )的确切值应该介于这两者之间,即N N ln <π(N)<)(x Li ,我认为这个看法是错误的,因为,没有任何理由能证明)(x Li 是π(N)的理论上限值。

4、英国数学家李特尔伍德1914年的成果:)()(x x Li π-从正变为负,再从负变为正,如此反复无穷多次(见《素数之恋》236页)。李特尔伍德先生的学生们继续进行研究,最新的研究成果是:公元2000年数学家贝斯和赫德森证明了在1.39822×10316附近存在着一些李特尔伍德反例,在1.617×109608附近有一个巨大的反例带。

我非常佩服李特尔伍德先生和他的学生们,他们有自己的独立见解,不随波逐流。 这里,我们要问,公式(2-1)、(2-2)、勒让德先生的公式以及黎曼函数,它们是π(N)的理论正确值公式吗?非也,我认为这些公式都只是π(N)的估计值公式。

其理由如下:

1、有数学家早就这样说过。约翰.德比希尔先生的《素数之恋》第115页写道:“我的意思是,)(N Li 实际上是一个比N

N ln 更好的对π(N)的估计,一个好得多的估计。” 2、我认为,上面的所有这些公式,还包括下面我要提及的π(N)的确切值公式,都不是π(N)的理论正确值公式。我说确切值并不是理论正确值,这有点不好理解。理论正确值是指理论上应该怎样,例如打靶的靶心就是理论正确值。确切值只是实际值,实际值不是理论值,但人们常会把实际值当作理论值,这是不对的。例如,我们打靶时命中靶心是10环,你打了9环,这个9环离靶心很近,但你能说这个9环是理论正确值吗?当然不能。与此类似,π(N)的理论正确值还相当于设计图纸上标注的名义尺寸,

π(N)的确切值则是实际尺寸。例如,图纸的设计尺寸是10±1(这个公差有点大)

,我们加工了很多个零件,则实际尺寸应该分布在9到11这个广阔的范围内。我认为,素数数量对理论正确值的的变化率也很可能是±10%,相当于图纸的设计尺寸是10±1。由于条件的限制,人类至今只研究了极小自然数范围内的素数,相当于只拿到一个零件,它的实际尺寸可能是9.18,有人估计图纸的设计尺寸是9.2,这个9.2就是高斯对数积分

4 式公式(2-2)的计算值,虽然这个计算值现在看起来和实际值很接近,但是,我们只凭一个零件的实际尺寸就能认定图纸的设计尺寸一定是9.2吗?

第三节、黎曼先生对π(N)的研究成果

1859年8月,黎曼先生当选柏林科学院的通讯院士,他向科学院提交了一篇论文:“论小于一个给定值的素数的个数”,这篇论文是黎曼先生对π(N)的重要研究成果。

《素数之恋》一书详细介绍了黎曼先生成果的推导过程,现摘要叙述如下: 公元1737年,欧拉先生得出了“欧拉积公式”:

在S >1的条件下, 1)1()(---∏∑-==p

s n s p n

s ξ (3-1) 我们看到,公式(3-1)有S >1这个限定条件,在S <1时,)(s ξ函数应该是发散的。但是,经过若干次变换后,当S ≠1时,)(s ξ也可以是一个有条件收敛的级数。

设 +-+-+-=s

s s s s s 61514131211)(η (3-2) (3-2)式是一个收敛的级数,则,经过变换以后,我们可得到: ??? ??

-

÷=-1211)()(s s s ηξ (3-3) 数学家通过(3-2)、(3-3)式,把)(s ξ的定义域扩展到S <1的所有区域,你不得不佩服数学家的丰富想象力和超强逻辑推理能力,他们硬是把不可能变成可能。黎曼先生在1859年论文中还提出一个著名的猜想:ξ函数的所有非平凡零点的实部都是21,这样,黎曼先生又把ξ函数的定义域进一步扩展到复数范围。

黎曼猜想是怎样和π(N)联系起来呢?首先,我们把自然数N 扩展到实数范围。 设 ()()()() +++++=5

4351413121)()(x x x x x x J πππππ (3-4) (3-4)式成立的条件是:当2

76531017161513121

)()(x J x J x x J x J x J x J x π(3-5) (3-5)式可简化写为: ()n

n X J n n x ∑=)()(μπ (3-6) (3-6)式中的)(n μ是默比乌斯函数,(3-6)式只是(3-5)式的简化写法而已。

我们对(3-1)式两端取对数,得: ∑???

? ??--=p s p s 11ln )(ln ξ (3-7) (3-7)式要求S 必须是正数,即相当于)1ln(x --处在11<<-x 时的情况。再通

5 过变换,我们可得到下面的公式: dx x x J s s s ?∞

--=0

1)()(ln 1ξ (3-8) (3-8)式把)(x J 和)(s ξ联系在一起了,然后再通过十分复杂的变换,可得: ?∑∞-+-+=x

t t t dt x Li x Li x J ln )1(2ln )()()(2ρρ (3-9) 最后,再把(3-9)式代入(3-6)式中,我们得到(3-10)式: ???? ??-+-+=?∑∑∞∞=x n n

n t t t dt x Li x Li n n x ln )1(2ln )()()()(211ρρ

μπ (3-10) 公式(3-10)就是黎曼先生1859年重要的研究成果。公式的第1项是主项,就是所谓黎曼函数,如前所述,第1项的值肯定小于)(x Li 。公式第3、4两项的值都特别小,它们的影响可以忽略不计。公式的关键是第2项,其中的ρ叫根,就是黎曼猜想中的所有非平凡零点的根(复数根)。从前面,我们知道一定会有李特尔伍德反例出现,如果出现了李反例,则此时一定是第2项的累加值出现了巨大的正值。我看过用公式(3-10)计算自然数100万内的素数的数量,真正做到了结果不差一丝一毫,令人叹服叫绝。

综上,我认为,黎曼先生的公式(3-10)应该是一个计算π(N)确切值的精准公式。

第四节、π(N)确切值的计算公式

如前所述,上一节黎曼先生的计算公式(3-10)就是一个π(N)的确切值计算公式。 必须指出,所有π(N)确切值的计算公式都不是一个解析公式,而只是一个具体计算过程的描述,显然,靠它们来计算自然数无穷大时π(N)的确切值肯定是有问题的。

此外,数学家关于π(N)确切值的计算公式,还有以下成果:

一、1808年,又是勒让德先生第一个根据“埃氏筛法”证明了:

∑??

????+-=d N d N N )(1)()(μππ (见《博大精深的素数》第168页) (4-1) 说明:公式(4-1)中的d 过所有自然数,但其素因子的大小均不能超过N 。 公式(4-1)是完全正确的,式中的

∑??????d N d )(μ包括了一大堆繁琐的计算式如下:N ??????-++???

?????-????????+??????-∑∑∑≤<<≤≤<≤=m m m k j i k j i m j i j i m i i S S S N S S S N S S N S N 21111)1( (4-2) 注意:在公式(4-2)中按我的写法用S 表示素数,其中S m 是小于N 的最大素数。 公式(4-1)为什么正确?那是因为公式(4-2)是完全正确的,试说明之。

根据二项式定理,当某复合数n 含t 个素数因子时,n 在公式(4-2)中被减去和加

6 上的次数是:A =-1t C +2t C -3t C +…+t )1(-t t C +1-1=t )11(--1=-1

可见,任何一个复合数n ,不论它有多么复杂,它最终在公式(4-2)中,必须、也只能被减去一次。例如,当[1,N]区间某个复合数n 只含一个素因子时,如n =9,则9只在(N/3)中被减去一次;当n 含两个素因子时,如n =6,则6在(N/2)和(N/3)中各被减去一次,在(N/6)中又被加上一次,仍相当于只被减去一次。

所以,公式(4-2)的正确性不容置疑,并且,公式(4-2)的误差为0。

但是,公式(4-2)又的确是一个毫无实用价值的少、慢、差、费的公式。

因为,根据二项式定理,公式(4-2)计算工作的总量为2m -1次,当m 较大时,计算工作量实在太大了。例如,若要计算自然数N=109以内的素数数量,此时m=3401, 2m -1=23401-1>101023,工作量这样大,有谁还能计算出来?我计算过,以人类现在的计算机计算速度的水平,人类进行计算的总次数绝不可能超过10100次。

二、1871年数学家Meissel 先生提出了一个十分聪明的计算π(x )确切值的公式。

∑=+???

? ??---+++=s i i m p x s s s m m x x 112)1()1(),()(π?π (4-3) 式中,()m x =3/1π,()n x =π,s m n =-,),(m x ?表示在不超过x 的正整数中不被2,3,5,…,m p 整除的整数的个数。(见《博大精深的素数》第180页)

公式(4-3)是完全正确的。例如,计算π(1000),m =4,n =11,s =7,),(m x ?=228,此时公式(4-3)最后一项的累计值等于24+21+16+15+14+11+11=112。

则π(1000)=228+32+21-1-112=168。与π(1000)的实际值(确切值)完全一致。 公式(4-3)最后一项是计算由大于3/1x 的素数参加排除产生的排除数,转换为直接计算素数的数量,只要我们预先拥有()

3/2x π范围的素数表,则这部分计算非常简单。

但公式(4-3)最后一项有重复计算,应该予以补偿:重复计算部分是一个等差数列,第1项为m ,第s 项为1-+s m ,总的数量是2/)1(2/)1(-+=-++s s ms s m m s 。我们再加上第一项中应该补上的m ,这就是公式(4-3)的中间部分公式的来由。

公式(4-3)最困难的部分是计算),(m x ?,为了计算),(m x ?,还有一些辅助公式: 递归关系式: ???

? ??-??????--=1,)1,(),(m p x m x m x m ??? (4-4)

这个递归关系式非常重要,公式(4-3)的第一项就是这样一步步计算出来的。 除法性质:

若m m p p p p P 321=,m P r <<0,则 ),()(),(m r P a m r aP m m ???+=+ (4-5) 除法性质实际上是我下面说的剩余数的周期性,即每个周期的剩余数数量都相等。

7 对称性质:若m m P r P <<2

1,则 ),1()(),(m r P P m r m m ---=??? (4-6) 对称性质就是我下面说的剩余数的对称性,即每个周期内的剩余数都呈对称分布。 根据上面这些公式,Meissel 先生在1885年计算出109范围内的素数,误差只有56,造成误差的原因应该是公式(4-4)太难计算。他当时可能只有100万范围内的素数表,还能取得这样的成绩,他的辛苦程度和当年的少年高斯有一拼,他实在太不容易了。

Meissel 先生的公式(4-3)有个很大的缺陷,就是必须预先拥有()

3/2x π范围的素数表,所以,按照公式(4-3),还是无法计算特别大自然数范围内的素数的确切值。

后来,数学家对Meissel 先生的公式进行了证明和改进,并且继续用这种方法计算

π(N)的确切值,最新的成果是2000年后计算出π( 4×1022)=783964159847056303858。

我很佩服Meissel 先生,同时赞赏后来的数学家继续运用他的成果取得新的成就,但我不知道的是,Meissel 先生的公式(4-3)是否已经进入了中国数学家的法眼?

三、笔者得出的π(2N)的确切值计算公式。

在笔者2009年出版的《素数逐次排除论》一书第42页到45页谈到π(2N)确切值的计算公式。因为我研究的是[1,2N]范围内的素数,所以π(N) 在我书中均为π(2N)。

设S m 是小于N 2的最大素数,并假定素数2=S 1<…<S k <…<S m <N 2已预先确定。 设 π(2N ,S k )是[1,2N]区间内不被前K 个素数整除的整数的个数,P k 为逐次排除法中本轮素数S k 在[1,2N]区间内单独排除产生的排除数的个数。 又设W k =??????K S N 2,则P k =π(W k ,S k-1)???

? ????????=-1,2K K S S N π (4-7) π(2N ,S k )=π(2N ,S k-1)-P k =π(2N ,S k-1)???

? ????????--1,2K K S S N π (4-8) 显然,公式(4-8)和Meissel 先生的公式(4-4)是完全一致的,写法上稍有差别。 设π(2N, S m )是[1,2N]区间内不被前m 个素数整除的整数(实际上此时是素数)的个数,由于排除数有一个积累过程,故π(2N, S m )=2N ),(11-=∑-

i m i i S W π (4-9)

则π(2N)= π(2N, S m )+m=2N m S W i m i i

+--=∑),(11π (4-10)

我这个公式(4-10)和Meissel 先生的公式(4-3)是一致的,只是公式(4-3)分成两个部分来计算。同时,因为我认为1是素数,所以我的公式(4-10)中没有减去1。

我这里要说明,不是我有意去攀比Meissel 先生的公式,Meissel 先生是何许人也,我至今也不了解。2010年8月28日,我在海淀图书城九章数学书店购买了加拿大 P.里本伯姆先生著《博大精深的素数》一书,最近才发现Meissel 先生1871年的聪明公式和我的《素数逐次排除论》一书有关章节的公式基本一致。

看到我的方法和一百多年前的数学家的聪明方法基本一致,我心中当然非常高兴。 Meissel 先生的公式实际上也是使用逐次排除法。当然,很可能Meissel 先生当时只研究了计算π(x )确切值的公式这一个问题,没有用这种方法广泛研究别的数学问题,否则他还应该有更大的贡献了,若情况真是这样,那应该是非常遗憾的事。

当然,我用逐次排除法也计算出109范围内的素数的理论正确值,但是,确切值和

理论正确值有较大的误差,我当时也准备用公式(4-10)进行验算。但是,计算由小于2N立方根的素数产生的排除数(即公式(4-3)中的第一项)非常麻烦、很费时间,所以,我做了一些工作以后就停止了,和Meissel先生无法相比,我感到十分惭愧和内疚。

四、使用大容量计算机直接得到π(N)的确切值。

这个方法在我《素数逐次排除论》一书中已经叙述过,现在重述一下:

1、首先,按顺序输入不大于自然数N的所有自然数到某一个大容量的计算机中。

2、然后,每次的操作是从数列中减去用数列的第2项(并同时将第2项记录在册)乘以该数列的每一项后得出的新项(新项的最大值以不超过自然数N为限)。

3、计算工作进行到数列的第2项大于N的平方根时为止。

只要有足够容量的大型计算机,上面所说的制造素数表的工作是非常简单的。

第五节、计算[1,2N]区间素数数量的理论正确值πL (2N)

我们为了计算[1,2N]区间素数数量的理论正确值πL (2N),仍然假定所有参加排除的素数2=S1<…<S k<…<S m<N2已预先确定,其中S m是小于N2的最大素数。

在我的《素数逐次排除论》一书中详细介绍了π(2N)的理论正确值公式的形成过程。

大家肯定有疑问,既然那么多数学家计算素数数量的公式都不是π(2N)的理论正确值公式,你怎么又能够得出π(2N)的理论正确值公式呢?你说过π(2N)的理论正确值相当于设计图纸的理论正确尺寸,难道是上帝给了你这个神秘的设计图纸了吗?

上帝当然不会给我神秘的设计图纸,图纸是我自己设计的。实际上,我们每个人都是上帝,要拿到打开知识宝库的金钥匙,我们完全应该靠自己的努力奋斗。

我想说的是,数学家之所以没有得到设计图纸,完全不是因为他们不聪明、不努力,以高斯先生为代表的数学前辈们既聪明又勤奋。他们的主要问题可能是思路出了问题,他们考虑素数问题都没有跳出素数的范围,看问题的视角可能太小,眼界不够开阔。

我可能成功的秘诀是:把素数问题放到逐次排除法每轮排除形成的剩余数系列中来研究,因为,单个素数的系列和任何复杂的n生素数组的系列都和剩余数系列有关。

宋代大文豪苏轼著名的诗“题西林壁”也许能说明数学家们的问题所在:“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中。”

这首诗告诉我们,认识一个事物,我们应该尽可能地扩大自己的视野,才能看到事物的全局,才能认清事物的客观规律。否则,虽然我们可能的确也非常努力,但仍然可能会和瞎子摸象一样,由于认识的局限,只能得出以偏概全的不正确的片面结论。

一、什么是逐次排除法?什么是剩余数系列?

讨论这个问题前,我先说一个观点:我坚持认为1是素数,因为1符合素数的定义。

数论界现在把1排除在素数之外,主要是因为1破坏了自然数唯一分解定理。

所以,我也认为1是一个特殊素数,它是一个滥竽充数的素数,它不起任何作用,不参加自然数的因式分解,在逐次排除法中也不参加排除。

因此,我让特殊素数1的排序为0,即S0=1,表示它是一个不作为的素数,

所谓逐次排除法,指参加排除的素数严格按照顺序逐次进行排除的一种排除法。

必须指出,逐次排除法是我个人独创的研究素数问题的一种方法。当年Meissel先生应该使用过这种方法,但Meissel先生当时可能只用这个方法计算过素数的确切值。

逐次排除法必须遵守三个原则:

1、顺序排除原则:参加排除的素数,必须严格按照从小到大的顺序参加排除,从素数S1=2开始,到素数S m结束,顺序一个都不能乱。

2、最小素数原则:当某个复合数含有多个素数因子时,该复合数的被排除只计算在其中最小的素数因子账上,与其它任何较大的素数因子无关。

3、素数平方原则:任何一个参加排除的素数,从它的平方

8

9 起才开始真正排除复合数。这是最小素数原则的推论,因为,所有小于该素数平方的含该素数因子的复合数的被排除,均早已分别计算在其它较小的素数账上。

为了便于说明逐次排除法,我这里先引入同余、同余类和完全剩余系的概念。 什么叫同余?同余是整数的一个很重要的性质。

设0≠m ,若km b a =-,则称m 为模,a 同余于b 模m ,可写成)(mod m b a ≡。所谓a 同余于b 模m ,实际上就是a 、b 两个数除以m 后的余数相等的意思。

什么叫同余类?什么是完全剩余系?

同余类也叫剩余类,对于给定的模m ,某一个同余类是一种集合,即它们除以m 后的余数都相同。我们以m r m od 表示r 所属的模m 的同余类,则所有自然数按照对m 的同余关系可以划分成m 个同余类,其r 的值可以从0到m -1,我们称这些同余类的全体叫模m 的完全剩余系。必须指出,其中m 的0同余类就是m 的所有整数倍的集合。

我这里给大家介绍逐次排除法中的剩余数系列和排除数系列。

什么是逐次排除法中的剩余数系列π(n ,S k )(n 为自然数)呢?

剩余数系列π(n ,S k )是在逐次排除法中到素数S k 参加排除时排除后剩余的自然数系列,也可说它是自然数中不被前k 个素数整除的所有整数的集合,从同余的角度,剩余数系列π(n ,S k )就是自然数列模前k 个素数后产生的所有非0同余类的集合。

排除数系列,则特指在逐次排除法中被本轮素数S k 单独排除掉的自然数系列。 必须指出,素数S k 排除后产生的剩余数系列π(n ,S k ),就是在上轮素数S k-1排除产生的剩余数系列π(n ,S k-1)中,减去S k 乘以π(n ,S k-1) 各项的积以后形成的新系列。

因此,任何一个素数S k 参加排除时产生的剩余数系列和排除数系列都分别是有唯一确定数值的无穷系列,所以,在逐次排除法中决不会产生重复排除和重复计算。

二、逐次排除法的实际排除过程。

在逐次排除法中,素数2=S 1是第一个参加排除的素数。

根据素数平方原则,素数2在它的平方4以前是不起排除作用的,所以,无穷无尽的自然数列n 中小于4的1、2、3等3个自然数就应该是真正的素数系列。

素数2参加排除时,2排除的是2×自然数=2n (即偶数系列,包括素数2),此时产生的剩余数系列π(n ,2)就是奇数系列2n +1,即1、3、5、7、9、11、13、……。

显然,根据素数平方原则,此时奇数系列中小于S k+12=9的1、3、5、7等4个奇数也应该是真正的素数系列。

素数3参加排除时,排除数系列是3×π(n ,2)=3(2n +1)= 6n +3,就是3、9、15、

21、……。可见,素数3在连续3个奇数中必排除一个排除数、产生两个剩余数,此时产生的剩余数系列π(n ,3)是1、5、7、11、13、17、19、23、25、29、31、35、……。

此时,根据素数平方原则,此时剩余数系列π(n ,3)中小于S k+12=25的部分1、5、7、11、13、17、19、23等8个剩余数也都是真正的素数系列。

素数5参加排除时,排除数系列是5×π(n ,3),即5、25、35、55、65、……。 注意,为了便于素数5的排除,我们这里要将π(n ,3)拆分为公差为6,首数分别为1、5的两个等差数列剩余数子系列,我们将它们分别命名为1系列、5系列。

1系列:1、 7、13、19、25、31、37、43、49、55、61、67、73、79、85、91、……。 5系列:5、11、17、23、29、35、41、47、53、59、65、71、77、83、89、95、……。 这样处理以后,我们看到,素数5排除时,在1、5子系列中,在每连续5个剩余数中都必定分别产生一个排除数,这个结果和排除数系列5×π(n ,3)是完全相同的。

素数5排除后产生的剩余数系列π(n ,5)是:1、7、11、13、17、19、23、29、31、37、41、43、47、49、53、59、61、67、……,这当然也是一个无穷系列。

根据素数平方原则,在剩余数系列π(n,5)中,小于S k+12=49的1、7、11、13、17、19、23、29、31、37、41、43、47等13个剩余数也一定是真正的素数系列。

紧接着是素数7参加排除,此时产生的排除数系列应该是7×π(n,5),即7、49、77、91、119、133、161、203、217、……,这当然也是一个无穷系列。

素数7排除后产生的剩余数系列π(n,7)是:1、11、13、17、19、23、29、31、37、41、43、47、53、59、61、67、71、73、79、83、89、97、101、103、107、109、113、121、127、131、137、……。根据素数平方原则,这个剩余数系列中小于S k+12=121的1、11、13、17、19、23、……、109、113等27个剩余数也一定是真正的素数系列。

排除进行到这里,我要告诉大家素数分布的第一个规律是:

逐次排除法中,在任何一轮素数S k参加排除产生的无穷无尽的剩余数系列π(n,S k)中,其最前面小于S k+12的部分都一定是真正的素数系列。

可能有人问,难道素数的分布规律真这么简单吗?我的回答是,规律就是这么简单,这是我们从排除的实践中发现的规律,这一切完全是客观存在,没有任何主观臆断。

素数7排除时,我们同样可将剩余数系列π(n,5)拆分为公差为30、首数分别为1、7、11、13、17、19、23、29的8个等差数列剩余数子系列,我们将这8个子系列分别命名为1系列、7系列、11系列、13系列、17系列、19系列、23系列、29系列。

1系列:1、31、61、91、121、151、181、211、241、271、301、……。

7系列:7、37、67、97、127、157、187、217、247、277、307、……。

11系列:11、41、71、101、131、161、191、221、251、281、311、……。

………………

29系列:29、59、89、119、149、179、209、239、269、299、329、……。

显然,素数7排除时,在上面8个子系列的每个子系列中,任何连续7个剩余数中都必定产生一个含7的因子的复合数(其中当然包括素数7本身)。

在今后的任何一轮排除中产生复合数都将出现类似的规律:

素数S k排除时,在上轮素数S k-1排除产生的任何一个等差数列剩余数子系列(S yn =S y0+n T k-1)中,每连续S k个数中必定产生一个含S k因子的复合数。

在证明这个问题前,我们先引入任何素数S k参加排除时的排除周期T k这个概念。

周期值T k=S1S2…S k,T k在数值上等于逐次排除法进行到素数S k参加除时依次参加排除的各素数的乘积,例如T1=2,T2=6,T3=30,T4=210,T5=2310等。

则,在逐次排除法中,为了便于下轮素数S k排除,用素数S k-1排除时产生的某个剩余数S y0做首数形成的等差数列剩余数子系列可写为下面的公式:

S yn =S y0+n T k-1(5-1)显然,公式(5-1)这个等差数列的公差就是上轮排除的素数S k-1的排除周期T k-1。

我们还看到,因为T k-1=S1S2…S k-1,又因为S k>S k-1,所以,此时的T k-1中一定不包含素数S k的因子,即(T k-1,S k)=1,或称它们之间互素。

我们先看一下等差数列(5-1)的前S k+1项,即依次代入n=0、1、2、…、S k。当n=0时,S y0 =S y0;当n=S k时,S yn =S y0+ S k T k-1,从同余的角度,S k T k-1是S k的0同余类,加S k T k-1就相当于加一个0,所以,第0项和第S k项一定是模S k的同余类。同理,第1项和第S k+1项也一定是模S k的同余类。第2项和第S k+2项一定是模S k的同余类。……

我们还看到,在等差数列(5-1)的前S k项中,任何两项之间的距离都只能是nT k-1(n=0、1、2、…、S k―1),因为n<S k,(T k-1,S k)=1,则此时所有的nT k-1都肯定不是模S k的0同余类,这说明等差数列(5-1)前S k项中的任何两项都不可能是模S k的同余类。由此可见,不管同余类的排列情况可能有多复杂,等差数列(5-1)的前S k项模S k的同余类一定是各不相同的,则该等差数列连续的S k项一定是模S k的完全剩余系,

10

其中当然肯定包括了模S k的0同余类,即其中一定会有一项是含S k因子的复合数。

由此可见,在任何素数S k参加排除时,在上轮素数S k-1排除产生的任何一个剩余数子系列S yn =S y0+n T k-1中,每连续S k个数中必定产生一个含S k因子的复合数。

三、逐次排除法中产生的剩余数和排除数的特性:

逐次排除法产生的剩余数和排除数都有周期性,它们在一个周期内还有对称性。

剩余数和排除数的周期性是:1、在任何素数S k的一个排除周期T k内产生的剩余数和排除数都有确定的数量。2、这样的周期有无穷多个,每个周期都重复着同样的故事。

剩余数和排除数的对称性是:任何素数S k参加排除时,在其一个排除周期T k内,产生的所有剩余数或排除数均分别呈对称分布,其对称中心就是1/2周期点。

1、剩余数和排除数为什么有周期性?

我们设任何素数S k的第一个排除周期内(即[1,T k]区间)产生的所有剩余数和排除数的集合为A1,第n个周期内产生的所有剩余数和排除数的集合为A n,我们有关系式A n=A1+nT k=A1,即集合A n相当于集合A1整体搬迁一样。我们知道,T k=S1S2…S k,从同余的角度,nT k是素数S k的0同余类,加nT k相当于加一个0,所以,集合A n和集合A1模素数S k时的同余性质没有任何变化,虽然具体的数字变了,但是相应的内容一点没变,原来在剩余数位置的仍然是剩余数,原来在排除数位置的仍然是排除数,这就是逐次排除法中剩余数和排除数的周期性。例如,素数5排除时每个周期30内都将产生8个剩余数如1、7、11、13、17、19、23、29和31、37、41、43、47、49、53、59;

61、67、71、73、77、79、83、89;91、97、……等,直到无穷大时都应该这样分布。

2、为什么所有的剩余数或排除数在一个周期内都分别呈对称性的分布?

设P0是素数S k排除产生的某排除数,因为P0和T k都是模素数S k的0同余类,则P n= T k-P0也应该是模素数S k的0同余类,也应该是素数S k排除后产生的排除数。

设S0是素数S k排除后产生的某剩余数,从同余的角度,此时S0一定是素数S k的非0同余类,同时,(-S0)也应该是素数S k的非0同余类。但T k是素数S k的0同余类,加上T k相当于加一个0,所以,S n=(-S0)+T k =T k-S0也是应该素数S k的非0同余类,也应该是被素数S k排除后产生的剩余数,即S0和S n=T k-S0也呈对称分布。

由此可见,剩余数或排除数在一个周期内都分别呈对称分布,对称点就是半周期点。

例如,在素数5参加排除时,产生的1、7、13、19、11、17、23、29等8个剩余数和5、25这两个排除数,它们在周期内也都分别呈对称分布的,对称点就是15。

3、每轮素数S k排除时在一个排除周期内产生的剩余数的数量是多少?

我们知道,素数S k参加排除时,在上轮素数S k-1排除产生的每个剩余数子系列的每连续S k个数中一定产生一个排除数。所以,素数S k在一个排除周期T k内产生的排除数数量P k,应该等于上轮素数S k-1在一个排除周期T k-1内产生的剩余数的数量Y k-1;而素数S k在一个排除周期T k内产生的剩余数的数量Y k,则应该是Y k-1的(S k-1)倍。

11

12 的剩余数越来越少。例如,在[1,2310]区间内,素数11产生480个剩余数,但是,在同样范围内,素数2将产生1155个剩余数,素数3将产生770剩余数,素数5将产生616个剩余数,素数7将产生528个剩余数。所以,只有用剩余数系列π(n ,S k )在一个周期内的平均密度αk ,才能准确而科学地说明剩余数分布的稠密情况。

4、怎样计算剩余数系列π(n ,S k )在一个周期内的平均密度αk ?

方法非常简单,我们把素数S k 参加排除时在其一个排除周期内产生的剩余数的数量除以排除周期值T k ,经过简单的变化,就可得到αk 的计算公式(5-2):

αk =∏∏==???? ??-=???? ??-k i i k

i i i S S S 11111 (5-2)

根据公式(5-2),我们很容易计算出任何剩余数系列π(n ,S k )的平均密度αk 。

四、[1,2N]区间的素数数量的理论正确值πL (2N)的计算

前已说过,任何剩余数系列π(n ,S k )中小于S k+12的部分都一定是真正的素数系列,这个素数系列是这样排列的:1,S k+1,S k+2,S k+3,…… ,(S k 2),……,(S k+12)。

我们要计算的是一个预先确定的[1,2N]区间的素数数量的理论正确值,因为S m 是小于N 2的最大素数,所以,我们此时应该把前面说的任意的剩余数系列π(n ,S k )改写为特定的剩余数系列π(n ,S m ),当然,π(n ,S m )的平均密度应该是αm 。剩余数系列

π(n ,S m )中的素数数列是这样排列的:1,S m+1,S m+2,…… ,

(S m 2),……,(S m+12)。此时,自然数2N 应该满足S m 2<2N <S m+12这个条件,才能让2N 落在前面这个素数系列中的(S m 2)和(S m+12)之间的省略号“……”这一段中。

设πL (2N ,S m )是剩余数系列π(n ,S m )在[1,2N]区间内(S m 2<2N <S m+12)的剩余数(此时的这些剩余数都是货真价实的素数)数量的理论正确值,则:

πL (2N ,S m )=2N αm =2N ∏=???

? ??-

m i i S 111 (5-3) 设[1,2N]区间素数数量的理论正确值为πL (2N),则

πL (2N)=πL (2N ,S m )+m =2N ∏=???? ??-m

i i S 111+m (5-4) 公式(5-4)就是我们梦寐以求的[1,2N]区间素数数量理论正确值πL (2N)的计算式。 当然,公式(5-3)和(5-4)其实是一回事,两者只差了一个m 。

五、为什么公式(5-4)是正确的?

众所周知,看一个理论是否正确,有两个判断标准:一是看这个理论有没有道理,二是看这个理论是否符合实际。

我认为,根据剩余数系列π(n ,S m )的平均密度αm 得出的公式(5-4)很有道理。 第一,在逐次排除法中,任何素数S k 排除时产生的剩余数系列π(n ,S k )在其一个排除周期内的剩余数都有确定的数量,这些剩余数都有一个平均密度αk 。例如,素数5排除时在一个排除周期30范围内产生8个剩余数,素数7排除时在一个排除周期210范围内产生48个剩余数,这些剩余数个个都是看得见、摸得着的客观存在的东西。

第二、在任何素数S k 排除产生的剩余数系列π(n ,S k )中最前面的小于S k+12的部分一定是真正的素数系列,这也是实际存在的客观规律。例如,在素数7排除时产生的48个剩余数中,其中小于S k+12=121部分的27个剩余数都一定是真正的素数。

我断言,以上两点没有任何人能够否定它,所以,公式(5-4)是完全正确的。 当然,仅有以上两点还不够,我们还必须考虑剩余数系列π(n ,S k )分布的均匀性,

因为,如果剩余数的分布很不均匀,公式(5-4)也可能没有实用价值。

所以,我在这里要告诉大家,素数在自然数中分布的第二个规律是:

逐次排除法中,任何一轮素数S k参加排除时产生的剩余数系列π(n,S k)的分布都是大致均匀的。

那么,我们怎么理解前面这句话“大致均匀”这几个字的含义呢?

我认为,“大致均匀”这几个字有两个含义:

1、剩余数π(n,S k)系列在素数S k的一个排除周期内的分布是大致均匀的。

2、当S k2<2N<S k+12时,剩余数系列π(n,S k)在[1,2N]区间的全部剩余数(都是素数)的分布也是大致均匀的。

为什么我们这里规定必须S k2<2N<S k+12呢?

这是因为,只有在S k2<2N<S k+12这个条件下,我们才能按公式(5-4)使用剩余数系列π(n,S k)的平均密度αk来计算[1,2N]区间的剩余数(素数)的数量。

必须指出,任何剩余数系列π(n,S k)最前面的两个数都一定是1、S k+1,当素数S k+1非常大时,1和S k+1之间可能会产生特别巨大的间隔。例如,S k+1=1010000数量级甚至是无穷大时,这个间隔之大都是我们难以想象的。所以,如果我们单独计算剩余数系列π(n,S k)最前面1,S k+1附近这一段剩余数的密度,实际值可能会比平均密度小得多。

但是,我们考虑的是剩余数系列π(n,S k)最前面小于S k+12部分的整个素数系列,所以,我们不单独考虑该剩余数系列在S k+1附近这一段的分布情况。当然,这段大间隔的影响肯定是有的,但这个影响我们没有遗漏,它会反映在公式(5-4)的计算中。

六、剩余数系列π(n,S k)在素数S k的一个排除周期内的分布是大致均匀的

当素数2参加排除时,产生的剩余数系列(即奇数系列)的分布是完全均匀的,此时剩余数的平均密度是1/2,这时剩余数的均匀性没有任何问题。

素数3排除时,剩余数的平均密度是1/3,此时剩余数在一个周期内的分布请看下

—1/3。

素数5排除时,在一个排除周期30内产生8个剩余数,剩余数在一个周期内的平

性变化,但是,在半周期点15和周期结束时的点30,它们的偏差都一定为0。

素数7排除后,在一个排除周期(210)内产生了48个剩余数,我也实际计算过,在一个周期210的范围内每个自然数处的剩余数的绝对偏差值最大不到±2。

素数11接着参加排除。由于剩余数的周期性,在素数11的排除周期2310内,素数7共产生528个剩余数。因为素数S k排除,排除的是S k乘以π(n,S k-1) 各项的积,所以,素数11在排除周期2310内将排除11乘以上面48个剩余数的积。因为上面这48个剩余数的分布是大致均匀的,那么,这48个新的排除数在2310新周期内的分布也应该大致均匀,所以,此时在素数11的新周期内产生的剩余数的分布也应该大致均匀。

所以,今后的排除产生的剩余数,虽然在某些局部,可能分布得不很均匀甚至很不

13

均匀,但是,从整体上讲,从一个相对较大的范围来讲,其分布都应该是大致均匀的。

因此,我们有理由相信,在逐次排除法的任何一轮排除中产生的无穷无尽的剩余数系列都是大致均匀的,这是一个非常重要的结论,是整个逐次排除法的理论基础。

七、剩余数系列π(n,S k)的最前面的整个素数系列的分布是大致均匀的

我认为,剩余数系列π(n,S k)的最前面的整个素数系列是剩余数系列π(n,S k)中的比较长的一段,所以理应和整个剩余数系列具有相近的分布特性。

所以,我坚持认为,公式(5-3)或(5-4)就是[1,2N]区间的素数数量理论正确值πL (2N)的计算公式,正如我上面说的,公式(5-4)就相当于我们的设计图纸。

实践证明,公式(5-4)应该是一个基本准确的计算公式。

关于公式(5-3)和(5-4),以及它们和确切值的详细对比情况请见表2:表2:部分[1,2N]区间素数确切数量与理论计算值及其误差表

14

15 1、πL (2N ,S m )=2N αm ,πL (2N)= πL (2N ,S m ) + m = 2N αm + m 。

2、B=)2lg()2(2N N N L π,)

2lg(2)2(N B N N L =π,B 是一个与素数数量有关的系数。 3、C m =π(2N ,S m )-πL (2N ,S m ),C m 是πL (2N ,S m )的绝对误差值。

4、C xd = C m /2N αm ,C xd 是πL (2N ,S m )的相对误差(取%误差)值。

从表2中可见:

自然数小于120时,πL (2N ,S m )的误差是时正、时负、时为0,虽然绝对误差值很小,但相对误差值却比较大,在自然数10和13时出现了最大的负、正相对误差值。

素数3排除时,2N=10时,绝对误差-1/3,相对误差-10%;2N=16时,绝对误差仍然是-1/3,相对误差-6.25%。奇数11处的绝对误差+1/3,相对误差+9.09%;奇数13处的绝对误差+2/3,相对误差+15.384%,2N=12、18、24等个点的误差都为0。

素数5排除时,2N=28、36、40时,绝对误差均不到-1,但相对误差都是-6.25%。奇数31处的绝对误差只有+11/15,相对误差为+8.87%,2N=30时的误差也是0。

素数7排除时,此时的绝对误差最大不超过±2,相对误差也比较小,恕不详述。 当2N=103时,绝对误差C m 是+5.14,相对误差是+3.36%;2N=104时的误差最小,绝对误差仅+1.82,相对误差是+0.15%;2N=105时,绝对误差是-123.93,相对误差是-1.28%;2N=106时,绝对误差是-2634.26,相对误差是-3.25%;2N=107时,绝对误差是-31879.93,相对误差是-4.58%;2N=108时,绝对误差是-328231.89,相对误差是-5.39%;当2N=109时,绝对误差是-3325876.88,相对误差是-6.139%。

由此可见,到2N=109为止,πL (2N ,S m )的最大相对误差负值发生在素数3排除时2N=10的-10%,2N=109时,虽然绝对误差很大,但相对误差还不到-6.14%。

显然,公式(5-4)应该算是基本准确的,完全有资格作素数的理论正确值公式。

八、[1,2N]区间的素数数量理论正确值πL (2N)的对数表达式

在自然数2N 很大时,公式(5-4)将遇到无法克服的困难,因为那时我们可能根本无法确定参加[1,2N]区间排除的所有素数。例如,如果要计算2N=1010000时的素数数量,我们就必须预先知道自然数105000范围内的所有素数,以人类目前的能力看,这是根本不可能完成的任务,你能到什么地方去找这么大的素数表呢?

所以,为了计算特大[1,2N]区间的素数数量,我们必须将公式(5-3)进行简化,我们可以用与2N 有关的对数关系式来表示剩余数系列π(n ,S m )的平均密度αm :

αm =∏=???? ??-m

i i S 111≈)2lg(051.21N (5-5) 则, πL (2N ,S m )=2N αm ≈)

2lg(051.22N N (5-6) 同时,随着自然数2N 不断增大,参加[1,2N]区间排除的素数的数量m 在πL (2N)中所占比例将越来越小,所以,在2N 很大时,我们计算πL (2N)时可将m 忽略不计。

则, πL (2N)=πL (2N ,S m )+m ≈πL (2N ,S m )≈)

2lg(051.22N N (5-7) 显然,公式(5-7)就是[1,2N]区间的素数数量理论正确值πL (2N)的对数表达式。

九、公式(5-7)和素数定理的比较

我们知道,素数定理的表达式是公式(5-8):

16 πL (2N)≈ )2ln(2N N =)

2lg(3026.22N N (5-8) 显然,公式(5-7)和素数定理的公式(5-8)有较大的区别,公式(5-8)的计算 值大约是公式(5-7)计算值的89.07%,相当于是公式(5-7)的负公差值。 我们应该怎样评价公式(5-7)和公式(5-8)呢?

公式(5-8)是天才数学家高斯先生经过艰苦努力,分析很多素数实际分布情况后得出的,所以,公式(5-8)当然很有道理,特别是,确定了对数关系式是很了不起的。

但是,高斯先生当年研究的是若干1000范围内的素数分布率,结论是平均地接近于其对数的倒数,显然,随着自然数逐渐增大,小区间的素数分布律是逐渐减小的。

那么,我们计算[1,2N]区间的素数数量时,2N 附近的素数分布率肯定是全区间最小的,所以,以2N 的自然对数进行计算,这个计算值理应偏小。实践证明,在人类已知的自然数2N=4×1022的范围内,π(2N)的确切值都大于公式(5-8)的计算值。

因此,我认为,公式(5-8)应该是[1,2N]区间的素数数量的理论下限值。

当然,高斯先生后来提出对数积分式对公式(5-8)进行了修正,而且,修正后的效果是很明显的,在人类已知的自然数范围内都取得了非常好的成绩。

但是,在自然数无穷大时,高斯对数积分式和公式(5-8)早已合为一体,几乎没有差别,所以,我们计算特大[1,2N]区间的素数数量时不必考虑对数积分式。

公式(5-7)是根据公式(5- 4)得出的,我已说过,公式(5-4)是完全正确的,所 以公式(5-7)也是完全正确的。但公式(5-7)分母中的系数2.051可能需要修正,因为我计算的范围实在太小了,在更大的自然数范围,这个系数很可能发生变化。

我想,我们现在已经广泛使用计算机进行计算,只要我们编一个简单的程序,用我们人类现在已经掌握的素数进行计算,这个修正系数的工作将是很容易完成的。

那么, 公式(5-4)、(5-7)和公式(5-8)或对数积分式相比,谁更准确呢? 要严格进行这个比较有些困难,因为在不同位置可能会得出不同的结论。

前已说过,在自然数比较小时,公式(5-4)很准确。例如,在自然数15、21、30、 70、105时的误差都是0,此时绝对准确。在自然数10000时,公式(5-4)的误差也只有+1.82,几乎为0,公式(5-8)或高斯对数积分式此时都没有这样高的精确度。

所以,如果我们此时就进行比较的话,此时的冠军非公式(5-4)莫属。

但是,素数有无穷无尽的庞大系列,我们进行的是一个漫长的马拉松比赛,不是百 米飞人大战,我们决不能以小范围的胜利论英雄。必须指出,前面这句话既适用于我的公式(5-4),也同样适用于公式(5-8)或高斯先生的对数积分式。

高斯对数积分式误差的实际情况是:2N=108时,π(2N)的确切值对高斯对数积分式的绝对误差是-754,相对误差是-0.013%;2N=1010时,绝对误差是-3104,相对误差是-6.821×10-6;2N=1015时,绝对误差是-1052619,相对误差是-3.527×10-8;2N=1020时,绝对误差是-222744643,相对误差是-1.00298×10-10;2N=1022时,绝对误差是-1932355207,相对误差大约是-1.0426×10-11,相对误差几乎为0。

我们再看一下公式(5-7)在同一个区间的准确度。

2N=1010时,公式(5-7)的绝对误差是-32514529,相对误差是-6.6687%;2N=1015时,绝对误差是-2.6598989×1012,相对误差是-8.183%;2N=1022时,绝对误差大约是-2.0154×1019,相对误差大约是-9.0939%;2N= 4×1022时,π(2N)的确切值是783,964,159,847,056,303,858,此时的相对误差大约是-9.1446%。

实践证明,在人类目前已知的2N= 4×1022范围内,高斯对数积分式的相对误差的确有越来越小的趋势,而公式(5-7)在2N >109后的绝对误差和相对误差都有越来越

17 大的趋势。显然,此时高斯对数积分式的表现的确优于公式(5-7),但我们决不能根据这些情况就断定高斯对数积分式在自然数更大时的表现永远都优于公式(5-7)。

那么,当2N 趋于无穷大时,π(2N)究竟趋于公式(5-7),还是趋于公式(5-8)呢? 我们那时为什么不讨论对数积分式呢?我们知道,在自然数无穷大时,高斯对数积分式和公式(5-8)这两个公式早已合为一体,所以,我们那时只讨论公式(5-8)。

素数定理早已举世公认,而且,在人类目前已知的范围内高斯对数积分式的准确度很高,所以,数学家们都认为,在2N 趋于无穷大时,π(2N)应该趋于公式(5-8)。

但是,我坚定地认为,当2N 趋于无穷大时π(2N)的实际值应该趋于公式(5-7),因为,公式(5-7)是[1,2N]区间唯一正确的的素数数量理论正确值的对数表达式。

十、2N 趋于无穷大时π(2N)的实际值为什么会趋于公式(5-7)?

大家肯定会问,你这样说有什么依据?为什么π(2N)此时不会趋于公式(5-8)呢? 我知道有一句俗话叫“打那指那”,意思是:如果我们打靶时都以弹着点为靶心,那我们个个都是神枪手。我认为,高斯对数积分式虽然在一定的范围内比较准确,但它并没有真正反映素数的分布规律,很可能只是反映了实际的弹着点而已。

而且,相对于无穷大的自然数,人类目前认识的素数范围还是太小,高斯对数积分式现在的准确性很可能只是一个暂时现象,在自然数趋于无穷大时未必还非常准确。

前已说过,素数分布的规律是:逐次排除法任何一轮素数S k 排除时产生的无穷无尽的剩余数系列π(n ,S k )的最前面小于S k+12的部分一定是真正的素数系列。

所以,我们应该把素数问题扩大到整个剩余数系列π(n ,S k )的范围来研究,在逐次排除法中产生的剩余数系列π(n ,S k )应该是我们研究一切素数问题的基础。

因此,我们根据剩余数系列π(n ,S m ) 的平均密度αm 计算[1,2N]区间内的素数数量,理由很充分,我认为,任何人都无法否定公式(5-3)、(5-4)和公式(5-7)。

所以,我坚持认为,在2N 趋于无穷大时,[1,2N]区间内的素数数量一定会在公式(5-7)的计算值上下波动,正偏差和负偏差都可能出现,其变化范围见公式(5-9)。

我们知道,素数定理的公式(5-8)的计算值大约为公式(5-7)的89%,即大约是公式(5-7)的负11%相对误差。我们现在假定公式(5-8)是素数数量的理论下限值,并且假定公式(5-7)也可能有正11%的相对误差。

则,[1,2N]区间内的素数数量π(2N)的变化范围应该是公式(5-9): )2ln(2N N ≤π(2N)=)2lg(051.22N N ≤)

2lg(8477.12N N (5-9) 当然,你如果坚持认为2N 趋于无穷大时π(2N)应该趋于公式(5-8),那么,你就必须证明在2N 趋于无穷大时,公式(5-7)只能有恒定的-10%左右的相对误差值。

当然,还有一种可能性,那就是公式(5-7)的分母在2N 趋于无穷大时可能逐渐趋于2N 的自然对数,则公式(5-7)在2N 趋于无穷大时可能会与公式(5-8)变为一致。

我想,如果真是这样,最后实现了双剑合璧,那当然是一段美丽的佳话,是一件天大的好事。用计算机进行计算,观察公式(5-7)系数的变化,这点将很容易得到验证。

但是,如果没有这种双剑合璧的可能性,那么,在2N 趋于无穷大时,两个公式中就只有一个才是最正确的,我坚持认为这个最正确的公式只能是公式(5-7)。

当然,如果双方都无法从理论上否定对方,而人类又注定无法看到自然数无穷大时素数存在的真实情况。那么,我们不妨停止争论,让公式(5-7)和公式(5-8)长期共存,留待后人慢慢继续研究和鉴定,让它们都接受实践和历史的长期检验吧!

当然,我也为在2N >109后公式(5-7)的绝对误差和相对误差都有越来越大负值一事感到耿耿于怀,我原以为公式(5-7)的负误差现象是会很快就结束的。

18 可能有细心的读者已经看出问题来了,在剩余数系列的最前面的1和S k+1之间可能有一个比较大甚至特别大的间隔,你的公式(5-7)当然只能是负偏差了。

这种看法有些道理,但是,这个影响是微不足道的。例如,2N=109时,公式(5-4)绝对误差有负三百多万,而1和S k+1之间仅3401个素数,根本没法弥补,此时就是假定1和S k+1之间全部是素数都没用,只能增加31626个素数,同样于事无补。

我认为,在2N 趋于无穷大时公式(5-7)的相对误差一定会在±11%范围内波动出现。我还认为,公式(5-7)肯定不会永远都是负误差,从统计规律来看,既然剩余数系列的平均密度已经是一个客观存在,那么,正负误差都出现才应该是最正常的结果。

欢迎大家热烈讨论上面这些问题,我在此向全世界的数学家提出挑战。

我热情希望有数学家能否定我的理论,否定了一个错误的理论应该是一件好事。当然,如果数学家最后认同了我的理论,那更是一件大好事,我很可能给全世界的数学家提供了一个全新的思路——逐次排除法,这可能会给数论界带来一场深刻的革命。

我们知道,数学家一直都没有解决n 生素数组无限性的问题,我认为没有解决的主要原因是思路有问题。其实,所有的n 生素数组都隐藏在逐次排除法产生的剩余数系列中,所以,我们如果用逐次排除法来解决n 生素数组的问题,应该是很好的研究方法。

特别是,我们的数学家对孪生素数这个最简单的n 生素数组的无限性都束手无策,认为这个问题也是一个世界数学难题。其实,我们用逐次排除法证明孪生素数无限性猜想是非常简单的,因为,我们只是证明孪生素数的无限性,这时只需解决有无问题,并不需要一定得出一个十分精准的计算公式,这就把问题的难度大大降低了。

第六节、解除误差魔咒,打开新的思路

我前面说过,任何人都不可能否定公式(5-3),但是,数学前辈却早就把这个公式给否定了。而且,他们的分析方法真是匪夷所思、令人莫名其妙,大有讨论的必要。

我将详细叙述此事,我这里先把第五节的公式(5-3)、(5-4)重新写一下:

我们设[1,2N]区间的素数数量的确切值为π(2N),π(2N)的理论正确值为πL (2N)。设剩余数系列π(n ,S m )在[1,2N]区间内(S m 2<2N <S m+12)的剩余数(素数)的确切值是π(2N ,S m ),π(2N ,S m )的理论正确值为πL (2N ,S m )。

我们设剩余数系列π(n ,S m )在S m 的一个排除周期内的平均密度是αm ,则

αm =∏=???? ??-

m i i

S 111 πL (2N ,S m )=2N αm =2N ∏=???? ??

-m i i

S 111 (5-3) πL (2N)=πL (2N ,S m )+m =2N ∏=???? ??

-

m i i S 1

11+m =2N αm +m (5-4) 公式(5-3)和(5-4)的正确性,我在本文第五节已经从理论上进行了论证,并且有大量实际数据可作验证,应该说,说公式(5-3)、(5-4)基本正确是没有任何问题的。

实际上,公式(5-3)和(5-4)是一回事,下面我只以公式(5-3)为代表进行讨论。 其实,数学前辈早就知道公式(5-3),但数学前辈早就把公式(5-3)否定了。我不知道数学前辈否定公式(5-3)有多长的历史,我估计至少有一百年的历史。

一、数学前辈是如何否定公式(5-3)的?

总的来说,数学前辈认为公式(5-3)的误差可能是非常巨大的,而那样大的误差

19 是绝对不能容忍的。王元先生在《王元论哥德巴赫猜想》一书中第161页写道:“如果用θ+d n 代替??????d n ,则上式将导致误差项

O (2)π。所以,厄氏筛法几乎是无用的。” 必须指出,上面那些观点(也包括下面引用的一些观点)虽然出现在王元先生的书中,但那可能只是转载了以前的数学前辈们的观点,可能并不是王元先生的个人观点。

因为,王元先生在该书第73页《谈谈“筛法”》一文写道:“其实在这里所写的一些结果,有关的数论书籍中都有记载,作者只是加以整理与归纳 ,……”。

当然,我们在该书中也没有看到王元先生发表过有不同于数学前辈看法的观点。 数学前辈们对公式(5-3)的错误分析有一个认识三部曲的演变过程:1、2m 是不等式误差的上限。2、不等式中增加了等号。3、2m 就是公式(5-3)的误差。

1、第一部曲: 2m 是不等式误差上限。

在《王元论哥德巴赫猜想》一书第77页谈谈“筛法”文章中,王元先生写道: “不超过N 的正整数中不被前r 个素数整除的整数个数π(N ;r)为:

π(N ;r)=N -∑=??????r

i i p N 1+∑≤<≤????????r j i j i p p N 1-…+??????-r r p p N 1)1( (2)

由于大于P r 而又不超过N 的素数不能被前r 个素数整除,故得

π(N)≤r +π(N ;r) (3)

由于10,][<≤-=θθx x ,故由(2),(3)得

π(N)<r +N ∑∑∑∑≤<≤==≤<≤++++???

? ??-+-+-r j i r i r i r j i r r j i i p p p p p 11111)111(1)1(111 = N r p r r

i i ++???? ??-∏=2111。” 我们可将上式简写为: π(N)<N r p r r

i i ++???? ??-∏=2111 (6-1) 我们设公式(6-1)中的r = m ,即P m 是小于N 平方根的最大素数,则公式(6-1)此时可改写为公式(6-2):

π(N)<N ∏=???? ??-m

i i p 111+m + 2m (6-2) 前面已说过,剩余数系列π(n ,S m )在S m 的一个排除周期内的平均密度αm :

αm =∏=???? ??-

m i i S 111

所以,公式(6-2)还可改写为: π(N)<N αm +m + 2m (6-3) 与公式(5-4)πL (2N)= 2N αm +m 相比,公式(6-3)多了一个误差大尾巴2m 。 这个2m 有多大呢?当N=10000时,π(N)=1230,N αm =1203.173,m=25,此时,π(N)-(N αm +m )=1230-1228.173=1.82,说明此时公式(5-4)的误差几乎为0。可是,2m =225=33554432,此时公式(6-3)的大尾巴2m 已经超过三千万了。

20 当然,虽然公式(6-3)的尾巴2m 大得有些离奇,但出现在不等式中也说得过去。

2、第二部曲:不等式中增加了等号。

在潘承洞、潘承彪两位先生合著的《初等数论》第369页写道:

“设x ≥y ≥2,(,)x y Φ表示不超过x ,且其素因数都大于y 的所有正整数的个数,那么, 11p y x P ≤??- ???∏-()2y π≤1+(,)x y Φ≤11p y x P ≤??- ??

?∏+()2y π (28) 证明:……设∏≤=y p p y p )(,则1+(,)x y Φ=

∑??????)()(y P d d x d μ=∑)()(y P d d d x μ-

∑??????)()(y P d d x d μ=∏≤???? ??-y p p x 11-∑?

?????)()(y P d d x d μ (29) ……,由此及下式

()()d P y x d d μ??????∑ ≤ ()1d P y ∑=(())p y τ=()2y π (30)”

两位潘先生的文章引用完毕,因为文章比较长,这里特说明一下。

我们

设y =,()y π=m ,则()2y π=m 2,则公式(28)此时可改写为:

()m x p m x p p x x x p x 211,1211+???? ?

?-≤Φ+≤-???? ??-∏∏≤≤ (6-4) 显然,公式(6-4)的∏≤???? ?

?-x p p 11=αm ,就是剩余数系列π(n ,S m )在S m 的一个排

除周期内的平均密度,所以,公式(6-4)还可改写为:

2N αm -2m ≤1+),(x x Φ≤2N αm +2m (6-5)

必须指出,潘先生的公式(28)和王元先生的公式(6-1)有很大区别。公式(28)的符号“≤”包括等号,表示中间这个“1+),(x x Φ”真可能和两边的数据相等,这怎么能出现相等的情况呢?我认为,公式(28)中的等号是完全错误的。

3、第三部曲: 2m 就是公式(5-3)的误差。

下面请看王元先生的继续论述,当然,这些看法也可能是其他数学前辈的观点。 王元先生在《王元论哥德巴赫猜想》一书中第28页写道:“命π(x )表示≤x 的素 数个数及∏<=

∏n p p ,则1+π(n )-π(n )=∑∑≤∏n a a d d ),()(μ=∑∏

??????d d n d )(μ。 (26) 如果用d n +θ代替??????d n ,则(26)式中将产生误差项

O (2)π,与n 相比,这样大

的误差项致使埃拉朵斯染尼氏筛法几乎是无用的。”

21 设)(n π= m ,则)(2n π=2m ,王元先生这里说的误差项

O (2)π就是O (m 2)。 当然,误差项O (2m )的2m 的前面还可以有系数,但我认为至少应该大致相当吧! 由此可见,我上面说的大尾巴2m 这时已经正式演变成公式(26)的真正误差了,至少也是一个真正误差的重要参考值,但这个参考值也实在太大,太不靠谱了。

那么,数学家前辈对公式(26)误差的分析是正确的吗?

我认为,数学前辈对公式(26)误差的分析完全是错误的。

设剩余数系列π(n ,S m )在[1,2N]区间内(S m 2<2N <S m+12)的剩余数(素数)的确切值是π(2N ,S m ),则公式(26)的∑∏???

???d d n d )(μ相当于π(2N ,S m ),只是写法不同。 我们将n 变为2N ,上面“埃氏筛法”的公式(26)可展开为公式(6-6):

π(2N ,S m ) =2N -12m i i N S =??????∑+12i j i j m N S S ≤?≤??????∑-…+m )1(-122...m N S S S ??????

(6-6) 当然,公式(6-6)是一个绝对准确的计算公式,虽然非常繁琐,但是误差为0。 我们按[x ]=x -{x }的原则对公式(6-6)进行整理,可得出公式(6-7):

π(2N ,S m )=2N ???

? ??-+-+-∑∑=≤<≤m i m j i m m j i i S S S S S S 11211)1(111 +???? ?

???????--+??????????-??????∑∑=≤<≤m i m j i m m j i i S S S N S S N S N 11212)1(22 (6-7) 我们可将公式(6-7)中的前后部分分别简化为公式(6-8)和(6-9):

πL (2N,S m )=2N )11(1∏=-m i i S =2N ???

? ??-+-+-∑∑=≤<≤m i m j i m m j i i S S S S S S 11211)1(111 (6-8) C m = 12m i i N S =??????∑-12i j m i j N S S ≤?≤?????

?????∑+12i j k m i j k N S S S ≤??≤??????????∑-…-m )1(-122...m N S S S ??????

(6-9) 则,π(2N ,S m ) = 2N )11(1∏=-

m i i

S +C m =2N αm +C m =πL (2N ,S m ) +C m (6-10) 显然,公式(6-8)就是我前面得出的公式(5-3),也是公式(6-10)的主项。必须指出,公式(6-8)就是[1,2N]区间的剩余数(素数)确切值π(2N ,S m )的理论正确值。

公式(6-10)的C m 就是[1,2N]区间剩余数的确切值π(2N ,S m )对理论值πL (2N,S m )的偏差值。C m 为正,表示确切值大于理论值;C m 为负,表示确切值小于理论值

我们看到,C m 的展开式和公式(6-6)几乎一样,只是方括号变为大括号(这里大括号表示小于1的数),累加符号前面的正负号则刚好相反,当然还少了一个2N 项。

公式(6-9)偏差C m 展开式的总项数为2m -1,每一项都是一个小于1的小误差,其中正项比负项的数量少一项。按统计规律,正项误差和负项误差应该大致相互抵消,当然,这误差项一般是不可能完全抵消的,所以,一般都会产生一个不很大的偏差值。

本文来源:https://www.bwwdw.com/article/364q.html

Top