用神经网络分类无理数2**0.5和3**0.5

(2**0.5,3**0.5)—100*10*2—(1,0)(0,1)

 

用神经网络分类分类2**0.5和3**0.5,2**0.5和3**0.5分别取3万位有效数字。每10位有效数字构成一张图片,共3000张图片,用前2500张图片做训练集。分别用0-500张图片和2500-3000张图片做测试集。这个网络可以分类吗?

比如2**0.5的前10位是1414213562 ,因此2**0.5的第一张图片是

用神经网络分类无理数2**0.5和3**0.5

第一组实验,测试集用第0-500张图片

训练集

0-2500

               

测试集

0-500

               

f2[0]

f2[1]

迭代次数n

平均准确率p-ave

δ

耗时ms/次

耗时ms/199次

耗时 min/199

最大值p-max

pave标准差

0.500208775

0.500612997

19.88944724

0.500075377

0.5

5.311557789

1058

0.017633333

0.524

0.004409828

0.458393915

0.541479776

11921.1407

0.569829146

0.4

114.3165829

22759

0.379316667

0.608

0.01866044

0.536561847

0.463414981

58469.9397

0.575768844

0.3

540.0351759

107469

1.79115

0.609

0.013760947

0.641373382

0.3586357

137430.1256

0.587427136

0.2

1260.291457

250799

4.179983333

0.636

0.029747741

0.700065534

0.299933767

190242.3166

0.611005025

0.1

1743.798995

347029

5.783816667

0.702

0.033154655

0.655388848

0.344611155

304708.1256

0.706894472

0.01

2141.306533

426123

7.10205

0.778

0.028943958

0.597801611

0.402198331

419493.5226

0.752809045

0.001

3839.502513

764069

12.73448333

0.81

0.026849735

0.627921843

0.372078174

421886.6382

0.753135678

9.00E-04

3885.175879

773154

12.8859

0.83

0.026893736

0.577771528

0.42222847

435892.4573

0.755080402

8.00E-04

4005.758794

797148

13.2858

0.814

0.024913591

0.617932518

0.382067507

444884.1558

0.760276382

7.00E-04

4065.165829

808975

13.48291667

0.821

0.025859088

0.612938866

0.387061147

448786.8241

0.759336683

6.00E-04

4097.170854

815347

13.58911667

0.823

0.024982651

0.617976851

0.382023116

468389.2613

0.761291457

5.00E-04

4296.261307

854979

14.24965

0.838

0.025078079

0.607958549

0.392041445

486443.0201

0.765160804

4.00E-04

4431.01005

881780

14.69633333

0.818

0.024972835

0.597932415

0.402067594

517064.598

0.768653266

3.00E-04

4731.145729

941508

15.6918

0.834

0.026290709

0.577859644

0.422140373

557448.9598

0.77380402

2.00E-04

4808.115578

956823

15.94705

0.843

0.026010179

0.567826026

0.432173976

631946.3065

0.780150754

1.00E-04

5788.758794

1151975

19.19958333

0.856

0.02593919

分类准确率pave随着收敛标准δ减小逐渐增加,同时迭代次数不断变大。这表明2**0.5和3**0.5内在确实有各自独特的分布规律可以实现彼此分类。

 

再来看第二组实验,测试集用第2500-3000张图片

训练集

0-2500

                 

测试集

2500-3000

                 

f2[0]

f2[1]

迭代次数n

平均准确率p-ave

δ

耗时ms/次

耗时ms/199次

耗时 min/199

最大值p-max

pave标准差

 

0.499081714

0.50032913

19.33668342

0.500452261

0.5

5.251256281

1061

0.017683333

0.531

0.004262314

0.496189947

0.455413603

0.544673527

11770.69849

0.517994975

0.4

115.1407035

22913

0.381883333

0.543

0.007751477

0.510243497

0.575489125

0.424448363

57086.41709

0.519864322

0.3

550.0954774

109485

1.82475

0.536

0.004622067

0.515242255

0.58537217

0.41460736

135191.0503

0.513638191

0.2

1286.582915

256092

4.2682

0.54

0.011493487

0.502144704

0.737357587

0.262639926

188887.3668

0.512447236

0.1

1778.758794

353989

5.899816667

0.546

0.013333224

0.499114012

0.640575628

0.359424389

301379.1156

0.504768844

0.01

2832.894472

563746

9.395766667

0.545

0.014235875

0.490532969

0.532599738

0.467400264

421724.9246

0.506643216

0.001

3963.035176

788660

13.14433333

0.549

0.015386751

0.491256465

0.587785971

0.41221401

422781.603

0.504467337

9.00E-04

3973.914573

790825

13.18041667

0.542

0.014500656

0.48996668

0.577770729

0.422229271

430972.1859

0.504919598

8.00E-04

4054.994975

806946

13.4491

0.548

0.015553557

0.489366041

0.562732619

0.437267387

442785.7789

0.504733668

7.00E-04

3721.819095

740648

12.34413333

0.539

0.015461881

0.489271787

0.592857725

0.407142295

455381.5578

0.506145729

6.00E-04

4287.261307

853173

14.21955

0.545

0.014890686

0.491255043

0.597897619

0.402102375

467498.3266

0.506638191

5.00E-04

4420.688442

879731

14.66218333

0.554

0.015457179

0.491181012

0.582851283

0.41714874

488769.1357

0.507050251

4.00E-04

4587.477387

912924

15.2154

0.547

0.014668788

0.492381463

0.572821901

0.427178109

508326.191

0.504934673

3.00E-04

4765.98995

948448

15.80746667

0.558

0.014848337

0.490086336

0.532650198

0.467349782

564547.0955

0.506919598

2.00E-04

5328.80402

1060451

17.67418333

0.547

0.015604199

0.491315399

0.572850484

0.427149514

646090.0402

0.504577889

1.00E-04

6155.899497

1225026

20.4171

0.551

0.015242519

0.48933537

先将两次实验的迭代次数曲线画在一起

迭代次数n

迭代次数n

19.88944724

19.33668342

11921.1407

11770.69849

58469.9397

57086.41709

137430.1256

135191.0503

190242.3166

188887.3668

304708.1256

301379.1156

419493.5226

421724.9246

421886.6382

422781.603

435892.4573

430972.1859

444884.1558

442785.7789

448786.8241

455381.5578

468389.2613

467498.3266

486443.0201

488769.1357

517064.598

508326.191

557448.9598

564547.0955

631946.3065

646090.0402

 

用神经网络分类无理数2**0.5和3**0.5

 

可以看到这两条曲线是高度重合的,表明实验数据稳定性是由保证的。

 

再比较第二次实验的平均准确率p-ave

用神经网络分类无理数2**0.5和3**0.5

这个图特征非常明显,随着收敛标准的减小,分类准确率稳定的趋近于50%。也就是2500-3000数据集是不可分的。

 

这个实验有很多启发,可以根据这个实验猜测神经网络分类的这种技术有用的前提是训练集和测试集只能是有理集,也就是大数据这种技术不能用于去预测一个无理数集合的趋势。比如无论知道2**0.5多少有效位,也不可能根据已知的数据预测2**0.5的下一位到底是什么。

 

因此可以合理猜测两个有理集之所以可以被区分是因为两个对象有有限长的循环节,而循环节的交叉程度决定了两个对象分类的难易程度。交叉程度越大越相似,越难以分类。

 

不能用前2500张图片的分布规律去预测第2501张图片的分布规律。 但就整体上这2501张图片对应的数字都是x**2=2的解,表明尽管局部是无规律的,但不明表明整体上是非因果的。这种现象和电子的运动规律很像,比如知道电子现在的位置也不能用于预测电子下一秒的位置。因此为什么不能假设电子的运动符合某个无理数的运行规律?这样电子运动的随机性和因果性就同时得到了满足。

 

2**0.5和3**0.5的数据来源

https://www.wolframalpha.com/input/?i=x%5E2-1

N[sqr(3),10000]