用神经网络分类无理数2**0.5和3**0.5
(2**0.5,3**0.5)—100*10*2—(1,0)(0,1)
用神经网络分类分类2**0.5和3**0.5,2**0.5和3**0.5分别取3万位有效数字。每10位有效数字构成一张图片,共3000张图片,用前2500张图片做训练集。分别用0-500张图片和2500-3000张图片做测试集。这个网络可以分类吗?
比如2**0.5的前10位是1414213562 ,因此2**0.5的第一张图片是
第一组实验,测试集用第0-500张图片
训练集 |
0-2500 |
||||||||
测试集 |
0-500 |
||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大值p-max |
pave标准差 |
0.500208775 |
0.500612997 |
19.88944724 |
0.500075377 |
0.5 |
5.311557789 |
1058 |
0.017633333 |
0.524 |
0.004409828 |
0.458393915 |
0.541479776 |
11921.1407 |
0.569829146 |
0.4 |
114.3165829 |
22759 |
0.379316667 |
0.608 |
0.01866044 |
0.536561847 |
0.463414981 |
58469.9397 |
0.575768844 |
0.3 |
540.0351759 |
107469 |
1.79115 |
0.609 |
0.013760947 |
0.641373382 |
0.3586357 |
137430.1256 |
0.587427136 |
0.2 |
1260.291457 |
250799 |
4.179983333 |
0.636 |
0.029747741 |
0.700065534 |
0.299933767 |
190242.3166 |
0.611005025 |
0.1 |
1743.798995 |
347029 |
5.783816667 |
0.702 |
0.033154655 |
0.655388848 |
0.344611155 |
304708.1256 |
0.706894472 |
0.01 |
2141.306533 |
426123 |
7.10205 |
0.778 |
0.028943958 |
0.597801611 |
0.402198331 |
419493.5226 |
0.752809045 |
0.001 |
3839.502513 |
764069 |
12.73448333 |
0.81 |
0.026849735 |
0.627921843 |
0.372078174 |
421886.6382 |
0.753135678 |
9.00E-04 |
3885.175879 |
773154 |
12.8859 |
0.83 |
0.026893736 |
0.577771528 |
0.42222847 |
435892.4573 |
0.755080402 |
8.00E-04 |
4005.758794 |
797148 |
13.2858 |
0.814 |
0.024913591 |
0.617932518 |
0.382067507 |
444884.1558 |
0.760276382 |
7.00E-04 |
4065.165829 |
808975 |
13.48291667 |
0.821 |
0.025859088 |
0.612938866 |
0.387061147 |
448786.8241 |
0.759336683 |
6.00E-04 |
4097.170854 |
815347 |
13.58911667 |
0.823 |
0.024982651 |
0.617976851 |
0.382023116 |
468389.2613 |
0.761291457 |
5.00E-04 |
4296.261307 |
854979 |
14.24965 |
0.838 |
0.025078079 |
0.607958549 |
0.392041445 |
486443.0201 |
0.765160804 |
4.00E-04 |
4431.01005 |
881780 |
14.69633333 |
0.818 |
0.024972835 |
0.597932415 |
0.402067594 |
517064.598 |
0.768653266 |
3.00E-04 |
4731.145729 |
941508 |
15.6918 |
0.834 |
0.026290709 |
0.577859644 |
0.422140373 |
557448.9598 |
0.77380402 |
2.00E-04 |
4808.115578 |
956823 |
15.94705 |
0.843 |
0.026010179 |
0.567826026 |
0.432173976 |
631946.3065 |
0.780150754 |
1.00E-04 |
5788.758794 |
1151975 |
19.19958333 |
0.856 |
0.02593919 |
分类准确率pave随着收敛标准δ减小逐渐增加,同时迭代次数不断变大。这表明2**0.5和3**0.5内在确实有各自独特的分布规律可以实现彼此分类。
再来看第二组实验,测试集用第2500-3000张图片
训练集 |
0-2500 |
|||||||||
测试集 |
2500-3000 |
|||||||||
f2[0] |
f2[1] |
迭代次数n |
平均准确率p-ave |
δ |
耗时ms/次 |
耗时ms/199次 |
耗时 min/199 |
最大值p-max |
pave标准差 |
|
0.499081714 |
0.50032913 |
19.33668342 |
0.500452261 |
0.5 |
5.251256281 |
1061 |
0.017683333 |
0.531 |
0.004262314 |
0.496189947 |
0.455413603 |
0.544673527 |
11770.69849 |
0.517994975 |
0.4 |
115.1407035 |
22913 |
0.381883333 |
0.543 |
0.007751477 |
0.510243497 |
0.575489125 |
0.424448363 |
57086.41709 |
0.519864322 |
0.3 |
550.0954774 |
109485 |
1.82475 |
0.536 |
0.004622067 |
0.515242255 |
0.58537217 |
0.41460736 |
135191.0503 |
0.513638191 |
0.2 |
1286.582915 |
256092 |
4.2682 |
0.54 |
0.011493487 |
0.502144704 |
0.737357587 |
0.262639926 |
188887.3668 |
0.512447236 |
0.1 |
1778.758794 |
353989 |
5.899816667 |
0.546 |
0.013333224 |
0.499114012 |
0.640575628 |
0.359424389 |
301379.1156 |
0.504768844 |
0.01 |
2832.894472 |
563746 |
9.395766667 |
0.545 |
0.014235875 |
0.490532969 |
0.532599738 |
0.467400264 |
421724.9246 |
0.506643216 |
0.001 |
3963.035176 |
788660 |
13.14433333 |
0.549 |
0.015386751 |
0.491256465 |
0.587785971 |
0.41221401 |
422781.603 |
0.504467337 |
9.00E-04 |
3973.914573 |
790825 |
13.18041667 |
0.542 |
0.014500656 |
0.48996668 |
0.577770729 |
0.422229271 |
430972.1859 |
0.504919598 |
8.00E-04 |
4054.994975 |
806946 |
13.4491 |
0.548 |
0.015553557 |
0.489366041 |
0.562732619 |
0.437267387 |
442785.7789 |
0.504733668 |
7.00E-04 |
3721.819095 |
740648 |
12.34413333 |
0.539 |
0.015461881 |
0.489271787 |
0.592857725 |
0.407142295 |
455381.5578 |
0.506145729 |
6.00E-04 |
4287.261307 |
853173 |
14.21955 |
0.545 |
0.014890686 |
0.491255043 |
0.597897619 |
0.402102375 |
467498.3266 |
0.506638191 |
5.00E-04 |
4420.688442 |
879731 |
14.66218333 |
0.554 |
0.015457179 |
0.491181012 |
0.582851283 |
0.41714874 |
488769.1357 |
0.507050251 |
4.00E-04 |
4587.477387 |
912924 |
15.2154 |
0.547 |
0.014668788 |
0.492381463 |
0.572821901 |
0.427178109 |
508326.191 |
0.504934673 |
3.00E-04 |
4765.98995 |
948448 |
15.80746667 |
0.558 |
0.014848337 |
0.490086336 |
0.532650198 |
0.467349782 |
564547.0955 |
0.506919598 |
2.00E-04 |
5328.80402 |
1060451 |
17.67418333 |
0.547 |
0.015604199 |
0.491315399 |
0.572850484 |
0.427149514 |
646090.0402 |
0.504577889 |
1.00E-04 |
6155.899497 |
1225026 |
20.4171 |
0.551 |
0.015242519 |
0.48933537 |
先将两次实验的迭代次数曲线画在一起
迭代次数n |
迭代次数n |
19.88944724 |
19.33668342 |
11921.1407 |
11770.69849 |
58469.9397 |
57086.41709 |
137430.1256 |
135191.0503 |
190242.3166 |
188887.3668 |
304708.1256 |
301379.1156 |
419493.5226 |
421724.9246 |
421886.6382 |
422781.603 |
435892.4573 |
430972.1859 |
444884.1558 |
442785.7789 |
448786.8241 |
455381.5578 |
468389.2613 |
467498.3266 |
486443.0201 |
488769.1357 |
517064.598 |
508326.191 |
557448.9598 |
564547.0955 |
631946.3065 |
646090.0402 |
可以看到这两条曲线是高度重合的,表明实验数据稳定性是由保证的。
再比较第二次实验的平均准确率p-ave
这个图特征非常明显,随着收敛标准的减小,分类准确率稳定的趋近于50%。也就是2500-3000数据集是不可分的。
这个实验有很多启发,可以根据这个实验猜测神经网络分类的这种技术有用的前提是训练集和测试集只能是有理集,也就是大数据这种技术不能用于去预测一个无理数集合的趋势。比如无论知道2**0.5多少有效位,也不可能根据已知的数据预测2**0.5的下一位到底是什么。
因此可以合理猜测两个有理集之所以可以被区分是因为两个对象有有限长的循环节,而循环节的交叉程度决定了两个对象分类的难易程度。交叉程度越大越相似,越难以分类。
不能用前2500张图片的分布规律去预测第2501张图片的分布规律。 但就整体上这2501张图片对应的数字都是x**2=2的解,表明尽管局部是无规律的,但不明表明整体上是非因果的。这种现象和电子的运动规律很像,比如知道电子现在的位置也不能用于预测电子下一秒的位置。因此为什么不能假设电子的运动符合某个无理数的运行规律?这样电子运动的随机性和因果性就同时得到了满足。
2**0.5和3**0.5的数据来源
https://www.wolframalpha.com/input/?i=x%5E2-1
N[sqr(3),10000]