用神经网络分类无理数2**0.5和3**0.5

(2**0.5,3**0.5)—100*10*2—(1,0)(0,1)

用神经网络分类分类2**0.5和3**0.5，2**0.5和3**0.5分别取3万位有效数字。每10位有效数字构成一张图片，共3000张图片，用前2500张图片做训练集。分别用0-500张图片和2500-3000张图片做测试集。这个网络可以分类吗？

比如2**0.5的前10位是1414213562 ，因此2**0.5的第一张图片是

第一组实验，测试集用第0-500张图片

训练集	0-2500
测试集	0-500
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大值p-max	pave标准差
0.500208775	0.500612997	19.88944724	0.500075377	0.5	5.311557789	1058	0.017633333	0.524	0.004409828
0.458393915	0.541479776	11921.1407	0.569829146	0.4	114.3165829	22759	0.379316667	0.608	0.01866044
0.536561847	0.463414981	58469.9397	0.575768844	0.3	540.0351759	107469	1.79115	0.609	0.013760947
0.641373382	0.3586357	137430.1256	0.587427136	0.2	1260.291457	250799	4.179983333	0.636	0.029747741
0.700065534	0.299933767	190242.3166	0.611005025	0.1	1743.798995	347029	5.783816667	0.702	0.033154655
0.655388848	0.344611155	304708.1256	0.706894472	0.01	2141.306533	426123	7.10205	0.778	0.028943958
0.597801611	0.402198331	419493.5226	0.752809045	0.001	3839.502513	764069	12.73448333	0.81	0.026849735
0.627921843	0.372078174	421886.6382	0.753135678	9.00E-04	3885.175879	773154	12.8859	0.83	0.026893736
0.577771528	0.42222847	435892.4573	0.755080402	8.00E-04	4005.758794	797148	13.2858	0.814	0.024913591
0.617932518	0.382067507	444884.1558	0.760276382	7.00E-04	4065.165829	808975	13.48291667	0.821	0.025859088
0.612938866	0.387061147	448786.8241	0.759336683	6.00E-04	4097.170854	815347	13.58911667	0.823	0.024982651
0.617976851	0.382023116	468389.2613	0.761291457	5.00E-04	4296.261307	854979	14.24965	0.838	0.025078079
0.607958549	0.392041445	486443.0201	0.765160804	4.00E-04	4431.01005	881780	14.69633333	0.818	0.024972835
0.597932415	0.402067594	517064.598	0.768653266	3.00E-04	4731.145729	941508	15.6918	0.834	0.026290709
0.577859644	0.422140373	557448.9598	0.77380402	2.00E-04	4808.115578	956823	15.94705	0.843	0.026010179
0.567826026	0.432173976	631946.3065	0.780150754	1.00E-04	5788.758794	1151975	19.19958333	0.856	0.02593919

分类准确率pave随着收敛标准δ减小逐渐增加，同时迭代次数不断变大。这表明2**0.5和3**0.5内在确实有各自独特的分布规律可以实现彼此分类。

再来看第二组实验，测试集用第2500-3000张图片

训练集	0-2500
测试集	2500-3000
f2[0]	f2[1]	迭代次数n	平均准确率p-ave	δ	耗时ms/次	耗时ms/199次	耗时 min/199	最大值p-max	pave标准差
0.499081714	0.50032913	19.33668342	0.500452261	0.5	5.251256281	1061	0.017683333	0.531	0.004262314	0.496189947
0.455413603	0.544673527	11770.69849	0.517994975	0.4	115.1407035	22913	0.381883333	0.543	0.007751477	0.510243497
0.575489125	0.424448363	57086.41709	0.519864322	0.3	550.0954774	109485	1.82475	0.536	0.004622067	0.515242255
0.58537217	0.41460736	135191.0503	0.513638191	0.2	1286.582915	256092	4.2682	0.54	0.011493487	0.502144704
0.737357587	0.262639926	188887.3668	0.512447236	0.1	1778.758794	353989	5.899816667	0.546	0.013333224	0.499114012
0.640575628	0.359424389	301379.1156	0.504768844	0.01	2832.894472	563746	9.395766667	0.545	0.014235875	0.490532969
0.532599738	0.467400264	421724.9246	0.506643216	0.001	3963.035176	788660	13.14433333	0.549	0.015386751	0.491256465
0.587785971	0.41221401	422781.603	0.504467337	9.00E-04	3973.914573	790825	13.18041667	0.542	0.014500656	0.48996668
0.577770729	0.422229271	430972.1859	0.504919598	8.00E-04	4054.994975	806946	13.4491	0.548	0.015553557	0.489366041
0.562732619	0.437267387	442785.7789	0.504733668	7.00E-04	3721.819095	740648	12.34413333	0.539	0.015461881	0.489271787
0.592857725	0.407142295	455381.5578	0.506145729	6.00E-04	4287.261307	853173	14.21955	0.545	0.014890686	0.491255043
0.597897619	0.402102375	467498.3266	0.506638191	5.00E-04	4420.688442	879731	14.66218333	0.554	0.015457179	0.491181012
0.582851283	0.41714874	488769.1357	0.507050251	4.00E-04	4587.477387	912924	15.2154	0.547	0.014668788	0.492381463
0.572821901	0.427178109	508326.191	0.504934673	3.00E-04	4765.98995	948448	15.80746667	0.558	0.014848337	0.490086336
0.532650198	0.467349782	564547.0955	0.506919598	2.00E-04	5328.80402	1060451	17.67418333	0.547	0.015604199	0.491315399
0.572850484	0.427149514	646090.0402	0.504577889	1.00E-04	6155.899497	1225026	20.4171	0.551	0.015242519	0.48933537

先将两次实验的迭代次数曲线画在一起

迭代次数n	迭代次数n
19.88944724	19.33668342
11921.1407	11770.69849
58469.9397	57086.41709
137430.1256	135191.0503
190242.3166	188887.3668
304708.1256	301379.1156
419493.5226	421724.9246
421886.6382	422781.603
435892.4573	430972.1859
444884.1558	442785.7789
448786.8241	455381.5578
468389.2613	467498.3266
486443.0201	488769.1357
517064.598	508326.191
557448.9598	564547.0955
631946.3065	646090.0402

用神经网络分类无理数2**0.5和3**0.5

可以看到这两条曲线是高度重合的，表明实验数据稳定性是由保证的。

再比较第二次实验的平均准确率p-ave

用神经网络分类无理数2**0.5和3**0.5

这个图特征非常明显，随着收敛标准的减小，分类准确率稳定的趋近于50%。也就是2500-3000数据集是不可分的。

这个实验有很多启发，可以根据这个实验猜测神经网络分类的这种技术有用的前提是训练集和测试集只能是有理集，也就是大数据这种技术不能用于去预测一个无理数集合的趋势。比如无论知道2**0.5多少有效位，也不可能根据已知的数据预测2**0.5的下一位到底是什么。

因此可以合理猜测两个有理集之所以可以被区分是因为两个对象有有限长的循环节，而循环节的交叉程度决定了两个对象分类的难易程度。交叉程度越大越相似，越难以分类。

不能用前2500张图片的分布规律去预测第2501张图片的分布规律。但就整体上这2501张图片对应的数字都是x**2=2的解，表明尽管局部是无规律的，但不明表明整体上是非因果的。这种现象和电子的运动规律很像，比如知道电子现在的位置也不能用于预测电子下一秒的位置。因此为什么不能假设电子的运动符合某个无理数的运行规律？这样电子运动的随机性和因果性就同时得到了满足。

2**0.5和3**0.5的数据来源

https://www.wolframalpha.com/input/?i=x%5E2-1

N[sqr(3),10000]

用神经网络分类无理数2**0.5和3**0.5

相关推荐

用神经网络分类无理数20.5和30.5