比较三组迭代次数的变化

(A,B)---6*30*2---(0,1)(1,0)
让A是结构5,让B全是0。收敛误差为7e-4,收敛199次取迭代次数平均值,得到迭代次数为129535.3

(A,B)---6*30*2(5)---(0,1)(1,0)
然后让A分别是0,1,2,3,4,但是初始权重是5的收敛权重,收敛误差为7e-4,先用5收敛,得到收敛权重,每个结构用此权重再收敛,共199次,
得到迭代次
| 0 | 89344.08 |
| 1 | 89122.35 |
| 2 | 89385.8 |
| 3 | 89574.25 |
| 4 | 89199.59 |
这几个值几乎是相同的,训练集A-B矩阵的列可自由变换的假设在这种情况下依然适用。这几个值约为5迭代次数的69%,所以用5的收敛权重去分类0,1,2,3,4可以节约31%的运算。

同样再用5的收敛权重去分类11,17,23,29,35.得到迭代次数为
| 11 | 3 |
| 17 | 5 |
| 23 | 7 |
| 29 | 9 |
| 35 | 11 |
随着点与5的距离的增加,迭代次数变大,但是与129535.3相比可以近似认为迭代次数都相同约为1,虽然这种近似将导致误差但简化了计算。所以当点与5同列时迭代次数为1,节约100%的运算。
第三种情况

让A分别是10,15,20,25,30,同样用5的收敛权重作初始权重,得到迭代次数为
| 10 | 89172.89 |
| 15 | 89424.72 |
| 20 | 89387.52 |
| 25 | 89253.66 |
| 30 | 89293.71 |
这组数据和0,1,2,3,4的数据很相近,所以5的收敛权重把平面分成两类,同列的迭代次数为1,不同列的迭代次数减少31%。
导出结构5某次第一层6*30的初始权重和收敛权重
| 初始 | 收敛 | |||||||||
| 1 | 0.071 | 0.071 | 31 | 0.069 | 0.069 | 61 | -0.04 | -0.04 | ||
| 2 | 0.023 | 0.023 | 32 | 0.013 | 0.013 | 62 | -0.04 | -0.04 | ||
| 3 | 0.079 | 0.079 | 33 | 0.095 | 0.095 | 63 | -0.04 | -0.04 | ||
| 4 | 0.017 | 0.017 | 34 | -0.06 | -0.06 | 64 | -0.03 | -0.03 | ||
| 5 | -0.03 | -0.03 | 35 | 0.075 | 0.075 | 65 | -0.03 | -0.03 | ||
| 6 | 0.049 | 0.049 | 36 | 0.037 | 0.037 | 66 | -0.06 | -0.06 | ||
| 7 | -0.08 | -0.08 | 37 | 0.087 | 0.087 | 67 | -0.05 | -0.05 | ||
| 8 | -0.06 | -0.06 | 38 | 0.053 | 0.053 | 68 | -0.02 | -0.02 | ||
| 9 | 0.041 | 0.041 | 39 | 0.067 | 0.067 | 69 | 0.095 | 0.095 | ||
| 10 | 0.085 | 0.085 | 40 | 0.031 | 0.031 | 70 | 0.041 | 0.041 | ||
| 11 | -0.06 | -0.06 | 41 | 0.017 | 0.017 | 71 | -0.07 | -0.07 | ||
| 12 | -0.07 | -0.07 | 42 | 0.041 | 0.041 | 72 | 0.047 | 0.047 | ||
| 13 | -0.09 | -0.09 | 43 | 0.077 | 0.077 | 73 | 0.009 | 0.009 | ||
| 14 | -0.05 | -0.05 | 44 | -0.08 | -0.08 | 74 | -0.09 | -0.09 | ||
| 15 | 0.085 | 0.085 | 45 | -0.03 | -0.03 | 75 | -0.06 | -0.06 | ||
| 16 | -0.09 | -0.09 | 46 | 0.041 | 0.041 | 76 | 0.085 | 0.085 | ||
| 17 | 0.005 | 0.005 | 47 | -0.01 | -0.01 | 77 | 0.055 | 0.055 | ||
| 18 | 0.075 | 0.075 | 48 | 0.049 | 0.049 | 78 | -0.03 | -0.03 | ||
| 19 | -0.1 | -0.1 | 49 | -0.09 | -0.09 | 79 | 0.091 | 0.091 | ||
| 20 | -0.05 | -0.05 | 50 | -0.06 | -0.06 | 80 | 0.029 | 0.029 | ||
| 21 | -0.08 | -0.08 | 51 | -0.01 | -0.01 | 81 | -0.08 | -0.08 | ||
| 22 | 0.005 | 0.005 | 52 | 0.009 | 0.009 | 82 | -0.05 | -0.05 | ||
| 23 | -0.01 | -0.01 | 53 | -0.03 | -0.03 | 83 | 0.075 | 0.075 | ||
| 24 | -0.07 | -0.07 | 54 | 0.053 | 0.053 | 84 | -0.02 | -0.02 | ||
| 25 | -0.05 | -0.05 | 55 | 0.067 | 0.067 | 85 | -0.02 | -0.02 | ||
| 26 | -0.06 | -0.06 | 56 | 0.063 | 0.063 | 86 | 0.049 | 0.049 | ||
| 27 | -0.06 | -0.06 | 57 | -0.06 | -0.06 | 87 | 0.057 | 0.057 | ||
| 28 | -0.07 | -0.07 | 58 | 0.095 | 0.095 | 88 | 0.027 | 0.027 | ||
| 29 | 0.029 | 0.029 | 59 | -0.03 | -0.03 | 89 | 0.083 | 0.083 | ||
| 30 | -0.09 | -0.09 | 60 | -0 | -0 | 90 | -0.08 | -0.08 |
| 91 | -0.02 | -0.02 | 121 | 0.065 | 0.065 | 151 | 0.061 | 1.311 | ||
| 92 | 0.007 | 0.007 | 122 | 0.003 | 0.003 | 152 | 0.073 | -0.82 | ||
| 93 | -0 | -0 | 123 | 0.089 | 0.089 | 153 | -0.06 | -0.8 | ||
| 94 | 0.005 | 0.005 | 124 | 0.003 | 0.003 | 154 | 0.013 | -0.93 | ||
| 95 | 0.001 | 0.001 | 125 | -0.01 | -0.01 | 155 | -0.04 | -1.8 | ||
| 96 | -0.01 | -0.01 | 126 | 0.081 | 0.081 | 156 | 0.069 | 1.754 | ||
| 97 | -0.06 | -0.06 | 127 | -0.03 | -0.03 | 157 | 0.049 | 0.013 | ||
| 98 | -0.08 | -0.08 | 128 | 0.089 | 0.089 | 158 | 0.009 | 1.378 | ||
| 99 | 0.029 | 0.029 | 129 | -0.04 | -0.04 | 159 | -0.03 | -0.43 | ||
| 100 | 0.001 | 0.001 | 130 | -0 | -0 | 160 | 0.061 | -1.04 | ||
| 101 | 0.055 | 0.055 | 131 | 0.025 | 0.025 | 161 | 0.091 | 2.423 | ||
| 102 | 0.049 | 0.049 | 132 | 0.011 | 0.011 | 162 | -0.09 | -1.09 | ||
| 103 | 0.085 | 0.085 | 133 | -0.04 | -0.04 | 163 | 0.077 | 0.825 | ||
| 104 | -0.07 | -0.07 | 134 | 0.061 | 0.061 | 164 | 0.015 | 1.123 | ||
| 105 | -0.03 | -0.03 | 135 | -0.06 | -0.06 | 165 | -0.04 | 0.13 | ||
| 106 | 0.061 | 0.061 | 136 | 0.023 | 0.023 | 166 | -0.08 | -1.54 | ||
| 107 | 0.091 | 0.091 | 137 | 0.087 | 0.087 | 167 | 0.037 | 0.461 | ||
| 108 | 0.047 | 0.047 | 138 | 0.023 | 0.023 | 168 | 0.085 | 1.265 | ||
| 109 | 0.071 | 0.071 | 139 | 0.045 | 0.045 | 169 | 0.081 | 1.974 | ||
| 110 | 0.071 | 0.071 | 140 | -0.06 | -0.06 | 170 | -0.07 | -1.28 | ||
| 111 | 0.079 | 0.079 | 141 | -0.08 | -0.08 | 171 | 0.059 | -0.23 | ||
| 112 | -0.04 | -0.04 | 142 | -0 | -0 | 172 | -0.04 | -0.77 | ||
| 113 | 0.033 | 0.033 | 143 | -0.03 | -0.03 | 173 | -0.02 | -1.19 | ||
| 114 | 0.065 | 0.065 | 144 | 0.003 | 0.003 | 174 | -0.04 | -1.01 | ||
| 115 | -0.09 | -0.09 | 145 | -0.01 | -0.01 | 175 | 0.013 | 1.085 | ||
| 116 | 0.041 | 0.041 | 146 | -0.02 | -0.02 | 176 | -0 | -1.16 | ||
| 117 | 0.097 | 0.097 | 147 | 0.081 | 0.081 | 177 | -0.06 | -1.81 | ||
| 118 | -0.03 | -0.03 | 148 | 0.091 | 0.091 | 178 | 0.051 | 1.706 | ||
| 119 | -0.01 | -0.01 | 149 | 0.095 | 0.095 | 179 | 0.007 | -0.45 | ||
| 120 | -0.04 | -0.04 | 150 | 0.091 | 0.091 | 180 | -0.07 | -0.97 |
画图

只有151-180的30个点有变化,其余的150个点完全没有变化,所以显然30个数对应一列,151-180对应第6列。
所以如果点与结构5同列则收敛权重的波形应该是相近的,而如果不同列将这个波形移动到其他列的成本是总运算量的约69%。
