]> AND Private Git Repository - kahina_paper2.git/blob - Simulations/sparse_openmp/sparse_openmp_1GPU.o140100
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
ajout du code du kernel
[kahina_paper2.git] / Simulations / sparse_openmp / sparse_openmp_1GPU.o140100
1 REMAINING: 1
2 Taking GPU #3
3 (1 +i*0)*x^0 + (-0.1 +i*0)*x^40000 + (-10 +i*0)*x^60000 + (1 +i*0)*x^100000
4  
5 (-4000 +i*0)*x^39999 + (-600000 +i*0)*x^59999 + (100000 +i*0)*x^99999
6  
7 zone limite de 'log-exp' 1.00356
8 CPU thread 0 (of 1) uses CUDA device 0
9 gpu 0 dimgrid 391 dimblock 256  degrePoly 100000
10 gpu 0 dimgrid2 391 start 0  size 100096
11 gpu 0 iter : 1  Arret : 0.0052669 s/iter 0.775408 
12 gpu 0 iter : 2  Arret : 0.00752645 s/iter 0.775369 
13 gpu 0 iter : 3  Arret : 0.0240999 s/iter 0.775305 
14 gpu 0 iter : 4  Arret : 0.0224589 s/iter 0.850697 
15 gpu 0 iter : 5  Arret : 0.00804703 s/iter 0.844340 
16 gpu 0 iter : 6  Arret : 0.00438171 s/iter 0.775251 
17 gpu 0 iter : 7  Arret : 0.00744568 s/iter 0.775238 
18 gpu 0 iter : 8  Arret : 0.00764888 s/iter 0.775261 
19 gpu 0 iter : 9  Arret : 0.00410621 s/iter 0.775320 
20 gpu 0 iter : 10  Arret : 0.00247273 s/iter 0.775247 
21 gpu 0 iter : 11  Arret : 0.00227795 s/iter 0.775273 
22 gpu 0 iter : 12  Arret : 0.00210901 s/iter 0.775117 
23 gpu 0 iter : 13  Arret : 0.000438336 s/iter 0.774935 
24 gpu 0 iter : 14  Arret : 0.000273199 s/iter 0.774865 
25 gpu 0 iter : 15  Arret : 0.000137109 s/iter 0.774789 
26 gpu 0 iter : 16  Arret : 1.40101E-05 s/iter 0.774828 
27 gpu 0 iter : 17  Arret : 1.89958E-07 s/iter 0.774719 
28 gpu 0 iter : 18  Arret : 2.82623E-09 s/iter 0.774706 
29 gpu 0 iter : 19  Arret : 4.21054E-11 s/iter 0.774674 
30 gpu 0 iter : 20  Arret : 6.27215E-13 s/iter 0.774731 
31 temps : 16.1926 seconde(s)
32 Nb iterations : 20
33 Nb de depassements de capacite exponentielle : 0
34 Precision :     2.61117E-09
35 Stabilite :     6.27215E-13
36 +---+----------------------------+------------+----------------------------+
37 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
38 +---+----------------------------+------------+----------------------------+
39 |  1|    0.540308 +i*    0.841422|    0.999962|-1.95866E-12 +i*-4.55465E-13|
40 |  2|   -0.113164 +i*    0.993538|    0.999962|-4.34919E-12 +i* 9.60242E-13|
41 |  3|   -0.226711 +i*   -0.973923|    0.999962|-4.27658E-13 +i* 6.01027E-13|
42 |  4|   -0.715763 +i*    0.698289|    0.999962| 9.11271E-13 +i* 2.47219E-12|
43 |  5|    0.439922 +i*   -0.897993|    0.999962|-3.49498E-13 +i* 1.66432E-12|
44 |  6|   -0.996021 +i*   0.0886823|    0.999962| 1.17772E-12 +i* 6.16285E-13|
45 |  7|    0.908546 +i*   -0.417692|    0.999962| 4.78506E-13 +i* 1.54377E-13|
46 |  8|   -0.827813 +i*   -0.560935|    0.999962| 9.76996E-13 +i*-2.04309E-12|
47 |  9|    0.968049 +i*    0.250607|    0.999962|-1.07025E-13 +i*-1.15224E-12|
48 | 10|   -0.286815 +i*   -0.957946|    0.999962|-6.55254E-13 +i* 1.20869E-12|
49 | 11|    0.591653 +i*    0.806145|    0.999962|-9.87654E-13 +i*-3.03635E-12|
50 | 12|  -0.0511836 +i*    0.998651|    0.999962|-2.22622E-12 +i*-3.69013E-14|
51 | 13|    -0.67097 +i*    0.741432|    0.999962|-8.03801E-14 +i*-1.68204E-12|
52 | 14|    0.383249 +i*   -0.923603|    0.999962|-1.29119E-12 +i*-1.37426E-12|
53 | 15|   -0.988582 +i*    0.150427|    0.999962|-1.54698E-12 +i*-6.48537E-13|
54 | 16|    0.880824 +i*   -0.473363|    0.999962| 1.58029E-12 +i*-2.34379E-12|
55 | 17|   -0.861082 +i*   -0.508391|    0.999962|  9.8066E-13 +i* 3.40478E-12|
56 | 18|    0.981756 +i*    0.189945|    0.999962|-1.13665E-12 +i* 1.13043E-12|
57 | 19|   -0.345809 +i*   -0.938264|    0.999962| 1.03906E-12 +i* 1.95398E-12|
58 | 20|    0.640621 +i*    0.767807|    0.999962|-6.98774E-13 +i* 1.13798E-12|
59 +---+----------------------------+------------+----------------------------+
60 60000 racines de module = 0.999962
61 40000 racines de module = 1.00006
62 (1 +i*0)*x^0 + (-0.1 +i*0)*x^50000 + (-10 +i*0)*x^150000 + (1 +i*0)*x^200000
63  
64 (-5000 +i*0)*x^49999 + (-1.5E+06 +i*0)*x^149999 + (200000 +i*0)*x^199999
65  
66 zone limite de 'log-exp' 1.00178
67 CPU thread 0 (of 1) uses CUDA device 0
68 gpu 0 dimgrid 782 dimblock 256  degrePoly 200000
69 gpu 0 dimgrid2 782 start 0  size 200192
70 gpu 0 iter : 1  Arret : 0.000149329 s/iter 3.019382 
71 gpu 0 iter : 2  Arret : 0.000107708 s/iter 3.016857 
72 gpu 0 iter : 3  Arret : 0.000113605 s/iter 3.016990 
73 gpu 0 iter : 4  Arret : 0.000830779 s/iter 3.018300 
74 gpu 0 iter : 5  Arret : 0.00353705 s/iter 3.017239 
75 gpu 0 iter : 6  Arret : 0.0150507 s/iter 3.033347 
76 gpu 0 iter : 7  Arret : 0.0172496 s/iter 3.028650 
77 gpu 0 iter : 8  Arret : 0.032361 s/iter 3.025908 
78 gpu 0 iter : 9  Arret : 0.0281394 s/iter 3.030298 
79 gpu 0 iter : 10  Arret : 0.116314 s/iter 3.043482 
80 gpu 0 iter : 11  Arret : 0.129494 s/iter 3.073542 
81 gpu 0 iter : 12  Arret : 0.0352338 s/iter 3.047419 
82 gpu 0 iter : 13  Arret : 0.0316693 s/iter 3.041094 
83 gpu 0 iter : 14  Arret : 0.0153664 s/iter 3.020001 
84 gpu 0 iter : 15  Arret : 0.0125995 s/iter 3.011952 
85 gpu 0 iter : 16  Arret : 0.00505109 s/iter 3.013206 
86 gpu 0 iter : 17  Arret : 0.0072726 s/iter 3.013400 
87 gpu 0 iter : 18  Arret : 0.00841241 s/iter 3.012671 
88 gpu 0 iter : 19  Arret : 0.00316401 s/iter 3.011866 
89 gpu 0 iter : 20  Arret : 1.36142E-05 s/iter 3.011905 
90 gpu 0 iter : 21  Arret : 1.07816E-09 s/iter 3.012487 
91 gpu 0 iter : 22  Arret : 2.83648E-12 s/iter 3.012609 
92 gpu 0 iter : 23  Arret : 4.24948E-14 s/iter 3.012386 
93 temps : 70.1186 seconde(s)
94 Nb iterations : 23
95 Nb de depassements de capacite exponentielle : 0
96 Precision :     9.52377E-08
97 Stabilite :     4.24948E-14
98 +---+----------------------------+------------+----------------------------+
99 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
100 +---+----------------------------+------------+----------------------------+
101 |  1|    0.540195 +i*    0.841595|     1.00005|-2.98043E-09 +i*-3.27611E-08|
102 |  2|   -0.837195 +i*    0.546877|    0.999985| 7.09943E-12 +i*  5.1133E-12|
103 |  3|   -0.553418 +i*   -0.832885|    0.999985| -1.9722E-12 +i*-7.40397E-12|
104 |  4|    0.828525 +i*   -0.559925|    0.999985|-4.34675E-12 +i* 1.07137E-12|
105 |  5|   -0.819774 +i*    0.572768|     1.00005| 2.53887E-08 +i* 2.42315E-09|
106 |  6|    -0.57917 +i*   -0.815188|    0.999985|-5.13034E-12 +i*-1.52645E-12|
107 |  7|    0.810626 +i*   -0.585537|    0.999985| 8.64808E-12 +i* 7.46794E-12|
108 |  8|    0.591869 +i*    0.806015|    0.999985| 1.73195E-13 +i* 8.72591E-12|
109 |  9|   -0.801379 +i*    0.598131|    0.999985| -1.2701E-12 +i* 3.96189E-12|
110 | 10|    -0.60436 +i*   -0.796769|     1.00005|-3.33815E-08 +i* 3.89061E-08|
111 | 11|    0.791937 +i*   -0.610578|    0.999985|  6.0707E-13 +i* 1.52922E-12|
112 | 12|    0.616763 +i*     0.78713|    0.999985|-4.48042E-12 +i* -2.6295E-12|
113 | 13|   -0.782301 +i*    0.622877|    0.999985|-2.15827E-12 +i*-6.27114E-12|
114 | 14|   -0.628985 +i*   -0.777398|    0.999985|-4.05476E-12 +i*-5.17236E-12|
115 | 15|    0.772548 +i*   -0.635029|     1.00005|  1.1634E-09 +i* 1.87351E-08|
116 | 16|    0.641054 +i*    0.767476|    0.999985|-3.47633E-12 +i* 1.20617E-11|
117 | 17|   -0.762458 +i*    0.647014|    0.999985|-7.74447E-12 +i*   7.566E-12|
118 | 18|   -0.652967 +i*   -0.757366|    0.999985| 5.10392E-12 +i*-6.61069E-12|
119 | 19|    0.752229 +i*   -0.658879|    0.999985|-5.97611E-12 +i* 1.03431E-11|
120 | 20|    0.664729 +i*    0.747146|     1.00005|-1.71597E-08 +i* 8.68463E-09|
121 +---+----------------------------+------------+----------------------------+
122 50000 racines de module = 1.00005
123 150000 racines de module = 0.999985
124 (1 +i*0)*x^0 + (-0.1 +i*0)*x^150000 + (-10 +i*0)*x^250000 + (1 +i*0)*x^400000
125  
126 (-15000 +i*0)*x^149999 + (-2.5E+06 +i*0)*x^249999 + (400000 +i*0)*x^399999
127  
128 zone limite de 'log-exp' 1.00089
129 CPU thread 0 (of 1) uses CUDA device 0
130 gpu 0 dimgrid 1563 dimblock 256  degrePoly 400000
131 gpu 0 dimgrid2 1563 start 0  size 400128
132 gpu 0 iter : 1  Arret : 0.00172099 s/iter 11.753718 
133 gpu 0 iter : 2  Arret : 0.0208557 s/iter 11.747391 
134 gpu 0 iter : 3  Arret : 0.221528 s/iter 11.807046 
135 gpu 0 iter : 4  Arret : 0.572248 s/iter 11.998301 
136 gpu 0 iter : 5  Arret : 0.542189 s/iter 11.842988 
137 gpu 0 iter : 6  Arret : 0.306206 s/iter 11.822805 
138 gpu 0 iter : 7  Arret : 0.0317191 s/iter 12.059261 
139 gpu 0 iter : 8  Arret : 0.0184143 s/iter 12.061589 
140 gpu 0 iter : 9  Arret : 0.030511 s/iter 11.936705 
141 gpu 0 iter : 10  Arret : 0.023696 s/iter 11.899096 
142 gpu 0 iter : 11  Arret : 0.0135298 s/iter 11.850230 
143 gpu 0 iter : 12  Arret : 0.0119889 s/iter 11.808974 
144 gpu 0 iter : 13  Arret : 0.00485045 s/iter 11.776383 
145 gpu 0 iter : 14  Arret : 0.00522437 s/iter 11.809750 
146 gpu 0 iter : 15  Arret : 0.00252909 s/iter 11.735442 
147 gpu 0 iter : 16  Arret : 0.000417464 s/iter 11.739448 
148 gpu 0 iter : 17  Arret : 0.000235756 s/iter 11.733345 
149 gpu 0 iter : 18  Arret : 6.4985E-07 s/iter 11.743853 
150 gpu 0 iter : 19  Arret : 1.48939E-09 s/iter 11.732225 
151 gpu 0 iter : 20  Arret : 3.20792E-12 s/iter 11.734648 
152 gpu 0 iter : 21  Arret : 1.34164E-14 s/iter 11.732088 
153 temps : 248.893 seconde(s)
154 Nb iterations : 21
155 Nb de depassements de capacite exponentielle : 0
156 Precision :     1.49185E-08
157 Stabilite :     1.34164E-14
158 +---+----------------------------+------------+----------------------------+
159 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
160 +---+----------------------------+------------+----------------------------+
161 |  1|    0.540334 +i*     0.84144|    0.999991| 6.97609E-12 +i* 5.61207E-12|
162 |  2|   -0.998329 +i*    0.057622|    0.999991| 4.43912E-12 +i* 1.27665E-12|
163 |  3|    0.439867 +i*   -0.898052|    0.999991|-8.50653E-12 +i*-8.85586E-12|
164 |  4|   -0.996033 +i*   0.0888768|    0.999991|-3.15592E-12 +i* 1.17456E-12|
165 |  5|    0.411533 +i*   -0.911385|    0.999991|-2.45048E-12 +i*  4.6238E-12|
166 |  6|     0.59196 +i*    0.805956|    0.999991| 5.24358E-13 +i*-8.53073E-12|
167 |  7|   -0.992759 +i*    0.120044|    0.999991| 2.58804E-12 +i* 2.47274E-12|
168 |  8|    0.382796 +i*   -0.923823|    0.999991| 1.11042E-11 +i*-9.27687E-12|
169 |  9|    0.616925 +i*     0.78701|    0.999991| 4.27514E-12 +i*-1.13966E-11|
170 | 10|    -0.98851 +i*    0.151094|    0.999991| 1.67755E-11 +i* 4.06477E-12|
171 | 11|     0.35366 +i*   -0.935364|    0.999991|-1.92664E-11 +i* 1.19958E-11|
172 | 12|    0.641283 +i*    0.767292|    0.999991| 1.73468E-11 +i*-3.74729E-12|
173 | 13|    -0.98329 +i*    0.181995|    0.999991|-6.62759E-12 +i*-5.46796E-12|
174 | 14|    0.324176 +i*   -0.945987|    0.999991| 1.53594E-11 +i*-1.57324E-12|
175 | 15|    0.665012 +i*    0.746821|    0.999991| 5.27178E-12 +i*-4.27913E-12|
176 | 16|   -0.977104 +i*    0.212717|    0.999991|-1.01148E-11 +i* 2.41479E-12|
177 | 17|    0.294374 +i*   -0.955681|    0.999991| -1.2063E-11 +i* 1.32238E-11|
178 | 18|    0.688087 +i*    0.725616|    0.999991|-1.67164E-11 +i*-1.12573E-11|
179 | 19|   -0.969965 +i*    0.243206|    0.999991| 6.88072E-12 +i* 3.20268E-13|
180 | 20|    0.264283 +i*   -0.964436|    0.999991|-6.93356E-12 +i*-6.23118E-12|
181 +---+----------------------------+------------+----------------------------+
182 250000 racines de module = 0.999991
183 150000 racines de module = 1.00002
184 (1 +i*0)*x^0 + (-0.1 +i*0)*x^250000 + (-10 +i*0)*x^350000 + (1 +i*0)*x^600000
185  
186 (-25000 +i*0)*x^249999 + (-3.5E+06 +i*0)*x^349999 + (600000 +i*0)*x^599999
187  
188 zone limite de 'log-exp' 1.00059
189 CPU thread 0 (of 1) uses CUDA device 0
190 gpu 0 dimgrid 2344 dimblock 256  degrePoly 600000
191 gpu 0 dimgrid2 2344 start 0  size 600064
192 gpu 0 iter : 1  Arret : 0.00525558 s/iter 26.336656 
193 gpu 0 iter : 2  Arret : 0.441677 s/iter 26.703831 
194 gpu 0 iter : 3  Arret : 0.906705 s/iter 26.966169 
195 gpu 0 iter : 4  Arret : 3.755 s/iter 26.950936 
196 gpu 0 iter : 5  Arret : 1.26305 s/iter 27.316144 
197 gpu 0 iter : 6  Arret : 3.03186 s/iter 27.389925 
198 gpu 0 iter : 7  Arret : 0.213406 s/iter 27.490831 
199 gpu 0 iter : 8  Arret : 1.0101 s/iter 27.559501 
200 gpu 0 iter : 9  Arret : 0.207377 s/iter 27.194849 
201 gpu 0 iter : 10  Arret : 0.0920517 s/iter 27.466967 
202 gpu 0 iter : 11  Arret : 0.0893085 s/iter 27.380003 
203 gpu 0 iter : 12  Arret : 0.0218947 s/iter 26.617878 
204 gpu 0 iter : 13  Arret : 0.00718218 s/iter 26.491846 
205 gpu 0 iter : 14  Arret : 0.014641 s/iter 26.379537 
206 gpu 0 iter : 15  Arret : 0.00209026 s/iter 26.349906 
207 gpu 0 iter : 16  Arret : 0.00174853 s/iter 26.344560 
208 gpu 0 iter : 17  Arret : 0.00249398 s/iter 26.348383 
209 gpu 0 iter : 18  Arret : 0.00020801 s/iter 26.354612 
210 gpu 0 iter : 19  Arret : 1.26142E-07 s/iter 26.370520 
211 gpu 0 iter : 20  Arret : 5.14341E-10 s/iter 26.370752 
212 gpu 0 iter : 21  Arret : 2.04751E-12 s/iter 26.372247 
213 gpu 0 iter : 22  Arret : 8.06082E-15 s/iter 26.364052 
214 temps : 589.718 seconde(s)
215 Nb iterations : 22
216 Nb de depassements de capacite exponentielle : 0
217 Precision :     1.32595E-08
218 Stabilite :     8.06082E-15
219 +---+----------------------------+------------+----------------------------+
220 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
221 +---+----------------------------+------------+----------------------------+
222 |  1|    0.540302 +i*    0.841463|    0.999993| 8.34199E-12 +i* -1.9051E-11|
223 |  2|   -0.553438 +i*   -0.832883|    0.999993| 2.30783E-11 +i*-6.91999E-12|
224 |  3|   -0.579282 +i*   -0.815119|    0.999993|-1.44751E-12 +i* 7.66798E-12|
225 |  4|    0.592029 +i*    0.805909|    0.999993|  8.2111E-12 +i* 2.02799E-11|
226 |  5|   -0.604557 +i*   -0.796554|    0.999993|-2.82974E-12 +i* 9.99473E-12|
227 |  6|     0.61698 +i*     0.78697|    0.999993| 9.01823E-12 +i*-5.69156E-12|
228 |  7|   -0.629237 +i*   -0.777205|    0.999993|-2.92122E-12 +i*-4.85867E-12|
229 |  8|    0.641354 +i*    0.767237|    0.999993|-1.64209E-11 +i* 1.12904E-12|
230 |  9|   -0.653299 +i*   -0.757092|    0.999993|-8.22453E-13 +i* 2.82818E-12|
231 | 10|    0.665096 +i*    0.746749|    0.999993| -1.2145E-11 +i* 1.89129E-11|
232 | 11|   -0.676717 +i*   -0.736234|    0.999993|-1.26079E-11 +i*-1.25073E-11|
233 | 12|    0.688185 +i*    0.725526|    0.999993| 2.69875E-11 +i* 1.65411E-11|
234 | 13|   -0.699466 +i*   -0.714679|     1.00001| 3.92343E-10 +i*-3.02623E-09|
235 | 14|    0.710597 +i*     0.70359|    0.999993| -2.6851E-11 +i*-1.44801E-11|
236 | 15|   -0.721517 +i*    -0.69241|     1.00001| 2.88447E-09 +i* 3.69506E-09|
237 | 16|     0.73231 +i*    0.680962|    0.999993|-5.73186E-12 +i* 1.14335E-11|
238 | 17|   -0.742916 +i*   -0.669375|    0.999993| 1.59349E-11 +i* 1.71025E-11|
239 | 18|      0.7533 +i*    0.657691|     1.00001| 1.64587E-09 +i*-3.03669E-09|
240 | 19|    -0.76354 +i*    -0.64575|    0.999993| 2.24043E-11 +i*-1.30496E-12|
241 | 20|    0.773539 +i*    0.633763|     1.00001| -4.2314E-09 +i* 1.86243E-09|
242 +---+----------------------------+------------+----------------------------+
243 350000 racines de module = 0.999993
244 250000 racines de module = 1.00001
245 (1 +i*0)*x^0 + (-0.1 +i*0)*x^300000 + (-10 +i*0)*x^500000 + (1 +i*0)*x^800000
246  
247 (-30000 +i*0)*x^299999 + (-5E+06 +i*0)*x^499999 + (800000 +i*0)*x^799999
248  
249 zone limite de 'log-exp' 1.00044
250 CPU thread 0 (of 1) uses CUDA device 0
251 gpu 0 dimgrid 3125 dimblock 256  degrePoly 800000
252 gpu 0 dimgrid2 3125 start 0  size 800000
253 gpu 0 iter : 1  Arret : 0.00051726 s/iter 46.868704 
254 gpu 0 iter : 2  Arret : 0.00517255 s/iter 46.735194 
255 gpu 0 iter : 3  Arret : 0.0728679 s/iter 46.891988 
256 gpu 0 iter : 4  Arret : 0.771691 s/iter 46.979491 
257 gpu 0 iter : 5  Arret : 0.75662 s/iter 47.336136 
258 gpu 0 iter : 6  Arret : 0.635995 s/iter 47.811859 
259 gpu 0 iter : 7  Arret : 0.505749 s/iter 48.056193 
260 gpu 0 iter : 8  Arret : 0.931022 s/iter 48.270194 
261 gpu 0 iter : 9  Arret : 0.398721 s/iter 48.514679 
262 gpu 0 iter : 10  Arret : 0.247741 s/iter 48.434629 
263 gpu 0 iter : 11  Arret : 0.0707263 s/iter 48.136785 
264 gpu 0 iter : 12  Arret : 0.0344289 s/iter 47.624785 
265 gpu 0 iter : 13  Arret : 0.0278743 s/iter 46.948359 
266 gpu 0 iter : 14  Arret : 0.0109553 s/iter 46.857728 
267 gpu 0 iter : 15  Arret : 0.0093023 s/iter 46.844682 
268 gpu 0 iter : 16  Arret : 0.00935315 s/iter 46.835990 
269 gpu 0 iter : 17  Arret : 0.0162429 s/iter 46.715238 
270 gpu 0 iter : 18  Arret : 0.00648616 s/iter 46.741249 
271 gpu 0 iter : 19  Arret : 0.000839627 s/iter 46.741507 
272 gpu 0 iter : 20  Arret : 0.00184254 s/iter 46.754071 
273 gpu 0 iter : 21  Arret : 4.91346E-06 s/iter 46.769016 
274 gpu 0 iter : 22  Arret : 4.60158E-08 s/iter 46.820581 
275 gpu 0 iter : 23  Arret : 6.70363E-10 s/iter 46.824110 
276 gpu 0 iter : 24  Arret : 9.78247E-12 s/iter 46.828052 
277 gpu 0 iter : 25  Arret : 1.42634E-13 s/iter 46.828472 
278 temps : 1180.82 seconde(s)
279 Nb iterations : 25
280 Nb de depassements de capacite exponentielle : 0
281 Precision :     3.1101E-08
282 Stabilite :     1.42634E-13
283 +---+----------------------------+------------+----------------------------+
284 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
285 +---+----------------------------+------------+----------------------------+
286 |  1|    0.540305 +i*    0.841464|    0.999995|-5.33817E-12 +i*-1.81878E-11|
287 |  2|    0.592014 +i*    0.805922|    0.999995| 2.33948E-11 +i*-2.13005E-11|
288 |  3|    0.617007 +i*    0.786952|    0.999995| 4.23442E-11 +i* -6.2147E-12|
289 |  4|    0.641392 +i*    0.767207|    0.999995|-4.99742E-11 +i* 1.43873E-11|
290 |  5|    0.665146 +i*    0.746707|    0.999995| 2.02977E-11 +i* 7.48579E-12|
291 |  6|    0.688245 +i*    0.725472|    0.999995|-1.73153E-11 +i* -1.2656E-11|
292 |  7|    0.710667 +i*    0.703522|    0.999995| 3.69782E-12 +i*  2.3081E-12|
293 |  8|    0.732388 +i*     0.68088|    0.999995| 9.45355E-12 +i* 2.09024E-11|
294 |  9|    0.753381 +i*    0.657577|    0.999995| 3.40094E-11 +i* 1.45989E-12|
295 | 10|     0.77364 +i*    0.633618|    0.999995|-1.72307E-11 +i* 1.22723E-11|
296 | 11|    0.793138 +i*    0.609034|    0.999995| 3.89222E-12 +i* 2.21356E-11|
297 | 12|    0.811855 +i*    0.583851|    0.999995|-1.28337E-11 +i*-5.47207E-12|
298 | 13|    0.829772 +i*    0.558094|    0.999995|-1.63114E-11 +i*-1.64246E-12|
299 | 14|    0.846873 +i*    0.531786|    0.999995| 3.88137E-11 +i*-3.00611E-11|
300 | 15|     0.86314 +i*    0.504956|    0.999995|-4.00413E-12 +i* 3.04823E-11|
301 | 16|    0.878557 +i*    0.477628|    0.999995|-2.16493E-12 +i* 1.10533E-11|
302 | 17|    0.893104 +i*    0.449841|    0.999995|-1.48552E-11 +i* 1.06063E-11|
303 | 18|    0.906777 +i*      0.4216|    0.999995|-1.38745E-11 +i* 5.33384E-12|
304 | 19|    0.919557 +i*    0.392944|    0.999995|-3.33245E-11 +i* 5.94386E-12|
305 | 20|    0.931433 +i*    0.363901|    0.999995| 4.93219E-11 +i*-2.82651E-11|
306 +---+----------------------------+------------+----------------------------+
307 500000 racines de module = 0.999995
308 300000 racines de module = 1.00001
309 (1 +i*0)*x^0 + (-0.1 +i*0)*x^400000 + (-10 +i*0)*x^600000 + (1 +i*0)*x^1000000
310  
311 (-40000 +i*0)*x^399999 + (-6E+06 +i*0)*x^599999 + (1E+06 +i*0)*x^999999
312  
313 zone limite de 'log-exp' 1.00035
314 CPU thread 0 (of 1) uses CUDA device 0
315 gpu 0 dimgrid 3907 dimblock 256  degrePoly 1000000
316 gpu 0 dimgrid2 3907 start 0  size 1000192
317 gpu 0 iter : 1  Arret : 0.00369829 s/iter 72.960026 
318 gpu 0 iter : 2  Arret : 0.656453 s/iter 73.009854 
319 gpu 0 iter : 3  Arret : 1.85379 s/iter 73.909530 
320 gpu 0 iter : 4  Arret : 0.184697 s/iter 73.870387 
321 gpu 0 iter : 5  Arret : 0.149335 s/iter 73.917721 
322 gpu 0 iter : 6  Arret : 0.0961951 s/iter 74.759550 
323 gpu 0 iter : 7  Arret : 0.0847578 s/iter 74.840915 
324 gpu 0 iter : 8  Arret : 0.0292103 s/iter 74.694556 
325 gpu 0 iter : 9  Arret : 0.0283648 s/iter 74.484213 
326 gpu 0 iter : 10  Arret : 0.0181273 s/iter 73.989131 
327 gpu 0 iter : 11  Arret : 0.0158134 s/iter 73.602331 
328 gpu 0 iter : 12  Arret : 0.0047499 s/iter 73.110712 
329 gpu 0 iter : 13  Arret : 0.00558216 s/iter 73.004439 
330 gpu 0 iter : 14  Arret : 0.00502349 s/iter 72.957971 
331 gpu 0 iter : 15  Arret : 0.00203782 s/iter 72.966516 
332 gpu 0 iter : 16  Arret : 0.000101539 s/iter 72.953065 
333 gpu 0 iter : 17  Arret : 0.000105985 s/iter 72.981166 
334 gpu 0 iter : 18  Arret : 7.62032E-06 s/iter 72.955710 
335 gpu 0 iter : 19  Arret : 2.53593E-08 s/iter 72.953928 
336 gpu 0 iter : 20  Arret : 2.22162E-10 s/iter 72.808169 
337 gpu 0 iter : 21  Arret : 3.30983E-12 s/iter 72.824788 
338 gpu 0 iter : 22  Arret : 4.92853E-14 s/iter 72.871341 
339 temps : 1621.79 seconde(s)
340 Nb iterations : 22
341 Nb de depassements de capacite exponentielle : 0
342 Precision :     2.65132E-08
343 Stabilite :     4.92853E-14
344 +---+----------------------------+------------+----------------------------+
345 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
346 +---+----------------------------+------------+----------------------------+
347 |  1|    0.540305 +i*    0.841476|     1.00001| 4.82795E-10 +i* 3.31212E-09|
348 |  2|     0.52971 +i*    0.848174|    0.999996|-2.56639E-12 +i*-3.27674E-11|
349 |  3|    0.524361 +i*    0.851491|    0.999996|-2.47296E-11 +i* 1.78327E-11|
350 |  4|    0.519019 +i*    0.854758|    0.999996|-1.39375E-11 +i* 5.79731E-12|
351 |  5|    0.513629 +i*    0.858008|    0.999996| 2.32483E-11 +i* 6.70747E-12|
352 |  6|    0.508237 +i*    0.861213|    0.999996|-1.34339E-11 +i* 9.87854E-12|
353 |  7|    0.502834 +i*    0.864379|    0.999996|-2.85585E-11 +i* 6.91519E-12|
354 |  8|    0.497384 +i*    0.867526|    0.999996| 2.97429E-11 +i*-6.06626E-13|
355 |  9|    0.491942 +i*    0.870624|    0.999996| -1.9825E-11 +i*-1.52329E-11|
356 | 10|    0.486452 +i*    0.873703|    0.999996|  3.0312E-11 +i* 1.02214E-11|
357 | 11|    0.480962 +i*    0.876737|    0.999996| 1.81546E-11 +i* 8.04012E-12|
358 | 12|    0.475453 +i*    0.879736|    0.999996| 3.09861E-11 +i*   4.093E-12|
359 | 13|    0.469917 +i*    0.882706|    0.999996|-1.29106E-11 +i*-2.31489E-11|
360 | 14|     0.46438 +i*    0.885632|    0.999996| 1.33844E-11 +i*-1.06731E-12|
361 | 15|    0.458797 +i*    0.888537|    0.999996| 2.78862E-11 +i* 1.10441E-11|
362 | 16|    0.453214 +i*    0.891397|    0.999996| 2.45506E-11 +i*  3.1726E-11|
363 | 17|    0.447623 +i*    0.894218|    0.999996| 3.85803E-11 +i*  3.3129E-11|
364 | 18|    0.441986 +i*    0.897017|    0.999996| 2.72476E-11 +i* 3.22485E-11|
365 | 19|     0.43636 +i*    0.899768|    0.999996| 3.23241E-12 +i*  9.4037E-12|
366 | 20|    0.430689 +i*    0.902496|    0.999996|-1.25435E-11 +i* 3.86925E-13|
367 +---+----------------------------+------------+----------------------------+
368 400000 racines de module = 1.00001
369 600000 racines de module = 0.999996
370 (1 +i*0)*x^0 + (-0.1 +i*0)*x^500000 + (-10 +i*0)*x^700000 + (1 +i*0)*x^1200000
371  
372 (-50000 +i*0)*x^499999 + (-7E+06 +i*0)*x^699999 + (1.2E+06 +i*0)*x^1199999
373  
374 zone limite de 'log-exp' 1.0003
375 CPU thread 0 (of 1) uses CUDA device 0
376 gpu 0 dimgrid 4688 dimblock 256  degrePoly 1200000
377 gpu 0 dimgrid2 4688 start 0  size 1200128
378 gpu 0 iter : 1  Arret : 0.0182376 s/iter 104.837597 
379 gpu 0 iter : 2  Arret : 1.12373 s/iter 108.563668 
380 gpu 0 iter : 3  Arret : 0.426381 s/iter 110.022983 
381 gpu 0 iter : 4  Arret : 0.721244 s/iter 111.488820 
382 gpu 0 iter : 5  Arret : 1.17091 s/iter 111.916174 
383 gpu 0 iter : 6  Arret : 0.351155 s/iter 112.354360 
384 gpu 0 iter : 7  Arret : 0.375654 s/iter 113.067528 
385 gpu 0 iter : 8  Arret : 1.04032 s/iter 113.381487 
386 gpu 0 iter : 9  Arret : 1.12875 s/iter 114.128347 
387 gpu 0 iter : 10  Arret : 12.358 s/iter 114.591594 
388 gpu 0 iter : 11  Arret : 1.18398 s/iter 114.167437 
389 gpu 0 iter : 12  Arret : 4.45048 s/iter 113.754284 
390 gpu 0 iter : 13  Arret : 5.09703 s/iter 112.914247 
391 gpu 0 iter : 14  Arret : 1.04453 s/iter 112.076259 
392 gpu 0 iter : 15  Arret : 3.05711 s/iter 111.467739 
393 gpu 0 iter : 16  Arret : 0.859735 s/iter 110.945464 
394 gpu 0 iter : 17  Arret : 4.25309 s/iter 110.793391 
395 gpu 0 iter : 18  Arret : 0.893951 s/iter 110.388272 
396 gpu 0 iter : 19  Arret : 0.603038 s/iter 110.132291 
397 gpu 0 iter : 20  Arret : 3.09335 s/iter 109.413247 
398 gpu 0 iter : 21  Arret : 1.28616 s/iter 109.106140 
399 gpu 0 iter : 22  Arret : 2.25952 s/iter 109.082492 
400 gpu 0 iter : 23  Arret : 1.67614 s/iter 108.802369 
401 gpu 0 iter : 24  Arret : 0.645561 s/iter 108.387380 
402 gpu 0 iter : 25  Arret : 0.661038 s/iter 108.106268 
403 gpu 0 iter : 26  Arret : 0.728448 s/iter 107.627940 
404 gpu 0 iter : 27  Arret : 0.456849 s/iter 107.304474 
405 gpu 0 iter : 28  Arret : 0.254278 s/iter 106.811137 
406 gpu 0 iter : 29  Arret : 0.111958 s/iter 106.339104 
407 gpu 0 iter : 30  Arret : 0.0531874 s/iter 105.891059 
408 gpu 0 iter : 31  Arret : 0.0531871 s/iter 105.523621 
409 gpu 0 iter : 32  Arret : 0.013254 s/iter 105.034027 
410 gpu 0 iter : 33  Arret : 0.00334602 s/iter 104.894966 
411 gpu 0 iter : 34  Arret : 0.00027649 s/iter 104.840988 
412 gpu 0 iter : 35  Arret : 1.17344E-07 s/iter 104.858305 
413 gpu 0 iter : 36  Arret : 4.79311E-10 s/iter 104.840632 
414 gpu 0 iter : 37  Arret : 1.90774E-12 s/iter 104.820758 
415 gpu 0 iter : 38  Arret : 8.88875E-15 s/iter 104.804403 
416 temps : 4148.3 seconde(s)
417 Nb iterations : 38
418 Nb de depassements de capacite exponentielle : 0
419 Precision :     2.76717E-08
420 Stabilite :     8.88875E-15
421 +---+----------------------------+------------+----------------------------+
422 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
423 +---+----------------------------+------------+----------------------------+
424 |  1|    0.540312 +i*    0.841461|    0.999997|-2.16913E-11 +i* 1.91294E-11|
425 |  2|    0.513645 +i*    0.857999|    0.999997|-6.29718E-12 +i*-2.39364E-12|
426 |  3|    0.486457 +i*    0.873701|    0.999997| 1.53235E-11 +i* 6.36435E-13|
427 |  4|    0.458797 +i*    0.888537|    0.999997| 1.72345E-11 +i* 1.48229E-11|
428 |  5|    0.430698 +i*    0.902501|           1| 9.83414E-09 +i*-4.46881E-09|
429 |  6|    0.402138 +i*    0.915584|           1|-5.37264E-09 +i* 9.04446E-09|
430 |  7|      0.3732 +i*    0.927747|    0.999997|-1.54374E-11 +i*-2.76083E-11|
431 |  8|      0.3439 +i*    0.939003|    0.999997|-1.12714E-11 +i*  1.5453E-11|
432 |  9|    0.314261 +i*    0.949333|    0.999997| 1.93628E-11 +i* 2.50909E-11|
433 | 10|    0.284313 +i*    0.958728|    0.999997| 2.69426E-11 +i* 2.77974E-11|
434 | 11|    0.254084 +i*    0.967179|    0.999997|  1.5277E-11 +i* 4.73027E-12|
435 | 12|    0.223605 +i*    0.974676|    0.999997| -8.1017E-11 +i*-3.77299E-11|
436 | 13|    0.192915 +i*    0.981212|    0.999997| 1.07495E-11 +i*   5.766E-12|
437 | 14|    0.162034 +i*    0.986782|    0.999997| 3.99512E-11 +i* 6.63664E-12|
438 | 15|    0.130977 +i*    0.991382|    0.999997| 5.89659E-11 +i* 7.29122E-12|
439 | 16|   0.0997987 +i*    0.995004|    0.999997|-2.34084E-11 +i*-4.34534E-12|
440 | 17|   0.0685225 +i*    0.997646|    0.999997| 2.33641E-11 +i* 2.51787E-12|
441 | 18|   0.0371629 +i*    0.999314|           1| 1.55887E-09 +i*-4.23222E-09|
442 | 19|  0.00578048 +i*     0.99998|    0.999997| 3.46787E-11 +i* 1.94857E-13|
443 | 20|  -0.0256056 +i*    0.999669|    0.999997| 2.01068E-11 +i*-1.22213E-12|
444 +---+----------------------------+------------+----------------------------+
445 700000 racines de module = 0.999997
446 500000 racines de module = 1
447 (1 +i*0)*x^0 + (-0.1 +i*0)*x^600000 + (-10 +i*0)*x^800000 + (1 +i*0)*x^1400000
448  
449 (-60000 +i*0)*x^599999 + (-8E+06 +i*0)*x^799999 + (1.4E+06 +i*0)*x^1399999
450  
451 zone limite de 'log-exp' 1.00025
452 CPU thread 0 (of 1) uses CUDA device 0
453 gpu 0 dimgrid 5469 dimblock 256  degrePoly 1400000
454 gpu 0 dimgrid2 5469 start 0  size 1400064
455 gpu 0 iter : 1  Arret : 0.00928965 s/iter 142.375846 
456 gpu 0 iter : 2  Arret : 0.576413 s/iter 147.373084 
457 gpu 0 iter : 3  Arret : 0.762551 s/iter 150.232559 
458 gpu 0 iter : 4  Arret : 1.07413 s/iter 151.768093 
459 gpu 0 iter : 5  Arret : 0.0991065 s/iter 153.056251 
460 gpu 0 iter : 6  Arret : 0.123507 s/iter 152.742000 
461 gpu 0 iter : 7  Arret : 0.136183 s/iter 152.857808 
462 gpu 0 iter : 8  Arret : 0.113786 s/iter 152.881427 
463 gpu 0 iter : 9  Arret : 0.0800623 s/iter 152.835777 
464 gpu 0 iter : 10  Arret : 0.0571798 s/iter 151.922898 
465 gpu 0 iter : 11  Arret : 0.0727241 s/iter 150.276395 
466 gpu 0 iter : 12  Arret : 0.0702862 s/iter 147.770220 
467 gpu 0 iter : 13  Arret : 0.0246309 s/iter 145.850735 
468 gpu 0 iter : 14  Arret : 0.0213611 s/iter 144.099565 
469 gpu 0 iter : 15  Arret : 0.0247135 s/iter 143.346943 
470 gpu 0 iter : 16  Arret : 0.0164575 s/iter 142.914262 
471 gpu 0 iter : 17  Arret : 0.00452215 s/iter 142.729324 
472 gpu 0 iter : 18  Arret : 0.00260492 s/iter 142.530031 
473 gpu 0 iter : 19  Arret : 0.000151029 s/iter 142.510219 
474 gpu 0 iter : 20  Arret : 1.40988E-06 s/iter 142.510180 
475 gpu 0 iter : 21  Arret : 1.38776E-08 s/iter 142.480080 
476 gpu 0 iter : 22  Arret : 1.91581E-10 s/iter 142.453226 
477 gpu 0 iter : 23  Arret : 2.63708E-12 s/iter 142.412633 
478 gpu 0 iter : 24  Arret : 3.63243E-14 s/iter 142.487841 
479 temps : 3523.14 seconde(s)
480 Nb iterations : 24
481 Nb de depassements de capacite exponentielle : 0
482 Precision :     2.65661E-08
483 Stabilite :     3.63243E-14
484 +---+----------------------------+------------+----------------------------+
485 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
486 +---+----------------------------+------------+----------------------------+
487 |  1|      0.5403 +i*    0.841469|    0.999997|-8.47142E-11 +i* 1.92466E-11|
488 |  2|    0.513623 +i*    0.858013|    0.999997|-2.15776E-11 +i*-2.98557E-11|
489 |  3|    -0.52703 +i*   -0.849843|    0.999997|-6.50922E-11 +i* 8.44216E-12|
490 |  4|    0.486439 +i*    0.873711|    0.999997| 5.60277E-11 +i* 4.36779E-11|
491 |  5|   -0.500096 +i*   -0.865967|    0.999997| 3.56147E-11 +i*-3.12713E-11|
492 |  6|    0.458776 +i*    0.888549|    0.999997|-1.89702E-11 +i* 4.08274E-12|
493 |  7|   -0.472669 +i*   -0.881237|    0.999997|-1.66496E-11 +i*-3.61498E-11|
494 |  8|    0.430661 +i*    0.902511|    0.999997|-1.60558E-11 +i*-1.29949E-11|
495 |  9|   -0.444791 +i*   -0.895631|    0.999997| 3.68259E-11 +i* 1.36002E-12|
496 | 10|    0.402136 +i*    0.915577|    0.999997|  6.5834E-12 +i* -1.3935E-11|
497 | 11|   -0.416439 +i*    -0.90916|    0.999997|-1.66807E-11 +i* 2.56219E-11|
498 | 12|    0.373179 +i*    0.927756|    0.999997| 2.89372E-11 +i*-2.61371E-11|
499 | 13|   -0.387698 +i*   -0.921783|    0.999997|-1.86324E-11 +i* -4.6545E-11|
500 | 14|    0.343875 +i*    0.939012|    0.999997| 3.06317E-11 +i* 7.08794E-11|
501 | 15|   -0.358575 +i*   -0.933498|    0.999997|-4.93405E-11 +i*-7.15173E-13|
502 | 16|    0.314233 +i*    0.949343|    0.999997| 3.86503E-11 +i* 2.08775E-11|
503 | 17|   -0.329098 +i*   -0.944293|    0.999997|-1.57903E-11 +i* 2.05052E-11|
504 | 18|    0.284281 +i*    0.958738|    0.999997| 2.51592E-11 +i* 2.09243E-11|
505 | 19|   -0.299297 +i*   -0.954157|    0.999997| 5.03608E-12 +i* 1.70503E-11|
506 | 20|    0.254048 +i*    0.967189|    0.999997|-2.81228E-11 +i*-1.66302E-11|
507 +---+----------------------------+------------+----------------------------+
508 800000 racines de module = 0.999997
509 600000 racines de module = 1
510 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140100: line 23: 13069 Segmentation fault      (core dumped) ./template -r -i 900000 700000
511 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140100: line 24: 13073 Segmentation fault      (core dumped) ./template -r -i 1000000 800000
512 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140100: line 25: 13075 Segmentation fault      (core dumped) ./template -r -i 1500000 500000