]> AND Private Git Repository - kahina_paper2.git/blob - Simulations/sparse_openmp/sparse_openmp_2GPU.o140099
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
commenter fig 4
[kahina_paper2.git] / Simulations / sparse_openmp / sparse_openmp_2GPU.o140099
1 REMAINING: 2
2 Taking GPU #0
3 Taking GPU #1
4 (1 +i*0)*x^0 + (-0.1 +i*0)*x^40000 + (-10 +i*0)*x^60000 + (1 +i*0)*x^100000
5  
6 (-4000 +i*0)*x^39999 + (-600000 +i*0)*x^59999 + (100000 +i*0)*x^99999
7  
8 zone limite de 'log-exp' 1.00356
9 CPU thread 1 (of 2) uses CUDA device 1
10 CPU thread 0 (of 2) uses CUDA device 0
11 gpu 0 dimgrid 391 dimblock 256  degrePoly 100000
12 gpu 0 dimgrid2 196 start 0  size 50048
13 gpu 1 dimgrid 391 dimblock 256  degrePoly 100000
14 gpu 1 dimgrid2 196 start 50048  size 50048
15 gpu 0 iter : 1  Arret : 0.00380313 s/iter 0.441566 
16 gpu 0 iter : 2  Arret : 0.00367222 s/iter 0.441506 
17 gpu 0 iter : 3  Arret : 0.00329063 s/iter 0.441545 
18 gpu 0 iter : 4  Arret : 0.00599232 s/iter 0.441517 
19 gpu 0 iter : 5  Arret : 0.00559475 s/iter 0.441533 
20 gpu 0 iter : 6  Arret : 0.0062995 s/iter 0.441538 
21 gpu 0 iter : 7  Arret : 0.00458799 s/iter 0.441558 
22 gpu 0 iter : 8  Arret : 0.00622521 s/iter 0.441510 
23 gpu 0 iter : 9  Arret : 0.0073983 s/iter 0.439550 
24 gpu 0 iter : 10  Arret : 0.00804763 s/iter 0.441536 
25 gpu 0 iter : 11  Arret : 0.00548469 s/iter 0.441528 
26 gpu 0 iter : 12  Arret : 0.00120813 s/iter 0.441416 
27 gpu 0 iter : 13  Arret : 0.000406962 s/iter 0.441414 
28 gpu 0 iter : 14  Arret : 0.00112455 s/iter 0.441391 
29 gpu 0 iter : 15  Arret : 0.000729656 s/iter 0.441398 
30 gpu 0 iter : 16  Arret : 6.06095E-06 s/iter 0.441340 
31 gpu 0 iter : 17  Arret : 1.51135E-08 s/iter 0.441471 
32 gpu 0 iter : 18  Arret : 4.78213E-11 s/iter 0.441372 
33 gpu 0 iter : 19  Arret : 1.51316E-13 s/iter 0.441309 
34 temps : 9.12342 seconde(s)
35 Nb iterations : 19
36 Nb de depassements de capacite exponentielle : 0
37 Precision :     6.21439E-09
38 Stabilite :     1.51316E-13
39 +---+----------------------------+------------+----------------------------+
40 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
41 +---+----------------------------+------------+----------------------------+
42 |  1|     0.54036 +i*    0.841503|     1.00006|-5.00602E-11 +i*  9.0853E-12|
43 |  2|   -0.113164 +i*    0.993538|    0.999962|-4.34919E-12 +i* 9.60242E-13|
44 |  3|   -0.226732 +i*   -0.974016|     1.00006|-1.34468E-09 +i*-3.70749E-10|
45 |  4|   -0.715763 +i*    0.698289|    0.999962| 9.11271E-13 +i* 2.47219E-12|
46 |  5|    0.439922 +i*   -0.897993|    0.999962|-3.49498E-13 +i* 1.66432E-12|
47 |  6|   -0.996122 +i*   0.0886386|     1.00006| 4.72785E-10 +i* 4.13616E-11|
48 |  7|    0.908546 +i*   -0.417692|    0.999962| 4.78506E-13 +i* 1.54377E-13|
49 |  8|   -0.827813 +i*   -0.560935|    0.999962| 9.76996E-13 +i*-2.04309E-12|
50 |  9|    0.968129 +i*    0.250682|     1.00006| 1.35693E-10 +i*-3.47657E-10|
51 | 10|   -0.286842 +i*   -0.958038|     1.00006|-5.93554E-10 +i*-2.45345E-10|
52 | 11|    0.591653 +i*    0.806145|    0.999962|-9.87654E-13 +i*-3.03635E-12|
53 | 12|  -0.0511836 +i*    0.998651|    0.999962|-2.22622E-12 +i*-3.69013E-14|
54 | 13|    -0.67097 +i*    0.741432|    0.999962|-8.03801E-14 +i*-1.68204E-12|
55 | 14|    0.383249 +i*   -0.923603|    0.999962|-1.29119E-12 +i*-1.37426E-12|
56 | 15|   -0.988685 +i*     0.15039|     1.00006|-1.61051E-10 +i* 7.18515E-11|
57 | 16|    0.880824 +i*   -0.473363|    0.999962| 1.58029E-12 +i*-2.34379E-12|
58 | 17|   -0.861082 +i*   -0.508391|    0.999962| 1.02962E-12 +i*-4.51911E-12|
59 | 18|    0.981895 +i*    0.189225|    0.999962|-4.05187E-12 +i* 1.36536E-13|
60 | 19|   -0.345842 +i*   -0.938354|     1.00006| 1.38421E-10 +i*-2.31696E-10|
61 | 20|    0.640621 +i*    0.767807|    0.999962|-6.98774E-13 +i* 1.13798E-12|
62 +---+----------------------------+------------+----------------------------+
63 40000 racines de module = 1.00006
64 60000 racines de module = 0.999962
65 (1 +i*0)*x^0 + (-0.1 +i*0)*x^50000 + (-10 +i*0)*x^150000 + (1 +i*0)*x^200000
66  
67 (-5000 +i*0)*x^49999 + (-1.5E+06 +i*0)*x^149999 + (200000 +i*0)*x^199999
68  
69 zone limite de 'log-exp' 1.00178
70 CPU thread 0 (of 2) uses CUDA device 0
71 CPU thread 1 (of 2) uses CUDA device 1
72 gpu 1 dimgrid 782 dimblock 256  degrePoly 200000
73 gpu 1 dimgrid2 391 start 100096  size 100096
74 gpu 0 dimgrid 782 dimblock 256  degrePoly 200000
75 gpu 0 dimgrid2 391 start 0  size 100096
76 gpu 0 iter : 1  Arret : 0.000107626 s/iter 1.547978 
77 gpu 0 iter : 2  Arret : 9.81369E-05 s/iter 1.548082 
78 gpu 0 iter : 3  Arret : 0.000765995 s/iter 1.548065 
79 gpu 0 iter : 4  Arret : 0.000973277 s/iter 1.548057 
80 gpu 0 iter : 5  Arret : 0.00848586 s/iter 1.548089 
81 gpu 0 iter : 6  Arret : 0.0120973 s/iter 1.707264 
82 gpu 0 iter : 7  Arret : 0.029256 s/iter 1.698285 
83 gpu 0 iter : 8  Arret : 0.134426 s/iter 1.548025 
84 gpu 0 iter : 9  Arret : 0.152262 s/iter 1.549290 
85 gpu 0 iter : 10  Arret : 0.121741 s/iter 1.710977 
86 gpu 0 iter : 11  Arret : 0.196968 s/iter 1.549235 
87 gpu 0 iter : 12  Arret : 0.832961 s/iter 1.703810 
88 gpu 0 iter : 13  Arret : 0.389199 s/iter 1.552020 
89 gpu 0 iter : 14  Arret : 0.303622 s/iter 1.712838 
90 gpu 0 iter : 15  Arret : 0.0708981 s/iter 1.549269 
91 gpu 0 iter : 16  Arret : 0.0516286 s/iter 1.547858 
92 gpu 0 iter : 17  Arret : 0.0237403 s/iter 1.547965 
93 gpu 0 iter : 18  Arret : 0.00575736 s/iter 1.548048 
94 gpu 0 iter : 19  Arret : 0.00016543 s/iter 1.547970 
95 gpu 0 iter : 20  Arret : 8.19796E-06 s/iter 1.547960 
96 gpu 0 iter : 21  Arret : 1.89926E-09 s/iter 1.548018 
97 gpu 0 iter : 22  Arret : 1.89968E-13 s/iter 1.548057 
98 temps : 35.62 seconde(s)
99 Nb iterations : 22
100 Nb de depassements de capacite exponentielle : 0
101 Precision :     9.49941E-05
102 Stabilite :     5.04191E-14
103 +---+----------------------------+------------+----------------------------+
104 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
105 +---+----------------------------+------------+----------------------------+
106 |  1|    0.540303 +i*    0.841453|    0.999985| 1.08703E-11 +i*-2.49217E-12|
107 |  2|   -0.837195 +i*    0.546877|    0.999985| -5.4492E-12 +i* 1.09163E-12|
108 |  3|   -0.553418 +i*   -0.832885|    0.999985| -1.9722E-12 +i*-7.40397E-12|
109 |  4|    0.828599 +i*   -0.559925|     1.00005|-7.54521E-09 +i* 1.47059E-08|
110 |  5|     -0.8197 +i*    0.572767|    0.999985|-4.21663E-13 +i* -2.8616E-12|
111 |  6|    -0.57917 +i*   -0.815188|    0.999985|-5.13034E-12 +i*-1.52645E-12|
112 |  7|    0.810626 +i*   -0.585537|    0.999985|-6.36846E-12 +i*-5.86797E-12|
113 |  8|    0.591872 +i*    0.806089|     1.00005|-1.69803E-09 +i* 9.43795E-09|
114 |  9|   -0.801454 +i*    0.598134|     1.00005|-3.72767E-08 +i*-1.30274E-08|
115 | 10|   -0.604356 +i*   -0.796695|    0.999985|-1.64091E-13 +i* 1.59084E-12|
116 | 11|    0.791937 +i*   -0.610578|    0.999985|  6.0707E-13 +i* 1.52922E-12|
117 | 12|    0.616763 +i*     0.78713|    0.999985|-4.48042E-12 +i* -2.6295E-12|
118 | 13|   -0.782301 +i*    0.622877|    0.999985|-2.15827E-12 +i*-6.27114E-12|
119 | 14|   -0.628991 +i*   -0.777472|     1.00005| 6.93065E-09 +i*-8.65443E-09|
120 | 15|    0.772474 +i*   -0.635023|    0.999985| 1.54783E-11 +i*-1.81338E-12|
121 | 16|    0.641054 +i*    0.767476|    0.999985| 9.05009E-12 +i*-2.91295E-12|
122 | 17|   -0.762458 +i*    0.647014|    0.999985| 5.81724E-12 +i*-9.99384E-12|
123 | 18|   -0.652967 +i*   -0.757366|    0.999985|-6.31406E-12 +i* 8.49495E-12|
124 | 19|    0.752302 +i*   -0.658888|     1.00005| 3.99107E-09 +i* 1.02117E-08|
125 | 20|     0.66472 +i*    0.747072|    0.999985|-7.79776E-12 +i*-2.52076E-13|
126 +---+----------------------------+------------+----------------------------+
127 150000 racines de module = 0.999985
128 50000 racines de module = 1.00005
129 (1 +i*0)*x^0 + (-0.1 +i*0)*x^150000 + (-10 +i*0)*x^250000 + (1 +i*0)*x^400000
130  
131 (-15000 +i*0)*x^149999 + (-2.5E+06 +i*0)*x^249999 + (400000 +i*0)*x^399999
132  
133 zone limite de 'log-exp' 1.00089
134 CPU thread 0 (of 2) uses CUDA device 0
135 CPU thread 1 (of 2) uses CUDA device 1
136 gpu 0 dimgrid 1563 dimblock 256  degrePoly 400000
137 gpu 0 dimgrid2 782 start 0  size 200064
138 gpu 1 dimgrid 1563 dimblock 256  degrePoly 400000
139 gpu 1 dimgrid2 782 start 200064  size 200064
140 gpu 0 iter : 1  Arret : 0.000533421 s/iter 6.081044 
141 gpu 0 iter : 2  Arret : 0.00294166 s/iter 6.077042 
142 gpu 0 iter : 3  Arret : 0.00816274 s/iter 6.076551 
143 gpu 0 iter : 4  Arret : 0.0970896 s/iter 6.051363 
144 gpu 0 iter : 5  Arret : 0.1861 s/iter 6.117092 
145 gpu 0 iter : 6  Arret : 0.205221 s/iter 6.087839 
146 gpu 0 iter : 7  Arret : 0.0897097 s/iter 6.084694 
147 gpu 0 iter : 8  Arret : 0.0591358 s/iter 6.078173 
148 gpu 0 iter : 9  Arret : 0.023858 s/iter 6.079091 
149 gpu 0 iter : 10  Arret : 0.00304425 s/iter 6.076912 
150 gpu 0 iter : 11  Arret : 0.00136708 s/iter 6.063903 
151 gpu 0 iter : 12  Arret : 0.000789721 s/iter 6.076452 
152 gpu 0 iter : 13  Arret : 0.00195862 s/iter 6.078631 
153 gpu 0 iter : 14  Arret : 0.00243823 s/iter 6.075599 
154 gpu 0 iter : 15  Arret : 0.000282668 s/iter 6.076158 
155 gpu 0 iter : 16  Arret : 4.27745E-05 s/iter 6.075788 
156 gpu 0 iter : 17  Arret : 4.20725E-06 s/iter 6.077506 
157 gpu 0 iter : 18  Arret : 1.6828E-08 s/iter 6.078853 
158 gpu 0 iter : 19  Arret : 3.63614E-11 s/iter 6.079236 
159 gpu 0 iter : 20  Arret : 1.38589E-13 s/iter 6.077430 
160 temps : 122.327 seconde(s)
161 Nb iterations : 20
162 Nb de depassements de capacite exponentielle : 0
163 Precision :     3.45366E-07
164 Stabilite :     1.02274E-13
165 +---+----------------------------+------------+----------------------------+
166 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
167 +---+----------------------------+------------+----------------------------+
168 |  1|    0.540319 +i*    0.841478|     1.00002|-2.32809E-09 +i* 1.97672E-09|
169 |  2|   -0.998329 +i*    0.057622|    0.999991| 4.43912E-12 +i* 1.27665E-12|
170 |  3|     0.43989 +i*   -0.898041|    0.999991|-2.08855E-12 +i*-1.75276E-12|
171 |  4|   -0.996033 +i*   0.0888768|    0.999991|-3.15592E-12 +i* 1.17456E-12|
172 |  5|    0.411533 +i*   -0.911385|    0.999991|-2.45048E-12 +i*  4.6238E-12|
173 |  6|     0.59196 +i*    0.805956|    0.999991| 5.24358E-13 +i*-8.53073E-12|
174 |  7|   -0.992759 +i*    0.120044|    0.999991| 2.58804E-12 +i* 2.47274E-12|
175 |  8|    0.382796 +i*   -0.923823|    0.999991| 1.11042E-11 +i*-9.27687E-12|
176 |  9|    0.616925 +i*     0.78701|    0.999991| 4.27514E-12 +i*-1.13966E-11|
177 | 10|    -0.98851 +i*    0.151094|    0.999991|-1.29017E-11 +i*-4.43427E-12|
178 | 11|     0.35366 +i*   -0.935364|    0.999991|-1.92664E-11 +i* 1.19958E-11|
179 | 12|    0.641283 +i*    0.767292|    0.999991|-4.70735E-12 +i* -1.4127E-11|
180 | 13|    -0.98329 +i*    0.181995|    0.999991|-6.62759E-12 +i*-5.46796E-12|
181 | 14|    0.324176 +i*   -0.945987|    0.999991|-5.20695E-12 +i*-7.06984E-12|
182 | 15|    0.665012 +i*    0.746821|    0.999991| 5.27178E-12 +i*-4.27913E-12|
183 | 16|   -0.977104 +i*    0.212717|    0.999991|-1.01148E-11 +i* 2.41479E-12|
184 | 17|    0.294374 +i*   -0.955681|    0.999991|-2.37395E-11 +i*-2.53098E-12|
185 | 18|    0.688087 +i*    0.725616|    0.999991| 6.67011E-12 +i* 1.57173E-11|
186 | 19|   -0.969965 +i*    0.243206|    0.999991| 6.88072E-12 +i* 3.20268E-13|
187 | 20|    0.264283 +i*   -0.964436|    0.999991|-6.93356E-12 +i*-6.23118E-12|
188 +---+----------------------------+------------+----------------------------+
189 150000 racines de module = 1.00002
190 250000 racines de module = 0.999991
191 (1 +i*0)*x^0 + (-0.1 +i*0)*x^250000 + (-10 +i*0)*x^350000 + (1 +i*0)*x^600000
192  
193 (-25000 +i*0)*x^249999 + (-3.5E+06 +i*0)*x^349999 + (600000 +i*0)*x^599999
194  
195 zone limite de 'log-exp' 1.00059
196 CPU thread 0 (of 2) uses CUDA device 0
197 CPU thread 1 (of 2) uses CUDA device 1
198 gpu 0 dimgrid 2344 dimblock 256  degrePoly 600000
199 gpu 0 dimgrid2 1172 start 0  size 300032
200 gpu 1 dimgrid 2344 dimblock 256  degrePoly 600000
201 gpu 1 dimgrid2 1172 start 300032  size 300032
202 gpu 0 iter : 1  Arret : 0.00183894 s/iter 13.264868 
203 gpu 0 iter : 2  Arret : 0.00332589 s/iter 13.263027 
204 gpu 0 iter : 3  Arret : 0.0778545 s/iter 13.329862 
205 gpu 0 iter : 4  Arret : 0.134953 s/iter 13.784249 
206 gpu 0 iter : 5  Arret : 0.100777 s/iter 14.153947 
207 gpu 0 iter : 6  Arret : 0.107368 s/iter 13.911608 
208 gpu 0 iter : 7  Arret : 0.112184 s/iter 13.982400 
209 gpu 0 iter : 8  Arret : 0.0819523 s/iter 13.863669 
210 gpu 0 iter : 9  Arret : 0.0470621 s/iter 13.750970 
211 gpu 0 iter : 10  Arret : 0.0265395 s/iter 13.686381 
212 gpu 0 iter : 11  Arret : 0.0114418 s/iter 13.768352 
213 gpu 0 iter : 12  Arret : 0.0132102 s/iter 13.687711 
214 gpu 0 iter : 13  Arret : 0.0107799 s/iter 13.263263 
215 gpu 0 iter : 14  Arret : 0.00702915 s/iter 13.271004 
216 gpu 0 iter : 15  Arret : 0.00272883 s/iter 13.265259 
217 gpu 0 iter : 16  Arret : 0.000385595 s/iter 13.264764 
218 gpu 0 iter : 17  Arret : 0.000332015 s/iter 13.264693 
219 gpu 0 iter : 18  Arret : 0.000909613 s/iter 13.264925 
220 gpu 0 iter : 19  Arret : 9.10926E-07 s/iter 13.264547 
221 gpu 0 iter : 20  Arret : 4.37366E-09 s/iter 13.265195 
222 gpu 0 iter : 21  Arret : 1.73951E-11 s/iter 13.264664 
223 gpu 0 iter : 22  Arret : 6.9226E-14 s/iter 13.264587 
224 temps : 297.898 seconde(s)
225 Nb iterations : 22
226 Nb de depassements de capacite exponentielle : 0
227 Precision :     1.80963E-08
228 Stabilite :     6.9226E-14
229 +---+----------------------------+------------+----------------------------+
230 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
231 +---+----------------------------+------------+----------------------------+
232 |  1|    0.540302 +i*    0.841463|    0.999993| 8.34199E-12 +i* -1.9051E-11|
233 |  2|   -0.553438 +i*   -0.832883|    0.999993|-2.10654E-12 +i*-2.55273E-11|
234 |  3|   -0.579282 +i*   -0.815119|    0.999993|-1.44751E-12 +i* 7.66798E-12|
235 |  4|    0.592012 +i*    0.805941|     1.00001|  4.1526E-09 +i* 1.02046E-09|
236 |  5|   -0.604557 +i*   -0.796554|    0.999993|-2.82974E-12 +i* 9.99473E-12|
237 |  6|     0.61698 +i*     0.78697|    0.999993|-4.77973E-12 +i* 2.40621E-11|
238 |  7|   -0.629237 +i*   -0.777205|    0.999993|-2.92122E-12 +i*-4.85867E-12|
239 |  8|    0.641354 +i*    0.767237|    0.999993|-1.64209E-11 +i* 1.12904E-12|
240 |  9|   -0.653299 +i*   -0.757092|    0.999993|-8.22453E-13 +i* 2.82818E-12|
241 | 10|    0.665096 +i*    0.746749|    0.999993| -1.2145E-11 +i* 1.89129E-11|
242 | 11|   -0.676717 +i*   -0.736234|    0.999993|-1.26079E-11 +i*-1.25073E-11|
243 | 12|    0.688185 +i*    0.725526|    0.999993|-4.43978E-12 +i*-2.31382E-11|
244 | 13|   -0.699466 +i*   -0.714679|     1.00001| 3.92343E-10 +i*-3.02623E-09|
245 | 14|    0.710597 +i*     0.70359|    0.999993| -2.6851E-11 +i*-1.44801E-11|
246 | 15|   -0.721524 +i*    -0.69238|    0.999993| 2.63193E-11 +i*-6.76318E-13|
247 | 16|     0.73231 +i*    0.680962|    0.999993| 1.34706E-11 +i*-4.43489E-12|
248 | 17|   -0.742928 +i*   -0.669362|    0.999993| 3.04134E-12 +i*-9.84154E-12|
249 | 18|      0.7533 +i*    0.657691|     1.00001|-2.76219E-09 +i* 4.10298E-09|
250 | 19|    -0.76354 +i*    -0.64575|    0.999993| 2.24043E-11 +i*-1.30496E-12|
251 | 20|    0.773543 +i*    0.633733|    0.999993| 6.56308E-12 +i* 2.27492E-11|
252 +---+----------------------------+------------+----------------------------+
253 350000 racines de module = 0.999993
254 250000 racines de module = 1.00001
255 (1 +i*0)*x^0 + (-0.1 +i*0)*x^300000 + (-10 +i*0)*x^500000 + (1 +i*0)*x^800000
256  
257 (-30000 +i*0)*x^299999 + (-5E+06 +i*0)*x^499999 + (800000 +i*0)*x^799999
258  
259 zone limite de 'log-exp' 1.00044
260 CPU thread 0 (of 2) uses CUDA device 0
261 CPU thread 1 (of 2) uses CUDA device 1
262 gpu 1 dimgrid 3125 dimblock 256  degrePoly 800000
263 gpu 1 dimgrid2 1563 start 400000  size 400000
264 gpu 0 dimgrid 3125 dimblock 256  degrePoly 800000
265 gpu 0 dimgrid2 1563 start 0  size 400000
266 gpu 0 iter : 1  Arret : 0.000985945 s/iter 23.676133 
267 gpu 0 iter : 2  Arret : 0.00575711 s/iter 23.813100 
268 gpu 0 iter : 3  Arret : 0.80372 s/iter 23.766696 
269 gpu 0 iter : 4  Arret : 1.12755 s/iter 23.828097 
270 gpu 0 iter : 5  Arret : 0.927252 s/iter 23.871271 
271 gpu 0 iter : 6  Arret : 1.8727 s/iter 23.858341 
272 gpu 0 iter : 7  Arret : 1.02108 s/iter 24.362443 
273 gpu 0 iter : 8  Arret : 0.40485 s/iter 24.813205 
274 gpu 0 iter : 9  Arret : 0.204025 s/iter 24.848475 
275 gpu 0 iter : 10  Arret : 0.322307 s/iter 24.766030 
276 gpu 0 iter : 11  Arret : 0.966794 s/iter 24.450352 
277 gpu 0 iter : 12  Arret : 0.519786 s/iter 24.347418 
278 gpu 0 iter : 13  Arret : 0.209179 s/iter 24.204030 
279 gpu 0 iter : 14  Arret : 0.0738373 s/iter 23.789427 
280 gpu 0 iter : 15  Arret : 0.0394797 s/iter 23.786761 
281 gpu 0 iter : 16  Arret : 0.0224964 s/iter 23.792150 
282 gpu 0 iter : 17  Arret : 0.0104646 s/iter 23.802294 
283 gpu 0 iter : 18  Arret : 0.00882482 s/iter 23.804999 
284 gpu 0 iter : 19  Arret : 0.000586803 s/iter 23.663425 
285 gpu 0 iter : 20  Arret : 1.2904E-06 s/iter 23.667331 
286 gpu 0 iter : 21  Arret : 2.17443E-08 s/iter 23.669417 
287 gpu 0 iter : 22  Arret : 3.31651E-10 s/iter 23.663042 
288 gpu 0 iter : 23  Arret : 5.05742E-12 s/iter 23.667395 
289 gpu 0 iter : 24  Arret : 7.71156E-14 s/iter 23.671701 
290 temps : 576.437 seconde(s)
291 Nb iterations : 24
292 Nb de depassements de capacite exponentielle : 0
293 Precision :     3.80859E-08
294 Stabilite :     7.7914E-16
295 +---+----------------------------+------------+----------------------------+
296 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
297 +---+----------------------------+------------+----------------------------+
298 |  1|    0.540305 +i*    0.841464|    0.999995|-5.33817E-12 +i*-1.81878E-11|
299 |  2|    0.592014 +i*    0.805922|    0.999995|-1.82734E-11 +i* 2.10218E-11|
300 |  3|    0.617007 +i*    0.786952|    0.999995| 4.23442E-11 +i* -6.2147E-12|
301 |  4|    0.641392 +i*    0.767207|    0.999995|-4.99742E-11 +i* 1.43873E-11|
302 |  5|    0.665146 +i*    0.746707|    0.999995| 2.02977E-11 +i* 7.48579E-12|
303 |  6|    0.688245 +i*    0.725472|    0.999995|-1.73153E-11 +i* -1.2656E-11|
304 |  7|    0.710667 +i*    0.703522|    0.999995| 3.69782E-12 +i*  2.3081E-12|
305 |  8|    0.732388 +i*     0.68088|    0.999995| 9.45355E-12 +i* 2.09024E-11|
306 |  9|    0.753381 +i*    0.657577|    0.999995|-1.40248E-11 +i* 5.11502E-11|
307 | 10|     0.77364 +i*    0.633618|    0.999995|-1.72307E-11 +i* 1.22723E-11|
308 | 11|    0.793138 +i*    0.609034|    0.999995| 3.89222E-12 +i* 2.21356E-11|
309 | 12|    0.811855 +i*    0.583851|    0.999995|-1.28337E-11 +i*-5.47207E-12|
310 | 13|    0.829772 +i*    0.558094|    0.999995|-1.63114E-11 +i*-1.64246E-12|
311 | 14|    0.846873 +i*    0.531786|    0.999995|-1.80345E-12 +i* 5.96675E-11|
312 | 15|     0.86314 +i*    0.504956|    0.999995|-4.00413E-12 +i* 3.04823E-11|
313 | 16|    0.878557 +i*    0.477628|    0.999995|-2.16493E-12 +i* 1.10533E-11|
314 | 17|    0.893104 +i*    0.449841|    0.999995|-1.48552E-11 +i* 1.06063E-11|
315 | 18|    0.906777 +i*      0.4216|    0.999995|-1.38745E-11 +i* 5.33384E-12|
316 | 19|    0.919557 +i*    0.392944|    0.999995| 4.13796E-11 +i*-2.48189E-11|
317 | 20|    0.931433 +i*    0.363901|    0.999995| 4.93219E-11 +i*-2.82651E-11|
318 +---+----------------------------+------------+----------------------------+
319 500000 racines de module = 0.999995
320 300000 racines de module = 1.00001
321 (1 +i*0)*x^0 + (-0.1 +i*0)*x^400000 + (-10 +i*0)*x^600000 + (1 +i*0)*x^1000000
322  
323 (-40000 +i*0)*x^399999 + (-6E+06 +i*0)*x^599999 + (1E+06 +i*0)*x^999999
324  
325 zone limite de 'log-exp' 1.00035
326 CPU thread 0 (of 2) uses CUDA device 0
327 CPU thread 1 (of 2) uses CUDA device 1
328 gpu 0 dimgrid 3907 dimblock 256  degrePoly 1000000
329 gpu 0 dimgrid2 1954 start 0  size 500096
330 gpu 1 dimgrid 3907 dimblock 256  degrePoly 1000000
331 gpu 1 dimgrid2 1954 start 500096  size 500096
332 gpu 0 iter : 1  Arret : 0.000661333 s/iter 36.538739 
333 gpu 0 iter : 2  Arret : 0.00112864 s/iter 36.545395 
334 gpu 0 iter : 3  Arret : 0.00370767 s/iter 36.541300 
335 gpu 0 iter : 4  Arret : 0.00748235 s/iter 37.223998 
336 gpu 0 iter : 5  Arret : 0.0147148 s/iter 37.021293 
337 gpu 0 iter : 6  Arret : 0.0212816 s/iter 37.146418 
338 gpu 0 iter : 7  Arret : 0.00895178 s/iter 37.219267 
339 gpu 0 iter : 8  Arret : 0.00887668 s/iter 37.316626 
340 gpu 0 iter : 9  Arret : 0.00504713 s/iter 36.647500 
341 gpu 0 iter : 10  Arret : 0.00709815 s/iter 37.285606 
342 gpu 0 iter : 11  Arret : 0.00694487 s/iter 36.891551 
343 gpu 0 iter : 12  Arret : 0.00243476 s/iter 36.546690 
344 gpu 0 iter : 13  Arret : 0.00268555 s/iter 36.502800 
345 gpu 0 iter : 14  Arret : 0.000904871 s/iter 36.508349 
346 gpu 0 iter : 15  Arret : 0.0005848 s/iter 36.503946 
347 gpu 0 iter : 16  Arret : 8.64186E-05 s/iter 36.503619 
348 gpu 0 iter : 17  Arret : 8.33778E-05 s/iter 36.511641 
349 gpu 0 iter : 18  Arret : 1.10486E-05 s/iter 36.503510 
350 gpu 0 iter : 19  Arret : 1.76382E-05 s/iter 36.534320 
351 gpu 0 iter : 20  Arret : 1.2926E-06 s/iter 36.537729 
352 gpu 0 iter : 21  Arret : 5.95413E-09 s/iter 36.503894 
353 gpu 0 iter : 22  Arret : 1.88485E-11 s/iter 36.540363 
354 gpu 0 iter : 23  Arret : 5.96427E-14 s/iter 36.541307 
355 temps : 850.208 seconde(s)
356 Nb iterations : 23
357 Nb de depassements de capacite exponentielle : 0
358 Precision :     2.65132E-08
359 Stabilite :     5.96427E-14
360 +---+----------------------------+------------+----------------------------+
361 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
362 +---+----------------------------+------------+----------------------------+
363 |  1|      0.5403 +i*    0.841468|    0.999996| 5.07216E-12 +i* 6.41236E-12|
364 |  2|    0.529701 +i*     0.84818|    0.999996|-4.61853E-13 +i*-4.17888E-12|
365 |  3|    0.524361 +i*    0.851491|    0.999996|-2.47296E-11 +i* 1.78327E-11|
366 |  4|     0.51901 +i*    0.854764|    0.999996| 9.45599E-12 +i* 2.07434E-11|
367 |  5|    0.513629 +i*    0.858008|    0.999996| 2.32483E-11 +i* 6.70747E-12|
368 |  6|    0.508237 +i*    0.861213|    0.999996|-1.34339E-11 +i* 9.87854E-12|
369 |  7|    0.502825 +i*    0.864384|    0.999996|-3.18459E-11 +i* 7.64744E-12|
370 |  8|    0.497384 +i*    0.867526|    0.999996| 1.87346E-11 +i*  4.7471E-11|
371 |  9|    0.491932 +i*    0.870629|    0.999996|-1.74121E-11 +i*-2.86359E-11|
372 | 10|    0.486452 +i*    0.873703|    0.999996|  3.0312E-11 +i* 1.02214E-11|
373 | 11|    0.480962 +i*    0.876737|    0.999996| 1.81546E-11 +i* 8.04012E-12|
374 | 12|    0.475453 +i*    0.879736|    0.999996| 3.09861E-11 +i*   4.093E-12|
375 | 13|    0.469917 +i*    0.882706|    0.999996|-1.29106E-11 +i*-2.31489E-11|
376 | 14|     0.46437 +i*    0.885637|    0.999996| 1.38481E-11 +i*  -1.517E-11|
377 | 15|    0.458797 +i*    0.888537|    0.999996| 2.60997E-11 +i*-9.69844E-12|
378 | 16|    0.453214 +i*    0.891397|    0.999996| 2.45506E-11 +i*  3.1726E-11|
379 | 17|    0.447614 +i*    0.894223|    0.999996|-1.08491E-12 +i*-2.12277E-11|
380 | 18|    0.441986 +i*    0.897017|    0.999996| 2.72476E-11 +i* 3.22485E-11|
381 | 19|    0.436351 +i*    0.899772|    0.999996|-1.24334E-11 +i*-2.66317E-11|
382 | 20|    0.430689 +i*    0.902496|    0.999996| 2.73914E-12 +i* 2.25153E-11|
383 +---+----------------------------+------------+----------------------------+
384 600000 racines de module = 0.999996
385 400000 racines de module = 1.00001
386 (1 +i*0)*x^0 + (-0.1 +i*0)*x^500000 + (-10 +i*0)*x^700000 + (1 +i*0)*x^1200000
387  
388 (-50000 +i*0)*x^499999 + (-7E+06 +i*0)*x^699999 + (1.2E+06 +i*0)*x^1199999
389  
390 zone limite de 'log-exp' 1.0003
391 CPU thread 0 (of 2) uses CUDA device 0
392 CPU thread 1 (of 2) uses CUDA device 1
393 gpu 0 dimgrid 4688 dimblock 256  degrePoly 1200000
394 gpu 0 dimgrid2 2344 start 0  size 600064
395 gpu 1 dimgrid 4688 dimblock 256  degrePoly 1200000
396 gpu 1 dimgrid2 2344 start 600064  size 600064
397 gpu 0 iter : 1  Arret : 0.00780904 s/iter 52.957678 
398 gpu 0 iter : 2  Arret : 0.698753 s/iter 54.370408 
399 gpu 0 iter : 3  Arret : 0.512229 s/iter 55.903856 
400 gpu 0 iter : 4  Arret : 0.256495 s/iter 56.546686 
401 gpu 0 iter : 5  Arret : 0.481397 s/iter 56.384400 
402 gpu 0 iter : 6  Arret : 0.892443 s/iter 56.641431 
403 gpu 0 iter : 7  Arret : 1.58519 s/iter 56.603728 
404 gpu 0 iter : 8  Arret : 1.00461 s/iter 56.787414 
405 gpu 0 iter : 9  Arret : 0.667954 s/iter 56.936636 
406 gpu 0 iter : 10  Arret : 1.69048 s/iter 56.433809 
407 gpu 0 iter : 11  Arret : 0.673973 s/iter 56.247309 
408 gpu 0 iter : 12  Arret : 0.286904 s/iter 55.583712 
409 gpu 0 iter : 13  Arret : 0.809155 s/iter 54.972406 
410 gpu 0 iter : 14  Arret : 1.04967 s/iter 54.200475 
411 gpu 0 iter : 15  Arret : 0.767419 s/iter 54.073912 
412 gpu 0 iter : 16  Arret : 1.25055 s/iter 53.969523 
413 gpu 0 iter : 17  Arret : 0.313555 s/iter 53.619940 
414 gpu 0 iter : 18  Arret : 0.0612844 s/iter 53.103551 
415 gpu 0 iter : 19  Arret : 0.0812813 s/iter 53.087654 
416 gpu 0 iter : 20  Arret : 0.0798413 s/iter 52.895378 
417 gpu 0 iter : 21  Arret : 0.0193508 s/iter 52.929617 
418 gpu 0 iter : 22  Arret : 0.0112127 s/iter 52.923694 
419 gpu 0 iter : 23  Arret : 0.00926876 s/iter 52.906420 
420 gpu 0 iter : 24  Arret : 0.00234025 s/iter 52.924598 
421 gpu 0 iter : 25  Arret : 0.000902467 s/iter 52.922805 
422 gpu 0 iter : 26  Arret : 2.88058E-05 s/iter 52.927734 
423 gpu 0 iter : 27  Arret : 3.35406E-07 s/iter 52.973958 
424 gpu 0 iter : 28  Arret : 1.39702E-09 s/iter 52.974028 
425 gpu 0 iter : 29  Arret : 8.02785E-12 s/iter 52.966681 
426 gpu 0 iter : 30  Arret : 1.1441E-13 s/iter 52.951515 
427 temps : 1631.66 seconde(s)
428 Nb iterations : 30
429 Nb de depassements de capacite exponentielle : 0
430 Precision :     7.74574E-08
431 Stabilite :     2.21335E-14
432 +---+----------------------------+------------+----------------------------+
433 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
434 +---+----------------------------+------------+----------------------------+
435 |  1|    0.540304 +i*    0.841466|    0.999997| 3.08649E-11 +i* 2.05843E-11|
436 |  2|    0.513629 +i*    0.858008|    0.999997| 3.02357E-11 +i* 3.41858E-11|
437 |  3|    0.486451 +i*    0.873713|           1| 1.95054E-09 +i* 6.77633E-10|
438 |  4|    0.458805 +i*    0.888533|    0.999997| 1.78773E-11 +i* 1.55684E-11|
439 |  5|     0.43071 +i*    0.902487|    0.999997|-9.50928E-12 +i*-1.85143E-11|
440 |  6|    0.402126 +i*    0.915589|           1| 2.50282E-09 +i*-6.10471E-09|
441 |  7|      0.3732 +i*    0.927747|    0.999997| -2.5707E-11 +i* 3.11093E-13|
442 |  8|      0.3439 +i*    0.939003|    0.999997|-1.12714E-11 +i*  1.5453E-11|
443 |  9|    0.314261 +i*    0.949333|    0.999997| 1.93628E-11 +i* 2.50909E-11|
444 | 10|    0.284313 +i*    0.958728|    0.999997| 2.69426E-11 +i* 2.77974E-11|
445 | 11|    0.254084 +i*    0.967179|    0.999997|  1.5277E-11 +i* 4.73027E-12|
446 | 12|    0.223605 +i*    0.974676|    0.999997| -8.1017E-11 +i*-3.77299E-11|
447 | 13|    0.192909 +i*    0.981221|           1|-1.95729E-09 +i* 4.84549E-09|
448 | 14|    0.162017 +i*    0.986785|    0.999997| 4.59321E-12 +i*-4.42106E-13|
449 | 15|    0.130967 +i*    0.991391|           1|-1.93729E-10 +i*-4.06442E-10|
450 | 16|   0.0998077 +i*    0.995003|    0.999997| -4.5103E-11 +i*-6.66658E-12|
451 | 17|   0.0685225 +i*    0.997646|    0.999997| 2.33641E-11 +i* 2.51787E-12|
452 | 18|   0.0371504 +i*    0.999314|           1|-3.18728E-10 +i*-2.97119E-09|
453 | 19|  0.00578048 +i*     0.99998|    0.999997| 3.46787E-11 +i* 1.94857E-13|
454 | 20|  -0.0256056 +i*    0.999669|    0.999997| 2.01068E-11 +i*-1.22213E-12|
455 +---+----------------------------+------------+----------------------------+
456 700000 racines de module = 0.999997
457 500000 racines de module = 1
458 (1 +i*0)*x^0 + (-0.1 +i*0)*x^600000 + (-10 +i*0)*x^800000 + (1 +i*0)*x^1400000
459  
460 (-60000 +i*0)*x^599999 + (-8E+06 +i*0)*x^799999 + (1.4E+06 +i*0)*x^1399999
461  
462 zone limite de 'log-exp' 1.00025
463 CPU thread 1 (of 2) uses CUDA device 1
464 CPU thread 0 (of 2) uses CUDA device 0
465 gpu 1 dimgrid 5469 dimblock 256  degrePoly 1400000
466 gpu 1 dimgrid2 2735 start 700032  size 700032
467 gpu 0 dimgrid 5469 dimblock 256  degrePoly 1400000
468 gpu 0 dimgrid2 2735 start 0  size 700032
469 gpu 0 iter : 1  Arret : 0.00527111 s/iter 71.308499 
470 gpu 0 iter : 2  Arret : 0.172644 s/iter 72.713414 
471 gpu 0 iter : 3  Arret : 0.69639 s/iter 72.958242 
472 gpu 0 iter : 4  Arret : 1.18582 s/iter 75.255529 
473 gpu 0 iter : 5  Arret : 0.29345 s/iter 76.866618 
474 gpu 0 iter : 6  Arret : 0.163076 s/iter 77.369587 
475 gpu 0 iter : 7  Arret : 1.88246 s/iter 78.558083 
476 gpu 0 iter : 8  Arret : 1.71023 s/iter 77.826546 
477 gpu 0 iter : 9  Arret : 1.23231 s/iter 77.642649 
478 gpu 0 iter : 10  Arret : 0.367931 s/iter 79.759527 
479 gpu 0 iter : 11  Arret : 1.0997 s/iter 78.755024 
480 gpu 0 iter : 12  Arret : 2.11197 s/iter 77.725889 
481 gpu 0 iter : 13  Arret : 0.848296 s/iter 76.267112 
482 gpu 0 iter : 14  Arret : 0.433295 s/iter 75.435820 
483 gpu 0 iter : 15  Arret : 0.817759 s/iter 74.683488 
484 gpu 0 iter : 16  Arret : 0.767209 s/iter 74.057568 
485 gpu 0 iter : 17  Arret : 0.573024 s/iter 73.720984 
486 gpu 0 iter : 18  Arret : 0.597274 s/iter 73.499266 
487 gpu 0 iter : 19  Arret : 0.303085 s/iter 72.741656 
488 gpu 0 iter : 20  Arret : 0.180774 s/iter 72.806213 
489 gpu 0 iter : 21  Arret : 0.0722903 s/iter 72.559828 
490 gpu 0 iter : 22  Arret : 0.146427 s/iter 72.512488 
491 gpu 0 iter : 23  Arret : 0.129512 s/iter 72.128992 
492 gpu 0 iter : 24  Arret : 0.0402274 s/iter 71.576335 
493 gpu 0 iter : 25  Arret : 0.0124264 s/iter 71.526353 
494 gpu 0 iter : 26  Arret : 0.00203683 s/iter 71.463273 
495 gpu 0 iter : 27  Arret : 0.000373803 s/iter 71.462289 
496 gpu 0 iter : 28  Arret : 7.43881E-07 s/iter 71.336304 
497 gpu 0 iter : 29  Arret : 9.02153E-09 s/iter 71.333249 
498 gpu 0 iter : 30  Arret : 1.20401E-10 s/iter 71.481701 
499 gpu 0 iter : 31  Arret : 1.60504E-12 s/iter 71.339739 
500 gpu 0 iter : 32  Arret : 2.14019E-14 s/iter 71.437524 
501 temps : 2371.12 seconde(s)
502 Nb iterations : 32
503 Nb de depassements de capacite exponentielle : 0
504 Precision :     2.65661E-08
505 Stabilite :     5.97875E-16
506 +---+----------------------------+------------+----------------------------+
507 | i |            Zi              |   mod(Zi)  |            P(Zi)           |
508 +---+----------------------------+------------+----------------------------+
509 |  1|      0.5403 +i*    0.841469|    0.999997| 5.65794E-11 +i*-4.66756E-12|
510 |  2|    0.513623 +i*    0.858013|    0.999997|-2.15776E-11 +i*-2.98557E-11|
511 |  3|    -0.52703 +i*   -0.849843|    0.999997|-8.72191E-12 +i* 2.97079E-11|
512 |  4|    0.486439 +i*    0.873711|    0.999997| 5.60277E-11 +i* 4.36779E-11|
513 |  5|   -0.500096 +i*   -0.865967|    0.999997| 3.56147E-11 +i*-3.12713E-11|
514 |  6|    0.458776 +i*    0.888549|    0.999997|-1.89702E-11 +i* 4.08274E-12|
515 |  7|   -0.472669 +i*   -0.881237|    0.999997|-1.66496E-11 +i*-3.61498E-11|
516 |  8|    0.430661 +i*    0.902511|    0.999997|-1.60558E-11 +i*-1.29949E-11|
517 |  9|   -0.444791 +i*   -0.895631|    0.999997| 3.68259E-11 +i* 1.36002E-12|
518 | 10|    0.402136 +i*    0.915577|    0.999997|  6.5834E-12 +i* -1.3935E-11|
519 | 11|   -0.416432 +i*   -0.909164|    0.999997| 1.97816E-11 +i* 3.10848E-11|
520 | 12|    0.373171 +i*    0.927759|    0.999997|-2.17995E-11 +i*-2.96867E-12|
521 | 13|   -0.387698 +i*   -0.921783|    0.999997|-1.86324E-11 +i* -4.6545E-11|
522 | 14|    0.343875 +i*    0.939012|    0.999997| 3.84962E-11 +i* 2.59646E-11|
523 | 15|   -0.358575 +i*   -0.933498|    0.999997| 8.13599E-11 +i*-1.42233E-11|
524 | 16|    0.314233 +i*    0.949343|    0.999997| 3.86503E-11 +i* 2.08775E-11|
525 | 17|   -0.329098 +i*   -0.944293|    0.999997|-1.57903E-11 +i* 2.05052E-11|
526 | 18|    0.284281 +i*    0.958738|    0.999997| 2.51592E-11 +i* 2.09243E-11|
527 | 19|   -0.299297 +i*   -0.954157|    0.999997| 5.03608E-12 +i* 1.70503E-11|
528 | 20|    0.254048 +i*    0.967189|    0.999997|-2.81228E-11 +i*-1.66302E-11|
529 +---+----------------------------+------------+----------------------------+
530 800000 racines de module = 0.999997
531 600000 racines de module = 1
532 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140099: line 23: 12958 Segmentation fault      (core dumped) ./template -r -i 900000 700000
533 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140099: line 24: 12962 Segmentation fault      (core dumped) ./template -r -i 1000000 800000
534 /Softs/Sge/mesodell/spool/node1-50/job_scripts/140099: line 25: 12964 Segmentation fault      (core dumped) ./template -r -i 1500000 500000