]> AND Private Git Repository - kahina_paper2.git/blob - Simulations/BIG/sparse_openmp_4GPU.o140798
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
ajout du code du kernel
[kahina_paper2.git] / Simulations / BIG / sparse_openmp_4GPU.o140798
1 REMAINING: 4
2 Taking GPU #0
3 Taking GPU #1
4 Taking GPU #2
5 Taking GPU #3
6 (1 +i*0)*x^0 + (-0.1 +i*0)*x^450000 + (-10 +i*0)*x^750000 + (1 +i*0)*x^1200000
7  
8 (-45000 +i*0)*x^449999 + (-7.5E+06 +i*0)*x^749999 + (1.2E+06 +i*0)*x^1199999
9  
10 zone limite de 'log-exp' 1.0003
11 CPU thread 2 (of 4) uses CUDA device 2
12 CPU thread 1 (of 4) uses CUDA device 1
13 CPU thread 0 (of 4) uses CUDA device 0
14 CPU thread 3 (of 4) uses CUDA device 3
15 gpu 2 dimgrid 4688 dimblock 256  degrePoly 1200000
16 gpu 2 dimgrid2 1172 start 600064  size 300032
17 gpu 0 dimgrid 4688 dimblock 256  degrePoly 1200000
18 gpu 0 dimgrid2 1172 start 0  size 300032
19 gpu 1 dimgrid 4688 dimblock 256  degrePoly 1200000
20 gpu 1 dimgrid2 1172 start 300032  size 300032
21 gpu 3 dimgrid 4688 dimblock 256  degrePoly 1200000
22 gpu 3 dimgrid2 1172 start 900096  size 300032
23 gpu 0 iter : 1  Arret : 0.00258962 s/iter 26.827899 
24 gpu 0 iter : 2  Arret : 0.00986733 s/iter 26.734262 
25 gpu 0 iter : 3  Arret : 1.00309 s/iter 26.875480 
26 gpu 0 iter : 4  Arret : 1.00888 s/iter 26.839520 
27 gpu 0 iter : 5  Arret : 2.5903 s/iter 27.934856 
28 gpu 0 iter : 6  Arret : 2.37402 s/iter 27.441899 
29 gpu 0 iter : 7  Arret : 0.328667 s/iter 27.604107 
30 gpu 0 iter : 8  Arret : 0.229095 s/iter 27.860597 
31 gpu 0 iter : 9  Arret : 0.19497 s/iter 27.971677 
32 gpu 0 iter : 10  Arret : 0.164003 s/iter 28.895103 
33 gpu 0 iter : 11  Arret : 0.146769 s/iter 28.154589 
34 gpu 0 iter : 12  Arret : 0.141542 s/iter 27.787744 
35 gpu 0 iter : 13  Arret : 0.13035 s/iter 27.722678 
36 gpu 0 iter : 14  Arret : 0.125184 s/iter 27.642161 
37 gpu 0 iter : 15  Arret : 0.123971 s/iter 27.676039 
38 gpu 0 iter : 16  Arret : 0.124793 s/iter 27.541685 
39 gpu 0 iter : 17  Arret : 0.12594 s/iter 27.614293 
40 gpu 0 iter : 18  Arret : 0.128039 s/iter 27.665275 
41 gpu 0 iter : 19  Arret : 0.132043 s/iter 27.743370 
42 gpu 0 iter : 20  Arret : 0.138844 s/iter 27.682937 
43 gpu 0 iter : 21  Arret : 0.134995 s/iter 27.574432 
44 gpu 0 iter : 22  Arret : 0.146227 s/iter 27.683216 
45 gpu 0 iter : 23  Arret : 0.101316 s/iter 27.685417 
46 gpu 0 iter : 24  Arret : 0.0965641 s/iter 27.616963 
47 gpu 0 iter : 25  Arret : 0.0956392 s/iter 27.639845 
48 gpu 0 iter : 26  Arret : 0.107239 s/iter 27.629365 
49 gpu 0 iter : 27  Arret : 0.107475 s/iter 27.699761 
50 gpu 0 iter : 28  Arret : 0.0953323 s/iter 27.656435 
51 gpu 0 iter : 29  Arret : 0.09591 s/iter 27.588976 
52 gpu 0 iter : 30  Arret : 0.0966778 s/iter 27.661109 
53 gpu 0 iter : 31  Arret : 0.0977275 s/iter 27.762631 
54 gpu 0 iter : 32  Arret : 0.0990466 s/iter 27.686399 
55 gpu 0 iter : 33  Arret : 0.100221 s/iter 27.746296 
56 gpu 0 iter : 34  Arret : 0.0990477 s/iter 27.734201 
57 gpu 0 iter : 35  Arret : 0.0908046 s/iter 27.800281 
58 gpu 0 iter : 36  Arret : 0.0868311 s/iter 27.708798 
59 gpu 0 iter : 37  Arret : 0.0863073 s/iter 27.667143 
60 gpu 0 iter : 38  Arret : 0.0861844 s/iter 27.628118 
61 gpu 0 iter : 39  Arret : 0.0862547 s/iter 27.577567 
62 gpu 0 iter : 40  Arret : 0.0865435 s/iter 27.695190 
63 gpu 0 iter : 41  Arret : 0.087011 s/iter 27.693141 
64 gpu 0 iter : 42  Arret : 0.0874144 s/iter 27.785899 
65 gpu 0 iter : 43  Arret : 0.0874339 s/iter 27.639840 
66 gpu 0 iter : 44  Arret : 0.0859151 s/iter 27.652549 
67 gpu 0 iter : 45  Arret : 0.081442 s/iter 27.706480 
68 gpu 0 iter : 46  Arret : 0.0811917 s/iter 27.670721 
69 gpu 0 iter : 47  Arret : 0.0822112 s/iter 27.609868 
70 gpu 0 iter : 48  Arret : 0.0835771 s/iter 27.597375 
71 gpu 0 iter : 49  Arret : 0.0857379 s/iter 27.729707 
72 gpu 0 iter : 50  Arret : 0.0897612 s/iter 27.623075 
73 gpu 0 iter : 51  Arret : 0.0997583 s/iter 27.644660 
74 gpu 0 iter : 52  Arret : 0.148009 s/iter 27.641711 
75 gpu 0 iter : 53  Arret : 0.0810578 s/iter 27.809112 
76 gpu 0 iter : 54  Arret : 0.0761754 s/iter 27.726821 
77 gpu 0 iter : 55  Arret : 0.0753544 s/iter 27.713916 
78 gpu 0 iter : 56  Arret : 0.0747394 s/iter 27.641510 
79 gpu 0 iter : 57  Arret : 0.0741459 s/iter 27.656637 
80 gpu 0 iter : 58  Arret : 0.0736156 s/iter 27.684889 
81 gpu 0 iter : 59  Arret : 0.0731337 s/iter 27.584138 
82 gpu 0 iter : 60  Arret : 0.0726841 s/iter 27.603977 
83 gpu 0 iter : 61  Arret : 0.0722627 s/iter 27.521752 
84 gpu 0 iter : 62  Arret : 0.0722214 s/iter 27.593495 
85 gpu 0 iter : 63  Arret : 0.072309 s/iter 27.716730 
86 gpu 0 iter : 64  Arret : 0.0724031 s/iter 27.644477 
87 gpu 0 iter : 65  Arret : 0.0725447 s/iter 27.570075 
88 gpu 0 iter : 66  Arret : 0.0730198 s/iter 27.654704 
89 gpu 0 iter : 67  Arret : 0.0734493 s/iter 27.670200 
90 gpu 0 iter : 68  Arret : 0.0735663 s/iter 27.707876 
91 gpu 0 iter : 69  Arret : 0.0730875 s/iter 27.631047 
92 gpu 0 iter : 70  Arret : 0.0733015 s/iter 27.768731 
93 gpu 0 iter : 71  Arret : 0.0735456 s/iter 27.639630 
94 gpu 0 iter : 72  Arret : 0.0738262 s/iter 27.692827 
95 gpu 0 iter : 73  Arret : 0.0741584 s/iter 27.694123 
96 gpu 0 iter : 74  Arret : 0.0745504 s/iter 27.657722 
97 gpu 0 iter : 75  Arret : 0.0750287 s/iter 27.530421 
98 gpu 0 iter : 76  Arret : 0.075606 s/iter 27.691534 
99 gpu 0 iter : 77  Arret : 0.0763381 s/iter 27.627515 
100 gpu 0 iter : 78  Arret : 0.0772609 s/iter 27.722162 
101 gpu 0 iter : 79  Arret : 0.0784986 s/iter 27.737349 
102 gpu 0 iter : 80  Arret : 0.0803216 s/iter 27.795140 
103 gpu 0 iter : 81  Arret : 0.0833763 s/iter 27.712014 
104 gpu 0 iter : 82  Arret : 0.0857804 s/iter 27.616624 
105 gpu 0 iter : 83  Arret : 0.0681289 s/iter 27.647584 
106 gpu 0 iter : 84  Arret : 0.0661738 s/iter 27.702826 
107 gpu 0 iter : 85  Arret : 0.065728 s/iter 27.680471 
108 gpu 0 iter : 86  Arret : 0.0656501 s/iter 27.749677 
109 gpu 0 iter : 87  Arret : 0.0660945 s/iter 27.586654 
110 gpu 0 iter : 88  Arret : 0.0666066 s/iter 27.651654 
111 gpu 0 iter : 89  Arret : 0.067212 s/iter 27.604856 
112 gpu 0 iter : 90  Arret : 0.0679323 s/iter 27.580859 
113 gpu 0 iter : 91  Arret : 0.0687486 s/iter 27.606257 
114 gpu 0 iter : 92  Arret : 0.0694555 s/iter 27.668065 
115 gpu 0 iter : 93  Arret : 0.0691873 s/iter 27.742445 
116 gpu 0 iter : 94  Arret : 0.0659672 s/iter 27.684775 
117 gpu 0 iter : 95  Arret : 0.0630197 s/iter 27.676622 
118 gpu 0 iter : 96  Arret : 0.0627875 s/iter 27.635821 
119 gpu 0 iter : 97  Arret : 0.0625551 s/iter 27.696600 
120 gpu 0 iter : 98  Arret : 0.06233 s/iter 27.657175 
121 gpu 0 iter : 99  Arret : 0.0621206 s/iter 27.636799 
122 gpu 0 iter : 100  Arret : 0.0619223 s/iter 27.496227 
123 gpu 0 iter : 101  Arret : 0.0617419 s/iter 27.653072 
124 gpu 0 iter : 102  Arret : 0.0615747 s/iter 27.605520 
125 gpu 0 iter : 103  Arret : 0.0614268 s/iter 27.557247 
126 gpu 0 iter : 104  Arret : 0.0613071 s/iter 27.617322 
127 gpu 0 iter : 105  Arret : 0.0612073 s/iter 27.596535 
128 gpu 0 iter : 106  Arret : 0.0611241 s/iter 27.742761 
129 gpu 0 iter : 107  Arret : 0.0610522 s/iter 27.637998 
130 gpu 0 iter : 108  Arret : 0.0609967 s/iter 27.717476 
131 gpu 0 iter : 109  Arret : 0.0609504 s/iter 27.724174 
132 gpu 0 iter : 110  Arret : 0.0609186 s/iter 27.653768 
133 gpu 0 iter : 111  Arret : 0.0608947 s/iter 27.659002 
134 gpu 0 iter : 112  Arret : 0.0608857 s/iter 27.686514 
135 gpu 0 iter : 113  Arret : 0.0608874 s/iter 27.566403 
136 gpu 0 iter : 114  Arret : 0.0608988 s/iter 27.624237 
137 gpu 0 iter : 115  Arret : 0.0609196 s/iter 27.621325 
138 gpu 0 iter : 116  Arret : 0.0609492 s/iter 27.581922 
139 gpu 0 iter : 117  Arret : 0.0609907 s/iter 27.632755 
140 gpu 0 iter : 118  Arret : 0.061041 s/iter 27.684812 
141 gpu 0 iter : 119  Arret : 0.0610987 s/iter 27.684929 
142 gpu 0 iter : 120  Arret : 0.0611635 s/iter 27.704854 
143 gpu 0 iter : 121  Arret : 0.0612368 s/iter 27.607966 
144 gpu 0 iter : 122  Arret : 0.0613124 s/iter 27.642532 
145 gpu 0 iter : 123  Arret : 0.0613912 s/iter 27.631656 
146 gpu 0 iter : 124  Arret : 0.0614667 s/iter 27.688838 
147 gpu 0 iter : 125  Arret : 0.0615356 s/iter 27.623137 
148 gpu 0 iter : 126  Arret : 0.0617597 s/iter 27.703026 
149 gpu 0 iter : 127  Arret : 0.0620478 s/iter 27.740887 
150 gpu 0 iter : 128  Arret : 0.0624229 s/iter 27.715521 
151 gpu 0 iter : 129  Arret : 0.0629074 s/iter 27.751329 
152 gpu 0 iter : 130  Arret : 0.0634698 s/iter 27.797828 
153 gpu 0 iter : 131  Arret : 0.0637699 s/iter 27.702156 
154 gpu 0 iter : 132  Arret : 0.0640308 s/iter 27.690555 
155 gpu 0 iter : 133  Arret : 0.0659287 s/iter 27.524283 
156 gpu 0 iter : 134  Arret : 0.0693681 s/iter 27.638889 
157 gpu 0 iter : 135  Arret : 0.0710344 s/iter 27.618419 
158 gpu 0 iter : 136  Arret : 0.0694396 s/iter 27.711971 
159 gpu 0 iter : 137  Arret : 0.0733943 s/iter 27.615772 
160 gpu 0 iter : 138  Arret : 0.0810003 s/iter 27.621519 
161 gpu 0 iter : 139  Arret : 0.100414 s/iter 27.753471 
162 gpu 0 iter : 140  Arret : 0.537557 s/iter 27.638308 
163 gpu 0 iter : 141  Arret : 0.507225 s/iter 27.575889 
164 gpu 0 iter : 142  Arret : 2.33889 s/iter 27.726919 
165 gpu 0 iter : 143  Arret : 1.54355 s/iter 27.538023 
166 gpu 0 iter : 144  Arret : 0.563172 s/iter 27.484199 
167 gpu 0 iter : 145  Arret : 0.226945 s/iter 27.442553 
168 gpu 0 iter : 146  Arret : 0.171912 s/iter 27.309655 
169 gpu 0 iter : 147  Arret : 0.156097 s/iter 27.270619 
170 gpu 0 iter : 148  Arret : 0.0971293 s/iter 26.735380 
171 gpu 0 iter : 149  Arret : 0.0428118 s/iter 26.655854 
172 gpu 0 iter : 150  Arret : 0.0142023 s/iter 26.581889 
173 gpu 0 iter : 151  Arret : 0.0051282 s/iter 26.579230 
174 gpu 0 iter : 152  Arret : 0.00148395 s/iter 26.561289 
175 gpu 0 iter : 153  Arret : 0.000175276 s/iter 26.561155 
176 gpu 0 iter : 154  Arret : 5.37195E-09 s/iter 26.561401 
177 gpu 0 iter : 155  Arret : 1.16023E-11 s/iter 26.562237 
178 gpu 0 iter : 156  Arret : 2.50282E-14 s/iter 26.561680 
179 temps : 4310.13 seconde(s)
180 (1 +i*0)*x^0 + (-0.1 +i*0)*x^550000 + (-10 +i*0)*x^850000 + (1 +i*0)*x^1400000
181  
182 (-55000 +i*0)*x^549999 + (-8.5E+06 +i*0)*x^849999 + (1.4E+06 +i*0)*x^1399999
183  
184 zone limite de 'log-exp' 1.00025
185 CPU thread 3 (of 4) uses CUDA device 3
186 CPU thread 2 (of 4) uses CUDA device 2
187 CPU thread 1 (of 4) uses CUDA device 1
188 CPU thread 0 (of 4) uses CUDA device 0
189 gpu 2 dimgrid 5469 dimblock 256  degrePoly 1400000
190 gpu 2 dimgrid2 1368 start 700032  size 350016
191 gpu 1 dimgrid 5469 dimblock 256  degrePoly 1400000
192 gpu 1 dimgrid2 1368 start 350016  size 350016
193 gpu 0 dimgrid 5469 dimblock 256  degrePoly 1400000
194 gpu 0 dimgrid2 1368 start 0  size 350016
195 gpu 3 dimgrid 5469 dimblock 256  degrePoly 1400000
196 gpu 3 dimgrid2 1368 start 1050048  size 350016
197 gpu 0 iter : 1  Arret : 0.00301134 s/iter 36.150724 
198 gpu 0 iter : 2  Arret : 1.0164 s/iter 36.798604 
199 gpu 0 iter : 3  Arret : 0.527057 s/iter 36.500356 
200 gpu 0 iter : 4  Arret : 0.812989 s/iter 37.737377 
201 gpu 0 iter : 5  Arret : 1.19856 s/iter 38.078910 
202 gpu 0 iter : 6  Arret : 1.31385 s/iter 37.969050 
203 gpu 0 iter : 7  Arret : 0.771729 s/iter 38.556733 
204 gpu 0 iter : 8  Arret : 0.33112 s/iter 38.122633 
205 gpu 0 iter : 9  Arret : 1.31175 s/iter 38.633804 
206 gpu 0 iter : 10  Arret : 2.14622 s/iter 39.213451 
207 gpu 0 iter : 11  Arret : 2.04392 s/iter 39.361824 
208 gpu 0 iter : 12  Arret : 1.60414 s/iter 40.017241 
209 gpu 0 iter : 13  Arret : 3.65838 s/iter 39.438270 
210 gpu 0 iter : 14  Arret : 2.89151 s/iter 39.215504 
211 gpu 0 iter : 15  Arret : 1.05476 s/iter 39.289893 
212 gpu 0 iter : 16  Arret : 2.33471 s/iter 38.697660 
213 gpu 0 iter : 17  Arret : 1.31967 s/iter 38.803148 
214 gpu 0 iter : 18  Arret : 1.72042 s/iter 38.333798 
215 gpu 0 iter : 19  Arret : 1.26041 s/iter 38.223915 
216 gpu 0 iter : 20  Arret : 2.02686 s/iter 38.118103 
217 gpu 0 iter : 21  Arret : 1.94287 s/iter 38.143924 
218 gpu 0 iter : 22  Arret : 0.758266 s/iter 38.160562 
219 gpu 0 iter : 23  Arret : 0.662841 s/iter 38.091311 
220 gpu 0 iter : 24  Arret : 0.451559 s/iter 38.111037 
221 gpu 0 iter : 25  Arret : 0.890363 s/iter 38.178186 
222 gpu 0 iter : 26  Arret : 0.558147 s/iter 37.880066 
223 gpu 0 iter : 27  Arret : 0.980988 s/iter 37.969720 
224 gpu 0 iter : 28  Arret : 0.650408 s/iter 37.971275 
225 gpu 0 iter : 29  Arret : 0.408451 s/iter 37.801977 
226 gpu 0 iter : 30  Arret : 0.325854 s/iter 37.001443 
227 gpu 0 iter : 31  Arret : 0.557985 s/iter 36.776558 
228 gpu 0 iter : 32  Arret : 0.657544 s/iter 36.678739 
229 gpu 0 iter : 33  Arret : 0.064597 s/iter 36.383532 
230 gpu 0 iter : 34  Arret : 0.0379355 s/iter 36.309674 
231 gpu 0 iter : 35  Arret : 0.0111125 s/iter 36.242018 
232 gpu 0 iter : 36  Arret : 0.00419826 s/iter 36.128804 
233 gpu 0 iter : 37  Arret : 0.0004051 s/iter 36.128298 
234 gpu 0 iter : 38  Arret : 2.6764E-06 s/iter 36.132280 
235 gpu 0 iter : 39  Arret : 4.06209E-09 s/iter 36.130923 
236 gpu 0 iter : 40  Arret : 1.15654E-11 s/iter 36.137012 
237 gpu 0 iter : 41  Arret : 3.29406E-14 s/iter 36.136398 
238 temps : 1548.53 seconde(s)
239 (1 +i*0)*x^0 + (-0.1 +i*0)*x^200000 + (-10 +i*0)*x^1800000 + (1 +i*0)*x^2000000
240  
241 (-20000 +i*0)*x^199999 + (-1.8E+07 +i*0)*x^1799999 + (2E+06 +i*0)*x^1999999
242  
243 zone limite de 'log-exp' 1.00018
244 CPU thread 0 (of 4) uses CUDA device 0
245 CPU thread 1 (of 4) uses CUDA device 1
246 CPU thread 3 (of 4) uses CUDA device 3
247 CPU thread 2 (of 4) uses CUDA device 2
248 gpu 0 dimgrid 7813 dimblock 256  degrePoly 2000000
249 gpu 0 dimgrid2 1954 start 0  size 500032
250 gpu 1 dimgrid 7813 dimblock 256  degrePoly 2000000
251 gpu 1 dimgrid2 1954 start 500032  size 500032
252 gpu 3 dimgrid 7813 dimblock 256  degrePoly 2000000
253 gpu 3 dimgrid2 1954 start 1500096  size 500032
254 gpu 2 dimgrid 7813 dimblock 256  degrePoly 2000000
255 gpu 2 dimgrid2 1954 start 1000064  size 500032
256 gpu 0 iter : 1  Arret : 2.36057E-06 s/iter 73.200206 
257 gpu 0 iter : 2  Arret : 3.44757E-06 s/iter 73.206619 
258 gpu 0 iter : 3  Arret : 2.67755E-05 s/iter 73.218838 
259 gpu 0 iter : 4  Arret : 0.000276623 s/iter 73.273064 
260 gpu 0 iter : 5  Arret : 0.00217412 s/iter 73.135160 
261 gpu 0 iter : 6  Arret : 0.00328038 s/iter 73.985536 
262 gpu 0 iter : 7  Arret : 0.00254268 s/iter 73.908764 
263 gpu 0 iter : 8  Arret : 0.00225769 s/iter 73.920152 
264 gpu 0 iter : 9  Arret : 0.000786152 s/iter 73.138282 
265 gpu 0 iter : 10  Arret : 0.000588392 s/iter 73.290807 
266 gpu 0 iter : 11  Arret : 0.00102007 s/iter 73.081068 
267 gpu 0 iter : 12  Arret : 0.000979946 s/iter 73.082770 
268 gpu 0 iter : 13  Arret : 0.000114646 s/iter 73.173739 
269 gpu 0 iter : 14  Arret : 7.57524E-05 s/iter 73.274915 
270 gpu 0 iter : 15  Arret : 5.05796E-05 s/iter 73.063632 
271 gpu 0 iter : 16  Arret : 8.64598E-06 s/iter 73.110540 
272 gpu 0 iter : 17  Arret : 2.69825E-07 s/iter 73.168646 
273 gpu 0 iter : 18  Arret : 1.52775E-11 s/iter 73.173578 
274 gpu 0 iter : 19  Arret : 4.67252E-15 s/iter 73.286665 
275 temps : 1394.75 seconde(s)
276 (1 +i*0)*x^0 + (-0.1 +i*0)*x^1200000 + (-10 +i*0)*x^1800000 + (1 +i*0)*x^3000000
277  
278 (-120000 +i*0)*x^1199999 + (-1.8E+07 +i*0)*x^1799999 + (3E+06 +i*0)*x^2999999
279  
280 zone limite de 'log-exp' 1.00012
281 CPU thread 1 (of 4) uses CUDA device 1
282 CPU thread 3 (of 4) uses CUDA device 3
283 CPU thread 0 (of 4) uses CUDA device 0
284 CPU thread 2 (of 4) uses CUDA device 2
285 gpu 0 dimgrid 11719 dimblock 256  degrePoly 3000000
286 gpu 0 dimgrid2 2930 start 0  size 750016
287 gpu 3 dimgrid 11719 dimblock 256  degrePoly 3000000
288 gpu 3 dimgrid2 2930 start 2250048  size 750016
289 gpu 2 dimgrid 11719 dimblock 256  degrePoly 3000000
290 gpu 2 dimgrid2 2930 start 1500032  size 750016
291 gpu 1 dimgrid 11719 dimblock 256  degrePoly 3000000
292 gpu 1 dimgrid2 2930 start 750016  size 750016
293 gpu 0 iter : 1  Arret : 2.1478E-05 s/iter 164.876819 
294 gpu 0 iter : 2  Arret : 0.000420737 s/iter 164.787431 
295 gpu 0 iter : 3  Arret : 0.00357277 s/iter 165.005356 
296 gpu 0 iter : 4  Arret : 0.0572092 s/iter 165.495652 
297 gpu 0 iter : 5  Arret : 0.761627 s/iter 165.743492 
298 gpu 0 iter : 6  Arret : 1.01141 s/iter 167.164569 
299 gpu 0 iter : 7  Arret : 2.07506 s/iter 169.847618 
300 gpu 0 iter : 8  Arret : 2.06513 s/iter 170.981840 
301 gpu 0 iter : 9  Arret : 1.85771 s/iter 172.907405 
302 gpu 0 iter : 10  Arret : 1.32021 s/iter 173.682887 
303 gpu 0 iter : 11  Arret : 0.653246 s/iter 174.990375 
304 gpu 0 iter : 12  Arret : 1.13868 s/iter 177.748152 
305 gpu 0 iter : 13  Arret : 0.659181 s/iter 181.308007 
306 gpu 0 iter : 14  Arret : 0.790133 s/iter 180.509792 
307 gpu 0 iter : 15  Arret : 0.987422 s/iter 180.644018 
308 gpu 0 iter : 16  Arret : 0.76864 s/iter 178.428579 
309 gpu 0 iter : 17  Arret : 1.75305 s/iter 173.449056 
310 gpu 0 iter : 18  Arret : 0.94182 s/iter 172.561179 
311 gpu 0 iter : 19  Arret : 1.12708 s/iter 171.091505 
312 gpu 0 iter : 20  Arret : 1.73067 s/iter 169.907975 
313 gpu 0 iter : 21  Arret : 0.362559 s/iter 169.765571 
314 gpu 0 iter : 22  Arret : 0.268441 s/iter 167.991027 
315 gpu 0 iter : 23  Arret : 0.129326 s/iter 167.939620 
316 gpu 0 iter : 24  Arret : 0.168344 s/iter 166.717733 
317 gpu 0 iter : 25  Arret : 0.157303 s/iter 165.967129 
318 gpu 0 iter : 26  Arret : 0.191584 s/iter 165.597470 
319 gpu 0 iter : 27  Arret : 0.0858363 s/iter 165.564472 
320 gpu 0 iter : 28  Arret : 0.15835 s/iter 165.543554 
321 gpu 0 iter : 29  Arret : 0.180216 s/iter 165.510484 
322 gpu 0 iter : 30  Arret : 0.151569 s/iter 165.401908 
323 gpu 0 iter : 31  Arret : 0.137137 s/iter 165.511141 
324 gpu 0 iter : 32  Arret : 0.150851 s/iter 165.427653 
325 gpu 0 iter : 33  Arret : 0.0650185 s/iter 165.387441 
326 gpu 0 iter : 34  Arret : 0.0343198 s/iter 165.406594 
327 gpu 0 iter : 35  Arret : 0.0106375 s/iter 165.392004 
328 gpu 0 iter : 36  Arret : 0.003294 s/iter 165.417487 
329 gpu 0 iter : 37  Arret : 0.000595952 s/iter 164.958632 
330 gpu 0 iter : 38  Arret : 2.78741E-06 s/iter 164.828188 
331 gpu 0 iter : 39  Arret : 7.24205E-10 s/iter 164.853101 
332 gpu 0 iter : 40  Arret : 2.28814E-12 s/iter 164.824094 
333 gpu 0 iter : 41  Arret : 7.24967E-15 s/iter 164.839113 
334 temps : 6926.85 seconde(s)
335 (1 +i*0)*x^0 + (-0.1 +i*0)*x^1800000 + (-10 +i*0)*x^2200000 + (1 +i*0)*x^4000000
336  
337 (-180000 +i*0)*x^1799999 + (-2.2E+07 +i*0)*x^2199999 + (4E+06 +i*0)*x^3999999
338  
339 zone limite de 'log-exp' 1.00009
340 CPU thread 0 (of 4) uses CUDA device 0
341 CPU thread 1 (of 4) uses CUDA device 1
342 CPU thread 2 (of 4) uses CUDA device 2
343 CPU thread 3 (of 4) uses CUDA device 3
344 gpu 0 dimgrid 15625 dimblock 256  degrePoly 4000000
345 gpu 2 dimgrid 15625 dimblock 256  degrePoly 4000000
346 gpu 2 dimgrid2 3907 start 2000000  size 1000000
347 gpu 1 dimgrid 15625 dimblock 256  degrePoly 4000000
348 gpu 1 dimgrid2 3907 start 1000000  size 1000000
349 gpu 0 dimgrid2 3907 start 0  size 1000000
350 gpu 3 dimgrid 15625 dimblock 256  degrePoly 4000000
351 gpu 3 dimgrid2 3907 start 3000000  size 1000000
352 gpu 0 iter : 1  Arret : 0.000123591 s/iter 291.935400 
353 gpu 0 iter : 2  Arret : 0.00230327 s/iter 292.141703 
354 gpu 0 iter : 3  Arret : 0.0286795 s/iter 292.393594 
355 gpu 0 iter : 4  Arret : 0.0285429 s/iter 294.939645 
356 gpu 0 iter : 5  Arret : 0.015126 s/iter 295.052179 
357 gpu 0 iter : 6  Arret : 0.00914977 s/iter 299.530354 
358 gpu 0 iter : 7  Arret : 0.0118855 s/iter 299.463510 
359 gpu 0 iter : 8  Arret : 0.0162261 s/iter 300.249822 
360 gpu 0 iter : 9  Arret : 0.0117884 s/iter 301.899531 
361 gpu 0 iter : 10  Arret : 0.026364 s/iter 302.404244 
362 gpu 0 iter : 11  Arret : 0.0103138 s/iter 301.564423 
363 gpu 0 iter : 12  Arret : 0.00848671 s/iter 297.523873 
364 gpu 0 iter : 13  Arret : 0.00411255 s/iter 294.825185 
365 gpu 0 iter : 14  Arret : 0.00247994 s/iter 292.686873 
366 gpu 0 iter : 15  Arret : 0.0023979 s/iter 291.952790 
367 gpu 0 iter : 16  Arret : 0.00136324 s/iter 291.600549 
368 gpu 0 iter : 17  Arret : 0.000779307 s/iter 291.963112 
369 gpu 0 iter : 18  Arret : 0.000313181 s/iter 292.084410 
370 gpu 0 iter : 19  Arret : 0.000378682 s/iter 291.784771 
371 gpu 0 iter : 20  Arret : 6.22512E-05 s/iter 291.868967 
372 gpu 0 iter : 21  Arret : 2.33182E-07 s/iter 291.862188 
373 gpu 0 iter : 22  Arret : 1.11637E-09 s/iter 291.843744 
374 gpu 0 iter : 23  Arret : 6.70081E-12 s/iter 291.918387 
375 gpu 0 iter : 24  Arret : 4.01469E-14 s/iter 291.751401 
376 temps : 7077.91 seconde(s)
377 (1 +i*0)*x^0 + (-0.1 +i*0)*x^2200000 + (-10 +i*0)*x^2800000 + (1 +i*0)*x^5000000
378  
379 (-220000 +i*0)*x^2199999 + (-2.8E+07 +i*0)*x^2799999 + (5E+06 +i*0)*x^4999999
380  
381 zone limite de 'log-exp' 1.00007
382 CPU thread 2 (of 4) uses CUDA device 2
383 CPU thread 1 (of 4) uses CUDA device 1
384 CPU thread 3 (of 4) uses CUDA device 3
385 CPU thread 0 (of 4) uses CUDA device 0
386 gpu 3 dimgrid 19532 dimblock 256  degrePoly 5000000
387 gpu 3 dimgrid2 4883 start 3750144  size 1250048
388 gpu 1 dimgrid 19532 dimblock 256  degrePoly 5000000
389 gpu 1 dimgrid2 4883 start 1250048  size 1250048
390 gpu 2 dimgrid 19532 dimblock 256  degrePoly 5000000
391 gpu 2 dimgrid2 4883 start 2500096  size 1250048
392 gpu 0 dimgrid 19532 dimblock 256  degrePoly 5000000
393 gpu 0 dimgrid2 4883 start 0  size 1250048
394 gpu 0 iter : 1  Arret : 1.19865E-05 s/iter 455.001790 
395 gpu 0 iter : 2  Arret : 0.000937715 s/iter 455.137301 
396 gpu 0 iter : 3  Arret : 0.00669372 s/iter 456.599961 
397 gpu 0 iter : 4  Arret : 0.0061142 s/iter 458.992297 
398 gpu 0 iter : 5  Arret : 0.00333273 s/iter 465.500240 
399 gpu 0 iter : 6  Arret : 0.007957 s/iter 471.496241 
400 gpu 0 iter : 7  Arret : 0.00765568 s/iter 472.594002 
401 gpu 0 iter : 8  Arret : 0.00597041 s/iter 469.414085 
402 gpu 0 iter : 9  Arret : 0.0045263 s/iter 466.933629 
403 gpu 0 iter : 10  Arret : 0.00304707 s/iter 461.362014 
404 gpu 0 iter : 11  Arret : 0.00147222 s/iter 459.819568 
405 gpu 0 iter : 12  Arret : 0.00149084 s/iter 456.851360 
406 gpu 0 iter : 13  Arret : 0.000983199 s/iter 455.191156 
407 gpu 0 iter : 14  Arret : 0.000936713 s/iter 454.782453 
408 gpu 0 iter : 15  Arret : 0.000273346 s/iter 454.693120 
409 gpu 0 iter : 16  Arret : 0.000154751 s/iter 454.812950 
410 gpu 0 iter : 17  Arret : 0.00012654 s/iter 454.677231 
411 gpu 0 iter : 18  Arret : 1.18763E-05 s/iter 454.639549 
412 gpu 0 iter : 19  Arret : 2.69153E-05 s/iter 454.756226 
413 gpu 0 iter : 20  Arret : 3.82756E-05 s/iter 454.574410 
414 gpu 0 iter : 21  Arret : 1.41624E-06 s/iter 454.528836 
415 gpu 0 iter : 22  Arret : 3.26409E-07 s/iter 454.527899 
416 gpu 0 iter : 23  Arret : 1.84482E-09 s/iter 455.142443 
417 gpu 0 iter : 24  Arret : 9.8703E-12 s/iter 454.502871 
418 gpu 0 iter : 25  Arret : 5.2671E-14 s/iter 454.997696 
419 temps : 11464.3 seconde(s)