]> AND Private Git Repository - kahina_paper2.git/blob - Simulations/BIG/full_mpi_4GPU.o140664
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
ajout du code du kernel
[kahina_paper2.git] / Simulations / BIG / full_mpi_4GPU.o140664
1 REMAINING: 4
2 Taking GPU #0
3 Taking GPU #1
4 Taking GPU #2
5 Taking GPU #3
6 proc 2
7 proc 3
8 proc 0
9 proc 1
10 ici
11 ici
12 ici
13 ici
14 ici2
15 ici2
16 ici2
17 ici2
18 ici3
19 zone limite de 'log-exp' 1.00018
20 ici3
21 zone limite de 'log-exp' 1.00018
22 ici3
23 zone limite de 'log-exp' 1.00018
24 ici3
25 ici4
26 ici3
27 ici4
28 ici3
29 ici4
30 ici3
31 zone limite de 'log-exp' 1.00018
32 ici3
33 ici4
34 dimgrid 7813 dimblock 256  degrePoly 2000000
35 proc 1, start 500032 size 500032
36 dimgrid 7813 dimblock 256  degrePoly 2000000
37 proc 3, start 1500096 size 500032
38 dimgrid 7813 dimblock 256  degrePoly 2000000
39 proc 2, start 1000064 size 500032
40 dimgrid 7813 dimblock 256  degrePoly 2000000
41 proc 0, start 0 size 500032
42 proc 0 start 0 size 500032
43 proc 2 start 1000064 size 500032
44 proc 1 start 500032 size 500032
45 proc 3 start 1500096 size 500032
46 iter : 1  Arret : 1.44834E-06 s/iter 205.940825 
47 iter : 2  Arret : 1.34957E-06 s/iter 206.359114 
48 iter : 3  Arret : 1.28543E-06 s/iter 206.338404 
49 iter : 4  Arret : 1.32123E-06 s/iter 205.569801 
50 iter : 5  Arret : 1.28108E-06 s/iter 206.362388 
51 iter : 6  Arret : 1.52528E-06 s/iter 205.947635 
52 iter : 7  Arret : 1.44796E-06 s/iter 205.570036 
53 iter : 8  Arret : 1.4197E-06 s/iter 206.274854 
54 iter : 9  Arret : 1.36981E-06 s/iter 205.523999 
55 iter : 10  Arret : 1.78699E-06 s/iter 205.517166 
56 iter : 11  Arret : 0.000120828 s/iter 206.080759 
57 iter : 12  Arret : 0.000388623 s/iter 205.612439 
58 iter : 13  Arret : 0.00226391 s/iter 206.088028 
59 iter : 14  Arret : 0.00536308 s/iter 206.777804 
60 iter : 15  Arret : 0.00505109 s/iter 207.995774 
61 iter : 16  Arret : 1.09453 s/iter 208.693534 
62 iter : 17  Arret : 0.00718604 s/iter 212.802838 
63 iter : 18  Arret : 0.0462084 s/iter 220.362911 
64 iter : 19  Arret : 0.067973 s/iter 213.850652 
65 iter : 20  Arret : 0.0352674 s/iter 211.078385 
66 iter : 21  Arret : 0.0256645 s/iter 210.310228 
67 iter : 22  Arret : 0.0042868 s/iter 207.901863 
68 iter : 23  Arret : 0.00261662 s/iter 208.696215 
69 iter : 24  Arret : 0.000777403 s/iter 207.126076 
70 iter : 25  Arret : 0.000262332 s/iter 207.347948 
71 iter : 26  Arret : 0.000480261 s/iter 207.491371 
72 iter : 27  Arret : 0.000843968 s/iter 207.287417 
73 iter : 28  Arret : 0.00107575 s/iter 206.757688 
74 iter : 29  Arret : 0.00102761 s/iter 207.166812 
75 iter : 30  Arret : 2.61225E-05 s/iter 207.625209 
76 iter : 31  Arret : 5.54935E-10 s/iter 207.334182 
77 iter : 32  Arret : 3.51083E-16 s/iter 207.140239 
78 temps : 6652.78 seconde(s)
79 proc 0
80 proc 1
81 proc 2
82 proc 3
83 ici
84 ici
85 ici
86 ici
87 ici2
88 ici2
89 ici2
90 ici2
91 ici3
92 zone limite de 'log-exp' 1.00012
93 ici3
94 zone limite de 'log-exp' 1.00012
95 ici3
96 zone limite de 'log-exp' 1.00012
97 ici3
98 ici3
99 ici4
100 ici4
101 ici3
102 ici4
103 ici3
104 zone limite de 'log-exp' 1.00012
105 ici3
106 ici4
107 dimgrid 11719 dimblock 256  degrePoly 3000000
108 proc 1, start 750016 size 750016
109 dimgrid 11719 dimblock 256  degrePoly 3000000
110 proc 2, start 1500032 size 750016
111 dimgrid 11719 dimblock 256  degrePoly 3000000
112 proc 3, start 2250048 size 750016
113 proc 2 start 1500032 size 750016
114 dimgrid 11719 dimblock 256  degrePoly 3000000
115 proc 0, start 0 size 750016
116 proc 0 start 0 size 750016
117 proc 1 start 750016 size 750016
118 proc 3 start 2250048 size 750016
119 iter : 1  Arret : 9.53204E-07 s/iter 461.459712 
120 iter : 2  Arret : 9.37007E-07 s/iter 461.131045 
121 iter : 3  Arret : 9.0577E-07 s/iter 460.922963 
122 iter : 4  Arret : 1.01222E-06 s/iter 460.829574 
123 iter : 5  Arret : 9.44944E-07 s/iter 460.829019 
124 iter : 6  Arret : 9.58987E-07 s/iter 461.290910 
125 iter : 7  Arret : 9.72984E-07 s/iter 461.358879 
126 iter : 8  Arret : 9.83283E-07 s/iter 461.123318 
127 iter : 9  Arret : 1.04215E-06 s/iter 460.693998 
128 iter : 10  Arret : 1.44009E-06 s/iter 460.466568 
129 iter : 11  Arret : 8.73152E-05 s/iter 460.624768 
130 iter : 12  Arret : 0.000206674 s/iter 460.586929 
131 iter : 13  Arret : 0.000928336 s/iter 462.302008 
132 iter : 14  Arret : 0.967664 s/iter 464.620100 
133 iter : 15  Arret : 2.70874 s/iter 469.114186 
134 iter : 16  Arret : 0.0755852 s/iter 475.379134 
135 iter : 17  Arret : 0.203816 s/iter 481.768376 
136 iter : 18  Arret : 0.262828 s/iter 485.444654 
137 iter : 19  Arret : 0.235532 s/iter 477.928214 
138 iter : 20  Arret : 0.190572 s/iter 472.097443 
139 iter : 21  Arret : 0.0446409 s/iter 469.191689 
140 iter : 22  Arret : 0.0217248 s/iter 469.351025 
141 iter : 23  Arret : 0.026835 s/iter 466.587422 
142 iter : 24  Arret : 0.0102186 s/iter 463.265856 
143 iter : 25  Arret : 0.0072299 s/iter 461.804314 
144 iter : 26  Arret : 0.00195646 s/iter 460.242651 
145 iter : 27  Arret : 0.00073504 s/iter 460.262518 
146 iter : 28  Arret : 0.000350821 s/iter 461.440941 
147 iter : 29  Arret : 3.63887E-05 s/iter 460.152519 
148 iter : 30  Arret : 3.54794E-08 s/iter 460.122122 
149 iter : 31  Arret : 2.23894E-14 s/iter 460.715122 
150 temps : 14415.7 seconde(s)
151 proc 2
152 proc 3
153 proc 0
154 proc 1
155 ici
156 ici
157 ici
158 ici
159 ici2
160 ici2
161 ici2
162 ici2
163 ici3
164 zone limite de 'log-exp' 1.00009
165 ici3
166 zone limite de 'log-exp' 1.00009
167 ici3
168 ici4
169 ici3
170 ici4
171 ici3
172 zone limite de 'log-exp' 1.00009
173 ici3
174 ici4
175 dimgrid 15625 dimblock 256  degrePoly 4000000
176 proc 3, start 3000000 size 1000000
177 dimgrid 15625 dimblock 256  degrePoly 4000000
178 proc 1, start 1000000 size 1000000
179 dimgrid 15625 dimblock 256  degrePoly 4000000
180 proc 2, start 2000000 size 1000000
181 ici3
182 zone limite de 'log-exp' 1.00009
183 ici3
184 ici4
185 dimgrid 15625 dimblock 256  degrePoly 4000000
186 proc 0, start 0 size 1000000
187 proc 2 start 2000000 size 1000000
188 proc 0 start 0 size 1000000
189 proc 3 start 3000000 size 1000000
190 proc 1 start 1000000 size 1000000
191 iter : 1  Arret : 6.88912E-07 s/iter 819.306625 
192 iter : 2  Arret : 7.14016E-07 s/iter 818.197087 
193 iter : 3  Arret : 7.3014E-07 s/iter 818.470548 
194 iter : 4  Arret : 7.21743E-07 s/iter 818.730362 
195 iter : 5  Arret : 7.35418E-07 s/iter 818.173934 
196 iter : 6  Arret : 7.52455E-07 s/iter 817.866927 
197 iter : 7  Arret : 7.34859E-07 s/iter 818.095046 
198 iter : 8  Arret : 7.31974E-07 s/iter 818.164256 
199 iter : 9  Arret : 7.48569E-07 s/iter 819.044387 
200 iter : 10  Arret : 7.74048E-07 s/iter 819.333033 
201 iter : 11  Arret : 3.48688E-05 s/iter 819.133268 
202 iter : 12  Arret : 0.000807717 s/iter 818.591881 
203 iter : 13  Arret : 0.000926508 s/iter 818.950799 
204 iter : 14  Arret : 0.00303398 s/iter 819.147222 
205 iter : 15  Arret : 0.0183154 s/iter 830.118271 
206 iter : 16  Arret : 0.0285894 s/iter 855.852233 
207 iter : 17  Arret : 0.0236243 s/iter 851.970029 
208 iter : 18  Arret : 0.731842 s/iter 853.621906 
209 iter : 19  Arret : 0.542969 s/iter 851.697002 
210 iter : 20  Arret : 0.327675 s/iter 853.423224 
211 iter : 21  Arret : 0.0744866 s/iter 837.707807 
212 iter : 22  Arret : 0.038791 s/iter 853.159762 
213 iter : 23  Arret : 0.0426196 s/iter 822.647946 
214 iter : 24  Arret : 0.055558 s/iter 823.298812 
215 iter : 25  Arret : 0.0472359 s/iter 818.676729 
216 iter : 26  Arret : 0.00981971 s/iter 818.659135 
217 iter : 27  Arret : 0.00185408 s/iter 819.292362 
218 iter : 28  Arret : 0.000122169 s/iter 818.157766 
219 iter : 29  Arret : 2.6396E-07 s/iter 817.164218 
220 iter : 30  Arret : 2.38327E-11 s/iter 817.419948 
221 iter : 31  Arret : 1.57009E-16 s/iter 817.311017 
222 temps : 25693.2 seconde(s)
223 proc 2
224 proc 3
225 proc 0
226 proc 1
227 ici
228 ici
229 ici
230 ici
231 ici2
232 ici2
233 ici2
234 ici2
235 ici3
236 zone limite de 'log-exp' 1.00007
237 ici3
238 zone limite de 'log-exp' 1.00007
239 ici3
240 zone limite de 'log-exp' 1.00007
241 ici3
242 ici4
243 ici3
244 ici4
245 ici3
246 ici4
247 ici3
248 zone limite de 'log-exp' 1.00007
249 ici3
250 ici4
251 dimgrid 19532 dimblock 256  degrePoly 5000000
252 proc 2, start 2500096 size 1250048
253 dimgrid 19532 dimblock 256  degrePoly 5000000
254 proc 1, start 1250048 size 1250048
255 dimgrid 19532 dimblock 256  degrePoly 5000000
256 proc 3, start 3750144 size 1250048
257 proc 3 start 3750144 size 1250048
258 proc 1 start 1250048 size 1250048
259 proc 2 start 2500096 size 1250048
260 dimgrid 19532 dimblock 256  degrePoly 5000000
261 proc 0, start 0 size 1250048
262 proc 0 start 0 size 1250048
263 iter : 1  Arret : 5.52441E-07 s/iter 1278.740665 
264 iter : 2  Arret : 5.75419E-07 s/iter 1277.699605 
265 iter : 3  Arret : 5.51509E-07 s/iter 1276.810889 
266 iter : 4  Arret : 5.69267E-07 s/iter 1279.877073 
267 iter : 5  Arret : 6.08585E-07 s/iter 1279.500027 
268 iter : 6  Arret : 5.83038E-07 s/iter 1278.799718 
269 iter : 7  Arret : 5.79436E-07 s/iter 1277.284006 
270 iter : 8  Arret : 5.90821E-07 s/iter 1276.630395 
271 iter : 9  Arret : 6.21271E-07 s/iter 1277.007910 
272 iter : 10  Arret : 7.74213E-07 s/iter 1277.019126 
273 iter : 11  Arret : 4.88001E-05 s/iter 1276.118288 
274 iter : 12  Arret : 0.000260225 s/iter 1276.399074 
275 iter : 13  Arret : 0.000428267 s/iter 1281.985363 
276 iter : 14  Arret : 0.00230591 s/iter 1325.812692 
277 iter : 15  Arret : 0.00294045 s/iter 1297.918923 
278 iter : 16  Arret : 0.0104684 s/iter 1346.312760 
279 iter : 17  Arret : 0.0168898 s/iter 1350.545849 
280 iter : 18  Arret : 0.0175923 s/iter 1339.305912 
281 iter : 19  Arret : 0.0143619 s/iter 1335.131532 
282 iter : 20  Arret : 0.0170721 s/iter 1328.137450 
283 iter : 21  Arret : 0.0384741 s/iter 1315.141047 
284 iter : 22  Arret : 0.0257741 s/iter 1301.408144 
285 iter : 23  Arret : 0.0223754 s/iter 1290.526097 
286 iter : 24  Arret : 0.0384305 s/iter 1284.924772 
287 iter : 25  Arret : 0.013928 s/iter 1275.931436 
288 iter : 26  Arret : 0.00315086 s/iter 1275.660735 
289 iter : 27  Arret : 0.000282398 s/iter 1275.643767 
290 iter : 28  Arret : 4.02652E-07 s/iter 1275.656268 
291 iter : 29  Arret : 2.8924E-11 s/iter 1275.459590 
292 iter : 30  Arret : 1.57009E-16 s/iter 1276.129079 
293 temps : 38787.6 seconde(s)