]> AND Private Git Repository - book_gpu.git/commitdiff
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
correct
authorcouturie <couturie@carcariass.(none)>
Sun, 5 May 2013 15:54:18 +0000 (17:54 +0200)
committercouturie <couturie@carcariass.(none)>
Sun, 5 May 2013 15:54:18 +0000 (17:54 +0200)
BookGPU/BookGPU.tex
BookGPU/Chapters/chapter11/biblio11.bib
BookGPU/Chapters/chapter11/code3.cu
BookGPU/Chapters/chapter14/biblio14.bib
BookGPU/Chapters/chapter15/biblio.bib
BookGPU/Chapters/chapter15/ch15.tex
BookGPU/Chapters/chapter19/code.cu
BookGPU/Chapters/chapter7/biblio7.bib
BookGPU/Chapters/chapter7/ch7.tex
BookGPU/Chapters/chapter8/biblio8.bib
BookGPU/Chapters/chapter9/biblio9.bib

index 77937b899cb408e0c9b476f9def2f9c082902142..1ca9c1a8e8c333860afe41ef62fd2b29308a39ff 100755 (executable)
 
 
 \makeindex
-%\includeonly{Chapters/chapter19/ch19}
+%\includeonly{Chapters/chapter15/ch15}
 
 \begin{document}
 
 \part{Optimization}
 \include{Chapters/chapter8/ch8}
 \include{Chapters/chapter9/ch9}
-\include{Chapters/chapter10/ch10}
+\include{Chapters/chapter10/ch10}   %revoir ce chapitre
 
 \part{Numerical applications}
 \include{Chapters/chapter7/ch7} 
index a39c5cef0cbabc63557657499106efbe7d07d065..c6d75ac89401ee8093d34f67c335407f8977c42a 100644 (file)
@@ -17,7 +17,7 @@
 }\r
 \r
 @article{tridiag_GPU,\r
-   author = {G\"ddeke , D. and Strzodka, R.},\r
+   author = {G\"oddeke , D. and Strzodka, R.},\r
    title = {Cyclic Reduction Tridiagonal Solvers on {GPU}s Applied to Mixed Precision Multigrid},\r
    journal = { IEEE Transactions on Parallel and Distributed Systems},\r
    volume = {22},\r
@@ -56,7 +56,7 @@
 }\r
 \r
 @inproceedings{Abbas2011,\r
-   author = {Abbas, M. and Majid, A.A. and Awang, M.N.H. and Ali, J.M.},\r
+   author = {Abbas, M. and Majid, A. A. and Awang, M. N. H. and Ali, J. M.},\r
    title = {Monotonicity Preserving Interpolation using Rational Spline},\r
    booktitle = {International MultiConference of Engineers and Computer Scientists (IMECS '11)},\r
    address = {Hong Kong},\r
@@ -66,7 +66,7 @@
 }\r
 \r
 @article{abel1826,\r
-   author = {Abel, N.H.},\r
+   author = {Abel, N. H.},\r
    title = {Untersuchungen der Funktionen zweier unabh\"angigen ver\"anderlichen Gr\"ossen $x$ und $y$ wie $f(x, y)$, welche die Eigenschaft haben, dass $f(z, f(x, y))$ eine symmetrische Funktion von $x, y$ und $z$ ist.},\r
    journal = {J. Reine Angew. Math.},\r
    volume = {1},\r
    year = {1984}\r
 }\r
 \r
-   author = {Adams, M.J.},\r
+   author = {Adams, M. J.},\r
    title = {Chemometrics in Analytical Spectroscopy},\r
    publisher = {Royal Society of Chemistry},\r
    address = {London},\r
@@ -2557,7 +2557,7 @@ Contents(R)/Clinical Medicine.
 }\r
 \r
 @article{Bellman1973,\r
-   author = {Bellman, R.E. and Giertz, M.},\r
+   author = {Bellman, R. E. and Giertz, M.},\r
    title = {On the analytic formalism of the theory of fuzzy sets},\r
    journal = {Inform. Sci.},\r
    volume = {5},\r
@@ -2566,7 +2566,7 @@ Contents(R)/Clinical Medicine.
 }\r
 \r
 @article{Bellman1970_MS,\r
-   author = {Bellman, R.E. and Zadeh, L.},\r
+   author = {Bellman, R. E. and Zadeh, L.},\r
    title = {Decisionmaking in a fuzzy environment},\r
    journal = {Management Science},\r
    volume = {17},\r
@@ -2894,7 +2894,7 @@ constraint},
 }\r
 \r
 @article{Blum1973,\r
-   author = {Blum, M. and Floyd, R.W.  and Watt, V. and Rive, R.L.  and Tarjan, R.E.},\r
+   author = {Blum, M. and Floyd, R. W.  and Watt, V. and Rive, R. L.  and Tarjan, R. E.},\r
    title = {Time Bounds for Selection},\r
    journal = {Journal of Computer and System Sciences},\r
    volume = {7},\r
@@ -3524,7 +3524,7 @@ Royal Australian Chemical Institute; RACI},
 }\r
 \r
 @article{Carlson1985_SIAM,\r
-   author = {Carlson, R.E. and Fritsch, F.N.},\r
+   author = {Carlson, R. E. and Fritsch, F. N.},\r
    title = {Monotone piecewise bicubic interpolation},\r
    journal = {SIAM J. Numer. Anal.},\r
    volume = {22},\r
@@ -6672,7 +6672,7 @@ Schrödinger equation},
 }\r
 \r
 @article{Fritsch1980,\r
-   author = {Fritsch, F.N. and Carlson, R.E.},\r
+   author = {Fritsch, F. N. and Carlson, R. E.},\r
    title = {Monotone pieceuiuse cubic interpolation},\r
    journal = {SIAM J. Numer. Anal.},\r
    volume = {17 },\r
@@ -7443,7 +7443,7 @@ Genetic algorithms.},
 }\r
 \r
 @article{Gregory1982,\r
-   author = {Gregory, J.A. and Delbourgo, R.},\r
+   author = {Gregory, J. A. and Delbourgo, R.},\r
    title = {Piecewise rational quadratic interpolation to monotonic data},\r
    journal = {IMA Journal of Numerical Analysis},\r
    volume = {2},\r
@@ -9120,7 +9120,7 @@ review},
 }\r
 \r
 @article{Jupp_1978,\r
-   author = {Jupp, D.L.B.},\r
+   author = {Jupp, D. L. B.},\r
    title = {Approximation to data by splines with free knots},\r
    journal = {SIAM J. Numer. Anal.},\r
    volume = {15 },\r
@@ -9302,7 +9302,7 @@ ELECTR STRUCT and LASER, POB 1527, GR-71110 IRAKLION.},
 }\r
 \r
 @article{Kearsley_2006,\r
-   author = {Kearsley, A.J.},\r
+   author = {Kearsley, A. J.},\r
    title = {Projections Onto Order Simplexes and Isotonic Regression},\r
    journal = {J. Res. Natl. Inst. Stand. Technol.},\r
    volume = {111},\r
@@ -9311,7 +9311,7 @@ ELECTR STRUCT and LASER, POB 1527, GR-71110 IRAKLION.},
 }\r
 \r
 @article{Kelley1960_siam,\r
-   author = {Kelley, J.E.},\r
+   author = {Kelley, J. E.},\r
    title = {The cutting-plane method for solving convex programs},\r
    journal = {J. of SIAM},\r
    volume = {8},\r
@@ -10825,7 +10825,7 @@ PRINCETON, NJ 08544, USA.},
 }\r
 \r
 @article{Lyche1973,\r
-   author = {Lyche, T. and Schumaker, L.L.},\r
+   author = {Lyche, T. and Schumaker, L. L.},\r
    title = {Computation of smoothing and interpolating naturel splines via local bases},\r
    journal = {SIAM J. Numer. Anal.},\r
    volume = {10},\r
@@ -11342,7 +11342,7 @@ undergraduate text},
 }\r
 \r
 @article{McAllister1981_ACM,\r
-   author = {McAllister, D.F. and Roulier, J.A.},\r
+   author = {McAllister, D. F. and Roulier, J. A.},\r
    title = {An algorithm for computing a shape-preserving oscillatory quadratic spline},\r
    journal = {ACM Trans. Math. Software },\r
    volume = {7},\r
@@ -13486,7 +13486,7 @@ IRAKLION, GREECE.},
 }\r
 \r
 @book{Robertson_book,\r
-   author = {Robertson, T. and Wright, F.T. and Dykstra, R.L.},\r
+   author = {Robertson, T. and Wright, F. T. and Dykstra, R. L.},\r
    title = {Order Restricted Statistical Inference},\r
    publisher = {Wiley},\r
    address = {Chichester ; New York},\r
@@ -14261,7 +14261,7 @@ Reprint available from: Schoen F UNIV FLORENCE FLORENCE ITALY},
 }\r
 \r
 @book{Schumaker1981_book,\r
-   author = {Schumaker, L.L.},\r
+   author = {Schumaker, L. L.},\r
    title = {Spline functions: Basic theory},\r
    publisher = {Wiley},\r
    address = {New York},\r
@@ -14269,7 +14269,7 @@ Reprint available from: Schoen F UNIV FLORENCE FLORENCE ITALY},
 }\r
 \r
 @article{Schumaker1983,\r
-   author = {Schumaker, L.L.},\r
+   author = {Schumaker, L. L.},\r
    title = {On Shape Preserving Quadratic Spline Interpolation},\r
    journal = {SIAM Journal on Numerical Analysis},\r
    volume = {20},\r
@@ -14298,7 +14298,7 @@ Princeton, NJ 08544, USA, .},
 }\r
 \r
 @article{Sch,\r
-   author = {Schweikert, D.G.},\r
+   author = {Schweikert, D. G.},\r
    title = {An interpolation curve using a spline in tension},\r
    journal = {J. Math. Phys. },\r
    volume = {45},\r
@@ -14307,7 +14307,7 @@ Princeton, NJ 08544, USA, .},
 }\r
 \r
 @article{Schweikert1966,\r
-   author = {Schweikert, D.G.},\r
+   author = {Schweikert, D. G.},\r
    title = {An interpolation curve using a spline in tension},\r
    journal = {J. Math. Phys.},\r
    volume = {45},\r
@@ -15640,7 +15640,7 @@ United States},
    year = {2000}\r
 }\r
 \r
-   author = {Warren, J. and Noone, J.  and Smith, B. and Ruffin, R. and Frith, P. and van der Zwaag, B.  and Beliakov, G.  and Frankel, H.},\r
+   author = {Warren, J. and Noone, J.  and Smith, B. and Ruffin, R. and Frith, P. and Van der Zwaag, B.  and Beliakov, G.  and Frankel, H.},\r
    title = {Automated Attention Flags in Chronic Disease Care Planning},\r
    journal = {Ausralian Medical Journal},\r
    volume = {175},\r
index 37d840904d09067246da0eda1f43a891eed61067..5da77e6dd84693d088b50ca066bd5d5a78b84091 100644 (file)
@@ -11,8 +11,9 @@ __device__ void Bisection_device(T z, T* t, int mi,int ma,int* l)
   *l = mi-1;
 }
 
-/* Kernel to evaluates monotone spline for a sequence of query points residing in the array z of size m
-*/
+// Kernel to evaluate monotone spline for a sequence of query points 
+// residing in the array z of size m
+
 template<typename Tx, typename Ty>     
 __global__ void d_MonSplineValue(Tx* z, int K, double* t, double * alpha, double * beta, double * gamma, int T, Ty *value)
 {
index b5e4141d6dbf495b07ef8cf522d5f56b655df306..ec060bc56c807aca4217659fdeb486a3898b4b28 100644 (file)
@@ -16,7 +16,7 @@
 }
 
 @Article{aidun2010,
-       author =                         { Aidun, C.K.   and  Clausen, J.R.},
+       author =                         { Aidun, C. K.   and  Clausen, J. R.},
        title =                          {Lattice Boltzmann method for complex flows},
        journal =                {Ann. Rev. Fluid Mech.},
        year =                           {2010},
@@ -35,7 +35,7 @@
 }
 
 @Article{wei2004,
-       author =                         {Wei, X. and Li, W. and  M\"uller, K.  and Kaufman, A.E.},
+       author =                         {Wei, X. and Li, W. and  M\"uller, K.  and Kaufman, A. E.},
        title =                          {The lattice Boltzmann method for simulating gaseous phenomena},
        journal =                {IEEE Transactions on Visualization and Computer Graphics},
        year =                           {2004},
@@ -83,7 +83,7 @@
 
 
 @Article{myre2011,
-       author =                         { Myre, J. and  Walsh, S.D.C. and  Lilja, D. and Saar, M.O.},
+       author =                         { Myre, J. and  Walsh, S. D. C. and  Lilja, D. and Saar, M. O.},
        title =                          {Performance analysis of single-phase, multiphase, and multicomponent lattice Boltzmann fluid flow simulations on GPU clusters},
        journal =                {Concurrency Computat.: Pract. Exper.},
        year =                           {2011},
 }
 
 @Article{bernaschi2010,
-       author =                         {Bernaschi, M. and Fatica, M. and  Melchionna, S. and Succi, S; and Kaxiras, E.},
+       author =                         {Bernaschi, M. and Fatica, M. and  Melchionna, S. and Succi, S. and Kaxiras, E.},
        title =                          {A flexible high-performance lattice Boltzmann GPU code for the
 simulations of fluid flow in complex geometries},
        journal =                {Concurrency Computat.: Pract. Exper.},
@@ -170,7 +170,7 @@ lattice Boltzmann method on GPU cluster},
 }
 
 @Article{walshsaar2012,
-       author =                         {Walsh, S.D.C. and Saar, M.O.},
+       author =                         {Walsh, S. D. C. and Saar, M. O.},
        title =                          {Developing extensible lattice Boltzmann simulators for general-purpose graphics-processing units},
        journal =                {Comm. Comput. Phys.},
        year =                           {2013},
@@ -203,7 +203,7 @@ hierarchical and distributed auto-tuning},
 
 
 @Article{ladd1994,
-       author =                         {Ladd, A.J.C.},
+       author =                         {Ladd, A. J. C.},
        title =                          {Numerical simulations of particle suspensions via a discretized Boltzmann equation. Part 1. Theoretical foundation and Part II. Numerical results},
        journal =                {J. Fluid Mech.},
        year =                           {1994},
@@ -214,7 +214,7 @@ hierarchical and distributed auto-tuning},
 
 
 @Article{nguyen2002,
-       author =                         {Nguyen, N.-Q. and Ladd, A.J.C.},
+       author =                         {Nguyen, N.-Q. and Ladd, A. J. C.},
        title =                          {Lubrication corrections for lattice Boltzmann simulations of particle suspensions},
        journal =                {Phys. Rev. E},
        year =                           {2002},
@@ -223,7 +223,7 @@ hierarchical and distributed auto-tuning},
 }
 
 @Article{ch14:immersed1,
-       author =                         {Peskin, C.S.},
+       author =                         {Peskin, C. S.},
        title =                          {Flow patterns around heart valves; a numerical method},
        journal =                {J. Comp. Phys.},
        year =                           {1972},
@@ -233,7 +233,7 @@ hierarchical and distributed auto-tuning},
 }
 
 @Article{ch14:immersed2,
-       author =                         {Peskin, C.S.},
+       author =                         {Peskin, C. S.},
        title =                          {The immersed boundary method},
        journal =                {Acta Nummerica},
        year =                           {2002},
@@ -243,7 +243,7 @@ hierarchical and distributed auto-tuning},
 }
 
 @Article{ch14:immersed-lb,
-       author =                         {Feng, Z.-G. and  Michaelides, E.E},
+       author =                         {Feng, Z.-G. and  Michaelides, E. E},
        title =                          {The immersed boundary-lattice Boltzmann method for solving
 fluid-particles interaction problem},
        journal =                {J. Comp. Phys.},
index d0bb53fcd1a2cb29db2d05014f2e453865c2d021..8cb390d32062c0fbbcd775aa3ef11a7eae6c3b60 100644 (file)
@@ -1,5 +1,5 @@
 @Inproceedings{PF_PDSEC2011,
-  author ={P. Fortin and  R. Habel and  F.~J\'ez\'equel and J.-L. Lamotte and N.S. Scott},
+  author ={P. Fortin and  R. Habel and  F.~J\'ez\'equel and J.-L. Lamotte and N. S. Scott},
   title = {Deployment on GPUs of an application in computational atomic physics},
   booktitle = {{12th IEEE International Workshop on Parallel and Distributed Scientific 
 and Engineering Computing (PDSEC) in conjunction with the 25th International Parallel and Distributed Processing Symposium (IPDPS)}},
@@ -10,7 +10,7 @@ year = 2011}
 
 
 @article{Burke_1987,
-author={P.G. Burke and C.J. Noble and M.P. Scott},
+author={P. G. Burke and C. J. Noble and M. P. Scott},
 title={{R-matrix theory of electron scattering at intermediate energies}},
 journal={Proceedings of the Royal Society of London A},
 volume=410,
@@ -20,7 +20,7 @@ pages={287--310}
 % %Proc. Roy. Soc. A }
 
 @Article{2DRMP,
-author ={N.S. Scott and M.P. Scott and P.G. Burke and T. Stitt and V. Faro-Maza and C. Denis and A. Maniopoulou},
+author ={N. S. Scott and M. P. Scott and P. G. Burke and T. Stitt and V. Faro-Maza and C. Denis and A. Maniopoulou},
 title ={{2DRMP: A~suite of two-dimensional R-matrix propagation codes}},
 journal ={Computer Physics Communications},
 volume={180},
@@ -30,7 +30,7 @@ pages={2424--2449}
 %note={ISSN: {0010-4655}, doi:10.1016/j.cpc.2009.07.017}
 
 @Article{FARM_2DRMP,
-author ={  V.M. Burke and C.J. Noble and V. Faro-Maza and A. Maniopoulou and N.S. Scott},
+author ={V. M. Burke and C. J. Noble and V. Faro-Maza and A. Maniopoulou and N. S. Scott},
 title ={  {FARM\_2DRMP: a version of FARM for use with 2DRMP}},
 journal ={Computer Physics Communications},
 volume={180},
@@ -41,9 +41,9 @@ pages={2450--2451}
 
 @INPROCEEDINGS{VECPAR,
    author    = {T. Stitt and
-                N.S. Scott and
-                M.P. Scott and
-                P.G. Burke},
+                N. S. Scott and
+                M. P. Scott and
+                P. G. Burke},
    title     = {{2-D R-Matrix Propagation: A Large Scale Electron Scattering
                 Simulation Dominated by the Multiplication of Dynamically
                 Changing Matrices}},
index 9b0bf27bfa807183128f49b1abd9dc086e95f8b9..cf464c7de99215f1fc0e74fc78f2219f052dd6c7 100644 (file)
@@ -825,7 +825,7 @@ as the matrices increase in size during the propagation
 \section{Performance results}
 \subsection{PROP deployment on GPU}
 
-\begin{table*}[ht]
+\begin{table}[ht]
 \begin{center}
 \begin{tabular}{|c||c|c||}
  \hline
@@ -849,13 +849,13 @@ GPU version  & C1060 & C2050 \\
   GPU V5 (\S~\ref{gpuv5}) & 24m27s & 12m39s  \\
   \hline
 \end{tabular}
-\caption{\label{table:time} 
-Execution time of PROP on CPU and GPU}
 \end{center}
-\end{table*}
+\caption{Execution time of PROP on CPU and GPU}
+\label{table:time} 
+\end{table}
 
-\begin{comment}
-\begin{table*}[ht]
+
+\begin{table}[ht]
 \begin{center}
 \begin{tabular}{|c||c|c||}
  \hline
@@ -876,11 +876,10 @@ GPU version  & C1060 & C2050 \\
   GPU V5 (\ref{gpuv5}) & 24m27s & 12m39s  \\
   \hline
 \end{tabular}
-\caption{\label{table:time} 
-Execution time of the successive GPU versions}
 \end{center}
-\end{table*}
-\end{comment}
+\caption{Execution time of the successive GPU versions}
+\label{table:time} 
+\end{table}
 
 \begin{figure}[h]
 \centering
index 3a95e5529817208c3cd70355db5279ba951ab78c..c7bad4048509371481eb3433170e60dc6d53a99c 100644 (file)
@@ -1,4 +1,5 @@
-// compute y = B*x (B is stored in SCOO formats [ cols, rows, values, offsets, numPacks, numRows ])
+// compute y = B*x (B is stored in SCOO formats [ cols, rows, values, 
+//offsets, numPacks, numRows ])
 // LANE_SIZE = 2^k
 // NUM_ROWS_PER_SLICE is computed based on sparsity
 template <const uint32_t THREADS_PER_BLOCK, const uint32_t NUM_ROWS_PER_SLICE, const uint32_t LANE_SIZE>
@@ -13,7 +14,9 @@ sliced_coo_kernel(
                 const float * x,
                       float * y)
 {
-    const int thread_lane = threadIdx.x & (LANE_SIZE-1); // ~ threadIdx.x % LANE_SIZE
+    // ~ threadIdx.x % LANE_SIZE
+        const int thread_lane = threadIdx.x & (LANE_SIZE-1); 
+               
     const int row_lane = threadIdx.x/(LANE_SIZE);
 
     __shared__ float sdata[NUM_ROWS_PER_SLICE][LANE_SIZE];
index 6d7e3f9ed067df541aca52a3ca5836031a0e15a8..e48f2ce606cc62cbce49b0bc44cc263ed31766e0 100644 (file)
@@ -37,7 +37,7 @@ DOI = "10.1002/fld.2675"
 }
 
 @ARTICLE{ch7:EHBM06,
-AUTHOR    = "Engsig-Karup, A.P. and Hesthaven, J.S. and Bingham, H.B. and Madsen, P.",
+AUTHOR    = "Engsig-Karup, A. P. and Hesthaven, J. S. and Bingham, H. B. and Madsen, P.",
 TITLE     = "Nodal {DG-FEM} solutions of high-order {B}oussinesq-type equations",
 JOURNAL   = JEM,
 YEAR      = "2006",
@@ -46,7 +46,7 @@ PAGES     = "351--370"
 }
 
 @ARTICLE{ch7:EHBW08,
-AUTHOR    = "Engsig-Karup, A.P. and Hesthaven, J.S. and Bingham, H.B. and Warburton, T.",
+AUTHOR    = "Engsig-Karup, A. P. and Hesthaven, J. S. and Bingham, H. B. and Warburton, T.",
 TITLE     = "{DG-FEM} solution for nonlinear wave-structure interaction using Boussinesq-type equations",
 JOURNAL   = CE,
 YEAR      = "2008",
@@ -55,7 +55,7 @@ PAGES     = "197--208"
 }
 
 @INPROCEEDINGS{ch7:Glimberg2011,
-  AUTHOR =       {Stefan L. Glimberg and Allan P. Engsig-Karup and Morten G. Madsen},
+  AUTHOR =       {S. L. Glimberg and A. P. Engsig-Karup and M. G. Madsen},
   TITLE =        {A Fast GPU-accelerated Mixed-precision Strategy for Fully Nonlinear Water Wave Computations},
   BOOKTITLE =    {Numerical Mathematics and Advanced Applications 2011, Proceedings of ENUMATH 2011, the 9th European Conference on Numerical Mathematics and Advanced Applications, Leicester, September 2011},
   YEAR =         {2011},
@@ -64,7 +64,7 @@ PAGES     = "197--208"
 }
 
 @ARTICLE{ch7:EBL08,
-AUTHOR    = "Engsig-Karup, A.P. and Bingham, H.B. and Lindberg, O.",
+AUTHOR    = "Engsig-Karup, A. P. and Bingham, H. B. and Lindberg, O.",
 TITLE     = "An efficient flexible-order model for {3D} nonlinear water waves",
 YEAR      = "2009",
 JOURNAL   = JCP,
@@ -141,7 +141,7 @@ PAGES     = "211--228"
 }
 
 @ARTICLE{ch7:MBS03,
-AUTHOR    = "Madsen, P.A. and Bingham, H.B. and Sch{\"a}ffer, H. A.",
+AUTHOR    = "Madsen, P. A. and Bingham, H. B. and Sch{\"a}ffer, H. A.",
 TITLE     = "Boussinesq-type formulations for fully nonlinear and extremely dispersive water waves: derivation and analysis",
 JOURNAL   = RSL,
 YEAR      = "2003",
@@ -150,7 +150,7 @@ PAGES     = "1075--1104"
 }
 
 @ARTICLE{ch7:MBL02,
-AUTHOR    = "Madsen, P.A. and Bingham, H.B. and Liu, H.",
+AUTHOR    = "Madsen, P. A. and Bingham, H. B. and Liu, H.",
 TITLE     = "A new Boussinesq method for fully nonlinear waves from shallow to deep water",
 JOURNAL   = JFM,
 YEAR      = "2002",
@@ -168,7 +168,7 @@ PAGES     = "{319--333}"
 }
 
 @article {ch7:LynettEtAl2004a,
-    AUTHOR = {Lynett, P. and Liu, P.L.-F.},
+    AUTHOR = {Lynett, P. and Liu, P. L.-F.},
      TITLE = {A two-layer approach to wave modelling},
    JOURNAL = {Proc. Roy. Soc. London Ser. A},
   FJOURNAL = {Proceedings of the Royal Society. London. Series A.
@@ -179,7 +179,7 @@ PAGES     = "{319--333}"
 }
 
 @incollection {ch7:TsaiYue1996,
-    AUTHOR = {Tsai, Wu-ting and Yue, Dick K. P.},
+    AUTHOR = {Tsai, W. and Yue, D. K. P.},
      TITLE = {Computation of nonlinear free-surface flows},
  BOOKTITLE = {Annual review of fluid mechanics, Vol.\ 28},
      PAGES = {249--278},
@@ -191,7 +191,7 @@ PAGES     = "{319--333}"
 }
 
 @article {ch7:LynettEtAl2004b,
-    AUTHOR = {Lynett, P. and Liu, P.L.-F.},
+    AUTHOR = {Lynett, P. and Liu, P. L.-F.},
      TITLE = {Linear analysis of the multi-layer model},
    JOURNAL = CE,
     VOLUME = {51},
@@ -200,7 +200,7 @@ PAGES     = "{319--333}"
 }
 
 @article {ch7:DiasBridges2006,
-    AUTHOR = {Dias, Fr{\'e}d{\'e}ric and Bridges, Thomas J.},
+    AUTHOR = {Dias, F. and Bridges, T. J.},
      TITLE = {The numerical computation of freely propagating time-dependent
               irrotational water waves},
    JOURNAL = {Fluid Dynam. Res.},
@@ -240,7 +240,7 @@ PAGES     = "285--297"
 
 
 @incollection {ch7:Yeung1982,
-    AUTHOR = {Yeung, Ronald W.},
+    AUTHOR = {Yeung, R. W.},
      TITLE = {Numerical methods in free-surface flows},
  BOOKTITLE = {Annual review of fluid mechanics, Vol. 14},
      PAGES = {395--442},
@@ -263,13 +263,13 @@ note = "",
 issn = "0079-6611",
 doi = "10.1016/j.pocean.2007.05.005",
 url = "http://www.sciencedirect.com/science/article/pii/S0079661107001206",
-author = "L. Cavaleri and J.-H.G.M. Alves and F. Ardhuin and A. Babanin and M. Banner and K. Belibassakis and M. Benoit and M. Donelan and J. Groeneweg and T.H.C. Herbers and P. Hwang and P.A.E.M. Janssen and T. Janssen and I.V. Lavrenov and R. Magne and J. Monbaliu and M. Onorato and V. Polnikov and D. Resio and W.E. Rogers and A. Sheremet and J. McKee Smith and H.L. Tolman and G. van Vledder and J. Wolf and I. Young",
+author = "L. Cavaleri and J.-H. G. M. Alves and F. Ardhuin and A. Babanin and M. Banner and K. Belibassakis and M. Benoit and M. Donelan and J. Groeneweg and T.H.C. Herbers and P. Hwang and P. A. E. M. Janssen and T. Janssen and I. V. Lavrenov and R. Magne and J. Monbaliu and M. Onorato and V. Polnikov and D. Resio and W. E. Rogers and A. Sheremet and J. McKee Smith and H. L. Tolman and G. van Vledder and J. Wolf and I. Young",
 keywords = "Wind waves",
-keywords = "Wind\89ÛÒwave generation",
-keywords = "Wave\89ÛÒwave interaction",
+keywords = "WindÒwave generation",
+keywords = "WaveÒwave interaction",
 keywords = "Wave propagation",
 keywords = "Wave dissipation",
-keywords = "Wave\89ÛÒcurrent interaction",
+keywords = "WaveÒcurrent interaction",
 keywords = "Numerics"
 }
 
@@ -303,7 +303,7 @@ YEAR      = "1982"
 }
 
 @BOOK{ch7:Hackbusch1982,
-AUTHOR    = "Hackbusch W.",
+AUTHOR    = "Hackbusch, W.",
 TITLE     = "On multigrid iterations with defect correction. In: Hackbusch, W.; Trottenberg, U. (eds): Lecture Notes in Math.",
 BOOKTITLE = "Multigrid Methods",
 VOLUME = "960",
@@ -313,7 +313,7 @@ YEAR      = "1982"
 }
 
 @article {ch7:MR744926,
-    AUTHOR = {Schaffer, Steve},
+    AUTHOR = {Schaffer, S.},
      TITLE = {Higher order multigrid methods},
    JOURNAL = {Math. Comp.},
   FJOURNAL = {Mathematics of Computation},
@@ -352,7 +352,7 @@ year = "2011",
 issn = "1631-0721",
 doi = "10.1016/j.crme.2010.11.002",
 url = "http://www.sciencedirect.com/science/article/pii/S1631072110002032",
-author = "David E. Keyes",
+author = "D. E. Keyes",
 keywords = "Computer science",
 keywords = "Exaflop",
 keywords = "Informatiquealgorithmique",
@@ -375,7 +375,7 @@ YEAR      = "2006"
 
 @book{ch7:Whalin1971,
   title={The Limit of Applicability of Linear Wave Refraction Theory in a Convergence Zone},
-  author={Whalin, R.W. and United States. Army. Corps of Engineers and Waterways Experiment Station (U.S.)},
+  author={Whalin, R. W. and United States. Army. Corps of Engineers and Waterways Experiment Station (U.S.)},
   series={Research report},
   url={http://books.google.dk/books?id=wwvWSgAACAAJ},
   year={1971},
@@ -383,7 +383,7 @@ YEAR      = "2006"
 }
 
 @article{ch7:AbottEtAl1984,
-author = "Abott, M.B. and McCowan, A.D. and Warren, I.R.",
+author = "Abott, M. B. and McCowan, A. D. and Warren, I. R.",
 title = "Accuracy of short-wave numerical models",
 journal = "ASCE Journal of Hydraulic Engineering",
 volume = "110",
@@ -393,7 +393,7 @@ year = "1984"
 }
 
 @article{ch7:AbottEtAl1978,
-author = "Abott, M.B. Petersens, H.M. and Skovgaard, O.",
+author = "Abott, M. B. Petersens, H. M. and Skovgaard, O.",
 title = "On the numerical modelling of short waves in shallow water",
 journal = "Journal of Hydraulic Research",
 volume = "16",
@@ -403,7 +403,7 @@ year = "1978"
 }
 
 @ARTICLE{ch7:MS98,
-AUTHOR    = "Madsen, P.A. and Sch{\"{a}}ffer, H. A.",
+AUTHOR    = "Madsen, P. A. and Sch{\"{a}}ffer, H. A.",
 TITLE     = "Higher order Boussinesq-type equations for surface gravity waves - derivation and analysis.",
 JOURNAL   = "In Advances in Coastal and Ocean Engineering",
 VOLUME    = "356",
@@ -412,7 +412,7 @@ PAGES     = "3123--3181"
 }
 
 @article{ch7:Peregrine1967,
-author = "Peregrine, D.H.",
+author = "Peregrine, D. H.",
 title = "Long waves on a beach",
 journal = "Journal of Fluid Mechanics",
 volume = "27",
@@ -430,7 +430,7 @@ published = {SIAM}
 
 
 @ARTICLE{ch7:GlimbergEtAl2012,
-  AUTHOR =       {Stefan L. Glimberg and Allan P. Engsig-Karup},
+  AUTHOR =       {S. L. Glimberg and A. P. Engsig-Karup},
   TITLE =        {On a Multi-GPU Implementation of a Free Surface Water Wave Model for Large-scale Simulations},
   JOURNAL =      {Submitted to: Special Issue of the Journal Parallel Computing},
   YEAR =         {2012},
@@ -479,7 +479,7 @@ published = {SIAM}
 
 
 @mastersthesis{ch7:ASNP12,
-       author = {Allan S. Nielsen},
+       author = {A. S. Nielsen},
        title = {Feasibility study of the Parareal algorithm},
        school = {Technical University of Denmark, Department of Informatics and Mathematical Modeling},
        year = {2012},
@@ -487,7 +487,7 @@ published = {SIAM}
 }
 
 @Book{ch7:Higham:2002:ASN,
-  author =       "Nicholas J. Higham",
+  author =       "N. J. Higham",
   title =        "Accuracy and Stability of Numerical Algorithms",
   publisher =    "Society for Industrial and Applied Mathematics",
   address =      "Philadelphia, PA, USA",
@@ -526,7 +526,7 @@ note = "",
 issn = "0378-3839",
 doi = "10.1016/j.coastaleng.2008.10.012",
 url = "http://www.sciencedirect.com/science/article/pii/S0378383908001865",
-author = "Harry B. Bingham and Per A. Madsen and David R. Fuhrman",
+author = "H. B. Bingham and P. A. Madsen and D. R. Fuhrman",
 keywords = "Boussinesq-type equations",
 keywords = "Nonlinear waves",
 keywords = "Potential flow",
index c18d417bf1e84650ab1605d1a22e9bb926009c8b..45fc4537654456483c5e1dc70d7bc7f6d816e1f8 100644 (file)
@@ -535,7 +535,8 @@ __global__ void laplace_sigma_transformed(
        {                       
                size_type offset_i = i < alpha ? 2*alpha-i : i >= Ns-alpha ? Ns-1-i : alpha;
                size_type row_i    = offset_i*rank;
-               size_type offset_j = alpha;  // Always centered stencils in x-dir
+    // Always centered stencils in x-dir
+               size_type offset_j = alpha;  
                size_type row_j    = alpha*rank;
                        
                value_type dhdx    = hx[j];
index 78424f2a889ce90deac95fa68c9563544e432cfc..3e10526e448229e7de46ab0f80bf1a5251b2c49f 100644 (file)
@@ -7,14 +7,14 @@
    }
 
 @InProceedings{ch8:Carneiro_2011,
- author =       {T. Carneiro and A. Einstein Muritibab and M. Negreirosc and G. Augusto Lima de Campos},
+ author =       {T. Carneiro and A. E. Muritibab and M. Negreirosc and G. A. Lima de Campos},
  title =        {A New Parallel Schema for Branch-and-Bound Algorithms Using GPGPU},
  booktitle =    {23rd International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD)},
  year =         {2011}
 }
 
 @ARTICLE{ch8:Casadoa_2008,
-   author =    "L.G. Casadoa and J.A. Martíneza and I. Garcíaa and E.M.T. Hendrixb.",
+   author =    "L. G. Casadoa and J. A. Martíneza and I. Garcíaa and E. M. T. Hendrixb.",
    title =     "Branch-and-Bound interval global optimization on shared memory multiprocessors",
    journal =   "Optimization Methods and Software",
    volume =    "23, No.5",
@@ -32,7 +32,7 @@
 }
 
 @Article{ch8:Garey_1976,
- author =       {M.R. Garey and D.S. Johnson and R. Sethi},
+ author =       {M. R. Garey and D. S. Johnson and R. Sethi},
  title =        {{The complexity of flow-shop and job-shop scheduling}},
  journal =      {Mathematics of Operations Research},
  year =         {1976},
@@ -42,7 +42,7 @@
 }
 
 @Article{ch8:Gendron_1994,
- author =       {B. Gendron and T.G. Crainic},
+ author =       {B. Gendron and T. G. Crainic},
  title =        {Parallel {B}ranch and {B}ound {A}lgorithms: {S}urvey and {S}ynthesis},
  journal =      {Operations Research},
  year =         {1994},
@@ -52,7 +52,7 @@
 }
 
 @InProceedings{ch8:Han,
- author =       {T. Han and T.S. Abdelrahman},
+ author =       {T. Han and T. S. Abdelrahman},
  title =        {Reducing branch divergence in GPU programs},
  booktitle =    {{In Proceedings of the Fourth Workshop on General Purpose Processing on Graphics Processing Units (GPGPU-4), ACM}},
  year =         {2011},
@@ -60,7 +60,7 @@
 }
 
 @Article{ch8:Johnson_1954,
- author =       {S.M. Johnson},
+ author =       {S. M. Johnson},
  title =        {{Optimal two and three-stage production schedules with setup times included}},
  journal =      {Naval Research Logistis Quarterly},
  year =         {1954},
@@ -77,7 +77,7 @@
    }
 
 @Article{ch8:Lenstra_1978,
- author =       {J.K. Lenstra and B.J. Lageweg and A.H.G. Rinnooy Kan},
+ author =       {J. K. Lenstra and B. J. Lageweg and A. H. G. Rinnooy Kan},
  title =        {{A General bounding scheme for the permutation flow-shop problem}},
  journal =      {Operations Research},
  year =         {1978},
@@ -108,7 +108,7 @@ NOTE =              "Th\`ese HDR"
 }
 
 @ARTICLE{ch8:JRJackson_1956,
-       AUTHOR ="J.R.Jackson",
+       AUTHOR ="J. R. Jackson",
        TITLE ="An Extension of Johnson's results on Job-Lot Scheduling",
        JOURNAL ="Naval Research Logistis Quarterly",
        YEAR ="1956",
@@ -116,7 +116,7 @@ NOTE =              "Th\`ese HDR"
 }
 
 @ARTICLE{ch8:LGMitten_1959,
-       AUTHOR ="L.G.Mitten",
+       AUTHOR ="L. G. Mitten",
        TITLE ="Sequencing n jobs on two machines with arbitrary time lags",
        JOURNAL ="Management Science",
        YEAR ="1959"
@@ -141,7 +141,7 @@ NOTE =              "Th\`ese HDR"
    }
 
 @InProceedings{ch8:Zhang,
- author =       {E.Z. Zhang and Y. Jiang and Z. Guo and X. Shen},
+ author =       {E. Z. Zhang and Y. Jiang and Z. Guo and X. Shen},
  title =        {Streamlining GPU applications on the fly: thread divergence elimination through runtime thread-data remapping},
  booktitle = {{In Proceedings of the 24th ACM International Conference on Supercomputing (ICS'10), ACM.}},
  year =         {2010},
index 5c32a72157d7abf1d5ed13e4197e951c1e5f3870..041c4613108cad104b4c4905175c311a46374d5b 100644 (file)
@@ -228,7 +228,7 @@ year = {2013}
 }
 
 @incollection{paradiseoGPU,
-author={Melab, N. and Luong, T.V. and Boufaras, K. and Talbi, E.G.},
+author={Melab, N. and Luong, T. V. and Boufaras, K. and Talbi, E.-G.},
 title={{Towards ParadisEO-MO-GPU: A Framework for GPU-Based Local Search Metaheuristics}},
 booktitle={Advances in Computational Intelligence},
 series={Lecture Notes in Computer Science},
@@ -238,7 +238,7 @@ year={2011}
 }
 
 @incollection{luongMultiStart,
-author={T. V. Luong and N. Melab and E-G. Talbi},
+author={T. V. Luong and N. Melab and E.-G. Talbi},
 title={{GPU-Based Multi-start Local Search Algorithms}},
 booktitle={Learning and Intelligent Optimization},
 series={Lecture Notes in Computer Science},