]> AND Private Git Repository - book_gpu.git/blob - BookGPU/Chapters/chapter16/ch16.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
update embedded fonts
[book_gpu.git] / BookGPU / Chapters / chapter16 / ch16.tex
1 \chapterauthor{X.-X. Liu}{Dept. Electrical Engineering,
2   University  of California, Riverside, CA 92521}
3 \chapterauthor{S. X.-D. Tan}{Dept. Electrical Engineering,
4   University  of California, Riverside, CA 92521}
5 \chapterauthor{H. Wang}{Univ. of Electronics Science and Technology of China,
6   Chengdu, Sichuan, China}
7 \chapterauthor{H. Yu}{School of Electrical \& Electronic Engineering,
8   Nanyang Technological University, Singapore}
9
10 %  \thanks{
11 %    This research was supported in part by NSF grants under
12 %    No.~CCF-1017090 
13 %    No.~OISE-1051797, and
14 %    No.~OISE-0929699.
15 %  }
16
17 \newcommand{\ud}{\,\mathrm{d}}
18
19 %\renewcommand{\algorithmicrequire}{\textbf{Input:}}
20 %\renewcommand{\algorithmicensure}{\textbf{Output:}}
21 %\renewcommand{\algorithmiccomment}[1]{\% \textit{#1}}
22
23 \chapter[GPU-Accelerated Envelope-Following Method]{A GPU-Accelerated Envelope-Following Method for Switching Power Converter Simulation}
24
25 % \section{Abstract}
26 % % Power converters have seen a surge of new trends and novel
27 % % applications due to their widespread use  in renewable energy
28 % % systems and emerging  hybrid and purely-electric vehicles. More
29 % % efficient simulation  techniques for power converters are urgently
30 % % needed to meet more design constraints.
31 % In this chapter, we propose a new envelope-following parallel transient analysis method for 
32 % the general switching power converters. The new method first exploits 
33 % the parallelisim in the envelope-following method
34 % and parallelize the Newton update solving part,
35 % which is the most computational expensive, in GPU platforms 
36 % to boost the simulation performance.
37 % To further speed up the iterative GMRES
38 % solving for Newton update equation in the envelope-following
39 % method, we apply the matrix-free Krylov basis generation
40 % technique, which was previously used for RF simulation. 
41 % Last, the new method also applies more robust
42 % Gear-2 integration to compute the sensitivity matrix instead of
43 % traditional integration methods. 
44 % %Furthermore, the resulted Gear-2 and matrix-free GMRES have been
45 % Experimental results from several integrated on-chip power
46 % converters show that the proposed GPU envelope-following algorithm leads to
47 % about 10$\times$ speedup compared to its CPU counterpart,
48 % and 100$\times$ faster than the traditional envelop-following methods
49 % while still keeps the similar accuracy.
50
51 \input{Chapters/chapter16/intro.tex}
52 \input{Chapters/chapter16/ef.tex}
53 %\input bdf.tex  % now inside gpu.tex now
54 \input{Chapters/chapter16/gpu.tex}
55 \input{Chapters/chapter16/exp.tex}
56
57 \section{Summary}
58 \label{sec:summary}
59 In this chapter, we present a new envelope-following method for
60 transient analysis of switching power converters.  First, the
61 computationally expensive step, the solving of Newton update equation,
62 has been parallelized on CUDA-enabled GPU platforms with iterative
63 GMRES solver to boost performance of the analysis method.  To further
64 speed up the GMRES solving for Newton update equation, we have
65 employed the matrix-free Krylov basis generation technique.  The
66 proposed method also applies the more robust Gear-2 integration to
67 compute the sensitivity matrix.  Experimental results from several
68 integrated on-chip power converters have shown that the proposed GPU
69 envelope-following algorithm can lead to about 10$\times$ speedup
70 compared to its CPU counterpart, and 100$\times$ faster than the
71 traditional envelope-following methods while still keeps the similar
72 accuracy.
73
74
75 \section{Glossary}
76 \begin{Glossary}
77 \item[Envelope-Following] In transient simulation of switching power circuits,
78 nodal voltage waveforms in neighboring high frequency clock cycles are similar,
79 but not exactly the duplicates. Envelope-following technique approximates
80 the slowly changing transient trend over a lot of clock cycles
81 without calculating waveforms in all cycles.
82 \end{Glossary}
83
84 \putbib[Chapters/chapter16/biblio16]
85 %\bibliography{./envelope,../../bib/interconnect,../../bib/architecture,../../bib/simulation}