]> AND Private Git Repository - book_gpu.git/blob - BookGPU/Chapters/chapter16/date12envelope.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
add ch4
[book_gpu.git] / BookGPU / Chapters / chapter16 / date12envelope.tex
1 \documentclass[conference]{IEEEtran}
2
3 \usepackage{graphicx}
4 \usepackage{algorithm,algorithmic}
5 \usepackage{multirow}
6 \usepackage{subfigure}
7 \usepackage{booktabs}
8 \usepackage{epstopdf}
9 \usepackage{graphicx}
10 \usepackage[dvips]{color}
11 \usepackage{psfrag}
12 \usepackage{pstricks}
13 \usepackage{amssymb,amsmath}
14 %\usepackage{authblk}
15 \usepackage{cite}
16 \usepackage{url}
17
18 \DeclareGraphicsRule{.pdftex}{pdf}{*}{}
19 \graphicspath{{matlab/}}
20
21
22 \newtheorem{myformulation}{Formulation}
23 \newtheorem{mytheorem}{Theorem}
24 \newtheorem{mylemma}{Lemma}
25 \newtheorem{mydefinition}{Definition}
26 %\ninept
27
28 % correct bad hyphenation here
29 %\hyphenation{op-tical net-works semi-conduc-tor IEEEtran}
30 %\renewcommand{\baselinestretch}{0.99}
31
32
33 \renewcommand{\algorithmicrequire}{\textbf{Input:}}
34 \renewcommand{\algorithmicensure}{\textbf{Output:}}
35 \renewcommand{\algorithmiccomment}[1]{\% \textit{#1}}
36
37
38 \newcommand{\setRn}{\mathbb{R}_{}^N}
39 \newcommand{\setR}{\mathbb{R}}
40 \newcommand{\ud}{\,\mathrm{d}}
41 \newcommand{\res}[1]{\mathbf{r}^{(#1)}}
42 \newcommand{\vtr}[1]{\mathbf{#1}}
43 \newcommand{\mtx}[1]{\mathbf{#1}}
44 \newcommand{\mtxPhi}{\boldsymbol{\phi}}
45 \newcommand{\mT}{\mathrm{T}}
46
47 \IEEEoverridecommandlockouts
48
49
50 \renewcommand{\baselinestretch}{0.97}
51
52 \begin{document}
53 \title{
54 A GPU-Accelerated Envelope-Following Method for Switching Power Converter Simulation
55 }
56 \author{
57   \IEEEauthorblockN{
58     Xue-Xin Liu\IEEEauthorrefmark{1},
59     Sheldon X.-D. Tan\IEEEauthorrefmark{1},
60     Hai Wang\IEEEauthorrefmark{1}, and
61     Hao Yu\IEEEauthorrefmark{2}
62   }
63   \IEEEauthorblockA{
64     \IEEEauthorrefmark{1}Dept. Electrical Engineering,
65     University  of California, Riverside, CA 92521
66   }
67   \IEEEauthorblockA{
68     \IEEEauthorrefmark{2}School of Electrical \& Electronic Engineering,
69     Nanyang Technological University
70   }
71   \thanks{
72     This research was supported in part by NSF grants under
73     No.~CCF-1017090 
74     No.~OISE-1051797, and
75     No.~OISE-0929699.
76   }
77 }
78
79 %\IEEEpubid{978-3-9810801-8-6/DATE12/@2012 EDAA}
80
81 \maketitle
82
83 \begin{abstract}
84 % Power converters have seen a surge of new trends and novel
85 % applications due to their widespread use  in renewable energy
86 % systems and emerging  hybrid and purely-electric vehicles. More
87 % efficient simulation  techniques for power converters are urgently
88 % needed to meet more design constraints.
89 In this paper, we propose a new envelope-following parallel transient analysis method for 
90 the general switching power converters. The new method first exploits 
91 the parallelisim in the envelope-following method
92 and parallelize the Newton update solving part,
93 which is the most computational expensive, in GPU platforms 
94 to boost the simulation performance.
95 To further speed up the iterative GMRES
96 solving for Newton update equation in the envelope-following
97 method, we apply the matrix-free Krylov basis generation
98 technique, which was previously used for RF simulation. 
99 Last, the new method also applies more robust
100 Gear-2 integration to compute the sensitivity matrix instead of
101 traditional integration methods. 
102 %Furthermore, the resulted Gear-2 and matrix-free GMRES have been
103 Experimental results from several integrated on-chip power
104 converters show that the proposed GPU envelope-following algorithm leads to
105 about 10$\times$ speedup compared to its CPU counterpart,
106 and 100$\times$ faster than the traditional envelop-following methods
107 while still keeps the similar accuracy.
108 \end{abstract}
109
110 \input intro.tex
111 \input ef.tex
112 %\input bdf.tex  % now inside gpu.tex now
113 \input gpu.tex
114 \input exp.tex
115
116 \section{Conclusion} \label{sec:conclusion}
117 A new envelope-following method for transient analysis of
118 switching power converters has been introduced.
119 First, the computationally expensive step,
120 the solving of Newton update equation,
121 has been parallelized on CUDA-enabled GPU platforms
122 with iterative GMRES solver to boost performance of the analysis method.
123 To further speed up the GMRES solving for Newton update equation,
124 we have employed the matrix-free Krylov basis generation technique.
125 The proposed method also applies the more robust Gear-2 integration
126 to compute the sensitivity matrix.
127 Experimental results from several integrated
128 on-chip power converters have shown that the proposed GPU
129 envelope-following algorithm can lead to about 10$\times$
130 speedup compared to its CPU counterpart,
131 and 100$\times$ faster than the traditional
132 envelop-following methods while still keeps the similar accuracy.
133
134
135 \bibliographystyle{unsrt} % IEEEtranS
136 \bibliography{./envelope,../../bib/interconnect,../../bib/architecture,../../bib/simulation}
137 % ./rfsim.bib
138
139 \end{document}