]> AND Private Git Repository - ancetre.git/blob - presentation.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
Modifs
[ancetre.git] / presentation.tex
1 Given a bacteria, various complete genomes can be found on the Internet.
2 For each genome, the complete records in fasta file are downloaded from the
3 NCBI nucleotide website. Then, GenemarkS is queried to find open reading
4 frames we will improperly called genes in the remainder of this document.
5 Another approach could be to download directly the coding sequence files from
6 the NCBI, however our experiments show that the annotated files are sometimes
7 really problematic. Furthermore, almost thirty gene prediction software (GPS) exist,
8 and they potentially can be used with various parameters, leading to numerous
9 different annotated genomes. For our part, we have chosen the three most famous
10 GPS, namely Glimmer, GeneMark, and Rast (see Table~\ref{GPS}).
11 \begin{table}
12 \centering
13 \begin{tabular}{|l|c|}
14 \hline
15 Gene prediction software & Good ORFs \\
16 \hline
17 Glimmer & 2558 \\
18 Genemask & 2768 \\
19 Rast & 2560 \\
20 \hline
21 \end{tabular}
22 \caption{Gene prediction scores of the best GPS on H37Rv}
23 \label{GPS}
24 \end{table}