Tesis: "Annotation de modèles"

1

Flutre, Timothée. "L' annotation des éléments transposables par la compréhension de leur diversification". Paris 7, 2010. http://www.theses.fr/2010PA077239.

Texto completo

Resumen

Les éléments transposables sont des fragments du génome possédant la particularité d'être mobiles. Ils ont un impact majeur sur la structure des génomes mais également sur l'expression des gènes avoisinants, notamment via des mécanismes épigénétiques. Cependant, mis à part certains organismes modèles pour lesquels nous disposons de séquences de référence, l'annotation des éléments transposables représente un goulot d'étranglement dans l'analyse des génomes séquences. J'ai donc comparé les programmes informatiques existants utilisés dans les approches d'annotation de novo des éléments transposables. Pour cela, j'ai mis au point un protocole de test sur les génomes de Drosophila melanogaster et Arabidopsis thaliana. Ceci m'a permis de proposer une approche de novo combinant plusieurs outils, capable ainsi de reconstruire automatiquement un grand nombre de séquences de référence. De plus, j'ai pu montrer que cette approche mettait en évidence les variations structurales au sein de familles bien connues, reflétant ainsi la diversification de ces familles au cours de leur évolution. J'ai implémenté cette approche dans une suite d'outils (REPET) rendant possible l'analyse des éléments transposables de nombreux génomes d,e plantes, insectes, champignons, etc. Ces travaux ont abouti à une feuille de route décrivant de manière pratique comment annoter le contenu en éléments transposables de tout génome nouvellement séquence. En perspective, je propose plusieurs pistes de recherche, notamment la simulation des données nécessaires à l'amélioration des algorithmes de détection, démarche complémentaire de la modélisation de la dynamique des éléments transposables
Transposable elements are DNA sequences that can move and duplicata within genomes. They hence have a major impact on genome structure but also on the expression of neighbouring genes, notably via epigenetiç mechanisms. However, except for some model organisms for which reference sequences are available, the annotation of transposable elements corresponds to a bottleneck in the analysis of genomic sequences. Therefore, I started by comparing existing computer programs used in de novo approaches of transposable element identification. In this aim, I designed a test protocol on the genomes of Drosophila melanogaster and Arabidopsis thaliana. As a result, I proposed a de novo approach combining several tools, thus enabling the automatic recovery of a great number of reference sequences. Moreover, I showed that our approach highlighted the structural variations present within well-known families, thus reflecting the diversification of such families during their evolution. This approach was implemented in a package (REPET) making possible the analysis of transposable elements in numerous genomes from plants, insects and fungi among others. This work lead to a roadmap describing, from a practical point of view, how to annotate the transposable element content of any newly sequenced genome. Finally, I propose several perspectives, notably the simulation of the data required for the improvement of the detection algorithms, a way complementary to the modeling of transposable element dynamics