Tesis: "Short read and long read sequencing"

1

Soundiramourtty, Abirami. "Exploring the transpositional landscape and recent transposable element activity in beech trees using long read mobilome and genome sequencing and with new computational tools". Electronic Thesis or Diss., Perpignan, 2024. http://www.theses.fr/2024PERP0043.

Texto completo

Resumen

L’adaptation des organismes aux changements environnementaux est devenue une question fondamentale de la recherche, en particulier face aux impacts du réchauffement climatique. Un axe clé de recherche consiste à comprendre comment les éléments génétiques sous jacent, tels que les éléments transposables (ET). Les ET sont des séquences d'ADN répétés présentes chez tous les Eucaryotes, possédant la capacité unique de se déplacer au sein du génome, un phénomène appelé transposition active. Ainsi, ils peuvent provoquer des mutations en générant des insertions polymorphiques d'ET (TIPs) entre individus, voire des insertions somatiques. En général, les ET restent inactifs grâce à des mécanismes épigénétiques qui limitent leur prolifération incontrôlée. Cependant, ils peuvent être réactivés par divers stimuli environnementaux, rendant la transposition active relativement rare. Cette mobilité des ET peut être révélée en utilisant l'ADN circulaire extrachromosomique (ADNecc) comme marqueur de transposition. Le paysage transpostionnel des TEs et leur activité récente ont été décrits chez des organismes modèles, mais restent inexploités chez les espèces pérennes comme les arbres. Cette étude vise à explorer l’activité transpositionelle récente et la mobilité en cours des ET chez des espèces pérennes non modèles en utilisant le hêtre européen (Fagus sylvatica) comme notre modèle d’étude. Nous avons cherché à étudier l'activité récente des ET et leur mobilité continue en identifiant les variants causés par les ET au sein d'une population et chez un individu (à l'échelle somatique) en utilisant le séquençage du génome complet (WGS) et le séquençage du mobilome (ou ADNecc). Nous avons réalisé le séquençage WGS et du mobilome d'arbres de la forêt de Verzy, connue pour abriter des hêtres nains et tortillards, également appelés « mutants ». Ces arbres présentent des traits morphologiques instables, avec chez certains arbres de nouvelles branches qui se développent avec une forme normale. Nous avons identifié deux ET appartenant au type des Miniature Inverted Repeats Transposable Elements (MITEs), nommés SQUIRREL1 et SQUIRREL2, qui se mobilisent activement dans ces arbres, produisant une grande quantité dADNecc et causant même des variations somatiques. SQUIRREL1 et SQUIRREL2 sont également actifs dans les hêtres de la forêt de la Massane. De plus, dans tous ces arbres, plusieurs d’autres ET, principalement des MITEs, produisent une grande quantité dADNecc, bien que leur niveau d’activité semble varier en fonction des tissus, suggérant que l'activité des ET varie selon le stade de développement et indiquant une transposition dominée par les MITEs chez le hêtre. Parallèlement, nous avons étudié les TIPs dans une population de hêtres de la forêt de la Massane, une forêt ancienne classée au patrimoine mondial de l'UNESCO. En séquençant 150 arbres, nous avons cherché à comprendre comment les ET contribuent à la diversité génétique de l'ensemble de la population en détectant les TIPs générés par les Long Terminal Repeats rétrotransposons (LTR RT) et les MITEs en utilisant le séquençage WGS. Nous avons détecté environ 30 000 TIPs de LTR-RT chez chaque individu, contre 70 000 TIPs de MITEs. La plupart de ces TIPs restent à faible fréquence mais de nombreux MITE-TIPs restent localisés près de gènes fonctionnels et conservés au sein de la population. À partir des TIPs, nous avons identifié plusieurs points chauds de variation et des régions conservées le long du génome du hêtre permettant d’abordant la structuration du génome chez cette espèce. Pour conclure, notre étude met en lumière l’importance des ET dans la structuration du paysage génomique des arbres, en particulier dans la manière dont ces éléments contribuent à l’évolution des espèces à longue durée de vie. Les recherches futures pourraient étendre ces travaux à d’autres espèces d'arbres et explorer si les schémas observés se retrouvent dans d’autres espèces d’arbres
The adaptation of organisms to environmental changes has become a fundamental research question,particularly in the context of climate change. A key area of this research is to identify underlying genetic elements, such as transposable elements (TEs), contributing to this process. TEs are repetitive DNA sequences found across all eukaryotes, possessing the unique ability to move within the genome, a phenomenon known as active transposition. They can cause mutations by generating transposable element insertion polymorphisms (TIPs) between individuals, and even somatic insertions. Generally, TEs remain inactive by epigenetic mechanisms that limit their uncontrolled proliferation. However, they can be reactivated upon various environmental stimuli, making active transposition relatively rare. TE mobility can be detected using extrachromosomal circular DNA (eccDNA) as a marker of transposition. The transpositional landscape of TEs and their recent activity have been documented in model organisms but remain underexplored in perennial species such as trees. This study aims to investigate recent transpositional activity and ongoing mobility of TEs in non-model perennial species, using European beech (Fagus sylvatica) as our model. We sought to study recent TE activity and their continuous mobility byidentifying TE-induced variants within a population and in an individual (at the somatic scale) using whole-genome sequencing (WGS) and mobilome sequencing (eccDNA). We conducted WGS and mobilome sequencing of trees from the Verzy forest, known for its dwarf and tortuous beeches, also referred as "mutants." These trees exhibit unstable phenotypical traits, with some trees developing new normal branches. We identified two TEs belonging to the Miniature Inverted Repeat Transposable Elements (MITEs) type, named SQUIRREL1 and SQUIRREL2, which are actively mobilizing in these trees, producing large amounts of eccDNA and even causing somatic variations.SQUIRREL1 and SQUIRREL2 are also active in beech trees from the Massane forest. Furthermore, in all these trees, several other TEs,mainly MITEs, produce significant amounts of eccDNA, although their activity levels appear to vary depending on the tissues, suggesting that TE activity could be tissue-specific indicating MITE-dominated transposition in beech. Simultaneously, we investigated TIPs in a population of beech trees from the Massane forest, an ancient forest classified as a UNESCO World Heritage site. By sequencing 150 trees, we aimed to understand how TEs contribute to the genetic diversity of the entire population by detecting TIPs generated by Long Terminal Repeat retrotransposons (LTR-RTs) and MITEs using WGS. We detected approximately 30,000 LTR-RT TIPs in each individual, compared to 70,000 MITE TIPs. While most of these TIPs remain at low frequency, many MITE-TIPs are located near functional genes and more conserved within the population. Using these TIPs, we identified several hotspots of variation and conserved regions along the beech genome, providing insights into genome structure in this species. In conclusion, our study highlights the importance of TEs in shaping the genomic landscape of trees, particularly in understanding how these elements contribute to the evolution of long-lived species. Future research could expand this work to other tree species and explore whether the patterns observed in beeches are common in other types of trees