Siga este enlace para ver otros tipos de publicaciones sobre el tema: Annotation de génome.

Tesis sobre el tema "Annotation de génome"

Crea una cita precisa en los estilos APA, MLA, Chicago, Harvard y otros

Elija tipo de fuente:

Consulte los 28 mejores tesis para su investigación sobre el tema "Annotation de génome".

Junto a cada fuente en la lista de referencias hay un botón "Agregar a la bibliografía". Pulsa este botón, y generaremos automáticamente la referencia bibliográfica para la obra elegida en el estilo de cita que necesites: APA, MLA, Harvard, Vancouver, Chicago, etc.

También puede descargar el texto completo de la publicación académica en formato pdf y leer en línea su resumen siempre que esté disponible en los metadatos.

Explore tesis sobre una amplia variedad de disciplinas y organice su bibliografía correctamente.

1

Daccord, Nicolas. "Analyse bioinformatique du génome et de l’épigénome du pommier". Thesis, Angers, 2018. http://www.theses.fr/2018ANGE0034/document.

Texto completo
Resumen
La pomme est l’un des fruits les plus consommés au monde. En utilisant les dernières technologies de séquençage (PacBio) et de cartes optiques (BioNano), nous avons généré un assemblage de novo de haute qualité du génome du pommier (Malus domestica Borkh.). Nous avons réalisé une annotation des gènes et des éléments transposables pour permettre à cet assemblage d’être utilisé en tant que génome de référence. La grande contiguité de l’assemblage a permis de détecter les éléments transposables de façon exhaustive, ce qui fournit une opportunité sans précédents d’étudier les régions non-caractérisées d’un génome d’arbre. Nous avons également trouvé que le génome du pommier est entièrement dupliqué, comme montré par les relations de synthénie entre les chromosomes. En utilisant du Whole Genome Bisulfite Sequencing (WGBS) ainsi que l’assemblage précédemment généré, nous avons montré des cartes de méthylation de l’ADN pour tout le génome et montré une corrélation générale entre la méthylation de l’ADN près des gènes et l’expression des gènes. De plus, nous avons identifié plusieurs Régions Différentiellement Méthylées (RDMs) entre les méthylomes de fruits et de feuilles du pommier, associées à des gènes candidats qui pourraient être impliqués dans des traits agronomiques importants tel que le développement du fruit. Enfin, nous avons développé un pipeline rapide, simple et complet qui prend entièrement en charge l’analyse des données WGBS, de l’alignement des reads au calcul des RDMs
Apple is one of the most consumed fruits in the world. Using the latest sequencing (PacBio) and optical mapping (BioNano) technologies, we have generated a high-quality de novo assembly of the apple (Malus domestica Borkh.) genome. We performed a gene annotation as well as a transposable element annotation to allow this assembly to be used as a reference genome. The highcontiguity of the assembly allowed to exhaustively detect the transposable elements, which represented over half the assembly, thus providing an unprecedented opportunity to investigate the uncharacterized regions of a tree genome. We also found that the apple genome is entirely duplicated as showed by the synteny links between chromosomes. Using Whole Genome Bisulfite Sequencing (WGBS) and the previously generated assembly, we produced genome-wide DNA methylation maps and showed a general correlation between DNA methylation next to genes and gene expression. Moreover, we identified several Differentially Methylated Regions (DMRs) between apple fruits and leaf methylomes associated to candidate genes that could be involved in agronomically relevant traits such as apple fruit development. Finally, we developped a complete and easyto- use pipeline which aim is to handle the complete treatment of WGBS data, from the reads mapping to the DMRs computing. It can handle datasets having a low number of biological replicates
Los estilos APA, Harvard, Vancouver, ISO, etc.
2

Cleynen, Alice. "Approches statistiques en segmentation : application à la ré-annotation de génome". Phd thesis, Université Paris Sud - Paris XI, 2013. http://tel.archives-ouvertes.fr/tel-00913851.

Texto completo
Resumen
Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel.
Los estilos APA, Harvard, Vancouver, ISO, etc.
3

Sevin, Emeric. "Annotation des petits éléments dans les génomes procaryotes : nouveaux outils informatiques et application à Sinorhizobium meliloti". Rennes 1, 2007. http://www.theses.fr/2007REN1S160.

Texto completo
Resumen
L’automatisation des protocoles d’annotation a vu naître un grand nombre d’outils informatiques. Malgré ceux-ci et la multitude des données générée par le séquençage intensif des génomes procaryotes, des petits éléments essentiels à la compréhension globale des systèmes continuent d’être négligés dans les annotations. Citons notamment les éléments régulateurs à la périphérie des gènes (promoteurs/terminateurs), les petits ARN non codant (ARNnc), ou encore les gènes peptidiques, correspondant à des protéines de moins de 100 aa. Nous avons effectué un crible des régions intergéniques de Sinorhizobium meliloti, alpha-protéobactérie de la famille des Rhizobiacées, qui, couplé à des méthodes de génomiques comparatives, nous a permis d’identifier 67 candidats de gènes à ARNnc, dont 14 ont pu être validés biologiquement. Ce crible nous a par ailleurs interpellé sur l’absence fréquente, parmi les gènes peptidiques, de ceux composant les systèmes de toxine/antitoxine (TA). Nous avons donc développé un outil informatique d’identification des gènes codant potentiellement pour des systèmes TA dans les génomes procaryotes. Premier du genre, celui-ci est basé sur les caractéristiques génomiques de ces systèmes. Les résultats ainsi obtenus semblent indiquer que le nombre de ces derniers dans les génomes est encore plus important qu’initialement décrit. Enfin, le développement d’un outil de cartographie des n-mers sous- ou sur-représentés dans les régions intergéniques est en cours pour aider à la détection des éléments régulateurs
Many computational tools have been developed along with the automation of annotation. In spite of this and of the multiplication of sequenced prokaryotic genomes, small elements essential to our global understanding of systems remain poorly annotated. These comprise transcriptional regulation elements (promoters/terminators), non coding RNAs (ncRNAs), and peptidic genes, coding for proteins smaller shorter than 100 aa. Scanning the intergenic regions of Sinorhizobium meliloti with comparative genomics methods allowed us to identify 67 candidates, of which 14 were proven to be true ncRNAs. This analysis moreover revealed a sparse annotation of genes belonging to toxin-antitoxin (TA) systems. We thus developed a novel computational tool, based on their genomic features, for identifying them in prokaryotic genomes. Our results suggest that TA systems might be even more numerous than initially described. Finally we are currently validating a visualization tool for under- or over-represented n-mers in intergenic regions to help in the detection of regulatory elements
Los estilos APA, Harvard, Vancouver, ISO, etc.
4

Beyne, Emmanuelle. "Règles de cohérence pour l'annotation génomique : développement et mise en œuvre in silico et in vivo". Bordeaux 1, 2008. https://tel.archives-ouvertes.fr/tel-00350902.

Texto completo
Resumen
L'annotation génomique identifie l'ensemble des éléments significatifs présents sur l'ADN génomique, le support du programme de fonctionnement de l'organisme. Elle prédit leurs fonctions biologiques et leurs relations. L'annotation d'un génome complet est soumise à diverses contraintes : elle doit être réalisée rapidement et représenter l'organisme comme système biologique fonctionnel cohérent. Nous proposons une méthode de vérification de la qualité de l'annotation génomique, basée sur un ensemble de règles de cohérence définies d'après les connaissances et contraintes biologiques admises par la communauté scientifique. Ces règles vérifient la complétude de l'annotation (présence des éléments vitaux pour l'organisme) et son absence d'erreur (sens biologique correct des éléments décrits). Notre méthode est appliquée dans le cadre du projet Génolevures, un projet de génomique comparée chez les levures hémiascomycètes. Nous avons mis en place un système d'annotation facilitant le travail d'annotation manuelle par les experts. L'intégration de nos règles dans ce système permet de garantir la bonne qualité de l'annotation produite. Nous avons choisi de valider expérimentalement l'application de ces règles en étudiant les interactions protéine-protéine chez les levures Saccharomyces cerevisiae et Yarrowia lipolytica par la technique de l'électrophorèse en gel de polyacrylamide en bleu natif et SDS (BN / SDS PAGE). Les résultats obtenus apportent de nouvelles connaissances chez les levures étudiées. Ils démontrent l'universalité de certaines règles et le bien fondé de la stratégie d'annotation.
Los estilos APA, Harvard, Vancouver, ISO, etc.
5

Bocs, Stéphanie. "(Ré)annotation de génomes procaryotes complets - Exploration de groupes de gènes chez les bactéries". Phd thesis, Université Pierre et Marie Curie - Paris VI, 2004. http://tel.archives-ouvertes.fr/tel-00008296.

Texto completo
Resumen
La stratégie experte semi-automatique de prédiction de Séquences CoDantes (CDS) d'un chromosome procaryote est fondée sur le modèle statistique des chaînes de Markov. Elle est constituée des stratégies AMIMat pour l'apprentissage de l'hétérogénéité de composition des CDS d'un chromosome et AMIGene pour la reconnaissance et le filtrage des CDS les plus probables. AMIMat permet de construire k matrices de transition à partir de k classes de gènes définies selon l'usage des codons synonymes. La précision d' AMIGene dépend de la qualité des matrices et d'autres paramètres validés automatiquement par rapport à des annotations de référence. Autour de ces stratégies, un processus de réannotation de génome complet a été développé, en interaction avec notre base multigénome PkGDB, qui facilite l'homogénéisation des annotations des banques. Ce processus de (ré)annotation est utilisé dans de nombreux projets : Bacillus, Neisseria, Acinetobacter, Entérobactéries.
Los estilos APA, Harvard, Vancouver, ISO, etc.
6

Flutre, Timothée. "L' annotation des éléments transposables par la compréhension de leur diversification". Paris 7, 2010. http://www.theses.fr/2010PA077239.

Texto completo
Resumen
Les éléments transposables sont des fragments du génome possédant la particularité d'être mobiles. Ils ont un impact majeur sur la structure des génomes mais également sur l'expression des gènes avoisinants, notamment via des mécanismes épigénétiques. Cependant, mis à part certains organismes modèles pour lesquels nous disposons de séquences de référence, l'annotation des éléments transposables représente un goulot d'étranglement dans l'analyse des génomes séquences. J'ai donc comparé les programmes informatiques existants utilisés dans les approches d'annotation de novo des éléments transposables. Pour cela, j'ai mis au point un protocole de test sur les génomes de Drosophila melanogaster et Arabidopsis thaliana. Ceci m'a permis de proposer une approche de novo combinant plusieurs outils, capable ainsi de reconstruire automatiquement un grand nombre de séquences de référence. De plus, j'ai pu montrer que cette approche mettait en évidence les variations structurales au sein de familles bien connues, reflétant ainsi la diversification de ces familles au cours de leur évolution. J'ai implémenté cette approche dans une suite d'outils (REPET) rendant possible l'analyse des éléments transposables de nombreux génomes d,e plantes, insectes, champignons, etc. Ces travaux ont abouti à une feuille de route décrivant de manière pratique comment annoter le contenu en éléments transposables de tout génome nouvellement séquence. En perspective, je propose plusieurs pistes de recherche, notamment la simulation des données nécessaires à l'amélioration des algorithmes de détection, démarche complémentaire de la modélisation de la dynamique des éléments transposables
Transposable elements are DNA sequences that can move and duplicata within genomes. They hence have a major impact on genome structure but also on the expression of neighbouring genes, notably via epigenetiç mechanisms. However, except for some model organisms for which reference sequences are available, the annotation of transposable elements corresponds to a bottleneck in the analysis of genomic sequences. Therefore, I started by comparing existing computer programs used in de novo approaches of transposable element identification. In this aim, I designed a test protocol on the genomes of Drosophila melanogaster and Arabidopsis thaliana. As a result, I proposed a de novo approach combining several tools, thus enabling the automatic recovery of a great number of reference sequences. Moreover, I showed that our approach highlighted the structural variations present within well-known families, thus reflecting the diversification of such families during their evolution. This approach was implemented in a package (REPET) making possible the analysis of transposable elements in numerous genomes from plants, insects and fungi among others. This work lead to a roadmap describing, from a practical point of view, how to annotate the transposable element content of any newly sequenced genome. Finally, I propose several perspectives, notably the simulation of the data required for the improvement of the detection algorithms, a way complementary to the modeling of transposable element dynamics
Los estilos APA, Harvard, Vancouver, ISO, etc.
7

Morlot, Jean-Baptiste. "Annotation of the human genome through the unsupervised analysis of high-dimensional genomic data". Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066641/document.

Texto completo
Resumen
Le corps humain compte plus de 200 types cellulaires différents possédant une copie identique du génome mais exprimant un ensemble différent de gènes. Le contrôle de l'expression des gènes est assuré par un ensemble de mécanismes de régulation agissant à différentes échelles de temps et d'espace. Plusieurs maladies ont pour cause un dérèglement de ce système, notablement les certains cancers, et de nombreuses applications thérapeutiques, comme la médecine régénérative, reposent sur la compréhension des mécanismes de la régulation géniques. Ce travail de thèse propose, dans une première partie, un algorithme d'annotation (GABI) pour identifier les motifs récurrents dans les données de séquençage haut-débit. La particularité de cet algorithme est de prendre en compte la variabilité observée dans les réplicats des expériences en optimisant le taux de faux positif et de faux négatif, augmentant significativement la fiabilité de l'annotation par rapport à l'état de l'art. L'annotation fournit une information simplifiée et robuste à partir d'un grand ensemble de données. Appliquée à une base de données sur l'activité des régulateurs dans l'hématopoieïse, nous proposons des résultats originaux, en accord avec de précédentes études. La deuxième partie de ce travail s'intéresse à l'organisation 3D du génome, intimement lié à l'expression génique. Elle est accessible grâce à des algorithmes de reconstruction 3D à partir de données de contact entre chromosomes. Nous proposons des améliorations à l'algorithme le plus performant du domaine actuellement, ShRec3D, en permettant d'ajuster la reconstruction en fonction des besoins de l'utilisateur
The human body has more than 200 different cell types each containing an identical copy of the genome but expressing a different set of genes. The control of gene expression is ensured by a set of regulatory mechanisms acting at different scales of time and space. Several diseases are caused by a disturbance of this system, notably some cancers, and many therapeutic applications, such as regenerative medicine, rely on understanding the mechanisms of gene regulation. This thesis proposes, in a first part, an annotation algorithm (GABI) to identify recurrent patterns in the high-throughput sequencing data. The particularity of this algorithm is to take into account the variability observed in experimental replicates by optimizing the rate of false positive and false negative, increasing significantly the annotation reliability compared to the state of the art. The annotation provides simplified and robust information from a large dataset. Applied to a database of regulators activity in hematopoiesis, we propose original results, in agreement with previous studies. The second part of this work focuses on the 3D organization of the genome, intimately linked to gene expression. This structure is now accessible thanks to 3D reconstruction algorithm from contact data between chromosomes. We offer improvements to the currently most efficient algorithm of the domain, ShRec3D, allowing to adjust the reconstruction according to the user needs
Los estilos APA, Harvard, Vancouver, ISO, etc.
8

Claudel-Renard, Clotilde. "Inférence fonctionnelle et prédiction de voies métaboliques : application à la bactérie fixatrice d'azote Sinorhizobium meliloti". Toulouse 3, 2003. http://www.theses.fr/2003TOU30170.

Texto completo
Resumen
Des génomes entiers de bactéries sont séquencés en nombre croissant. Parallèlement sont mis en place des programmes d'analyse systématique de l'expression des gènes et des protéines dans différentes conditions. La compréhension du fonctionnement d'un organisme nécessite une annotation des fonctions des gènes et l'intégration de ces données dans des schémas fonctionnels. Les voies métaboliques constituent une classe de fonctions permettant d'aborder ce problème d'intégration, elles sont bien répertoriées chez de nombreux organismes et sont accessibles à l'expérimentation. Dans un premier temps, nous avons développé une méthode automatique de prédiction de fonction spécifique des enzymes. Cette méthode nommée PRIAM (PRofils pour l'Identification Automatique du Métabolisme) repose sur la nomenclature des enzymes et sur la construction automatique d'un jeu de profils spécifiques des fonctions enzymatiques. Puis, cette méthode permet d'identifier les enzymes dans un génome complet et de visualiser les résultats obtenus sur les graphes des voies métaboliques de la base de données KEGG. Dans un second temps, cette méthode a été appliquée sur le génome de la bactérie fixatrice d'azote Sinorhizobium meliloti et nous a permis l'analyse des voies métaboliques spécifiques de cet organisme symbiote
Complete genomes of bacteria are sequenced in growing number. At the same time, programs for systematic analysis of genes and proteins expression in different conditions are set up. The understanding of organisms functions requires the annotation of genes functions and the integration of that data into a functional diagram. Metabolic pathways constitute classes of functions allowing to tackle the integration issue. They are well identified in numerous organisms and are available to experimentation. In a first time, we have developed an automated method for enzyme function detection. This method, named PRIAM (PRofils pour l'Identification Automatique du Métabolisme), is based on the classification of enzymes in the ENZYME database and relies on sets of position-specific scoring matrices ("profiles"), automatically tailored for each ENZYME entry. Then, the method allows to identify enzymes in a complete genome and to visualize the results on KEGG graphs. In a second time, that method has been applied on the complete genome of the nitrogen fixing bacterium Sinorhizobium meliloti, in order to facilitate the interpretation of specific metabolic pathways of that symbiotic organism
Los estilos APA, Harvard, Vancouver, ISO, etc.
9

Scalzitti, Nicolas. "Nouvelle stratégie d'annotation des génomes par l'utilisation d'algorithmes d'intelligence artificielle". Electronic Thesis or Diss., Strasbourg, 2021. http://www.theses.fr/2021STRAJ040.

Texto completo
Resumen
Les projets de séquençage à haut débit produisent une énorme quantité de données biologiques brutes. Cependant, elles sont difficilement exploitables si elles ne sont pas annotées. Pour traiter ces données, des programmes d’annotation de génomes ont été développés, mais ces derniers sont encore trop sujet aux erreurs de prédiction, faisant de l’annotation des génomes un des défis majeurs en bio-informatique. Dans ce contexte, mes travaux de thèse s’organisent autour d’un trinôme : 1) l’amélioration de la prédiction des gènes eucaryotes codant pour des protéines en se focalisant spécifiquement sur les sites d’épissage 2) en exploitant des algorithmes d’intelligence artificielle (CNN et algorithmes évolutionnaires), 3) entraînés avec des données de haute qualité incluant une forte diversité d’espèces eucaryotes. Notre stratégie consiste à combiner l’ensemble des données validées avec les programmes développés afin d’améliorer la prédiction des gènes en diminuant le taux d’erreurs et éviter qu’elles ne se propagent dans les bases de données. De plus, ces travaux permettront une meilleure compréhension des organismes et de leurs mécanismes biologiques
High-throughput genome sequencing projects produce a huge amount of raw biological data on a daily basis. However, the data are difficult to exploit if they are not annotated. Unfortunately, the currently available genome annotation programs are still too prone to prediction errors, making genome annotation one of the major challenges in bioinformatics. In this context, my thesis is organized around three connected topics: i) improving the prediction of eukaryotic protein-coding genes by focusing on splice sites ii) exploiting artificial intelligence algorithms (convolutional neural networks and evolutionary algorithms), iii) training with high quality data from a wide range of eukaryotic organisms (from humans to protists). The strategy developed consists in combining the processed and validated data set (G3PO) with the developed programs (Spliceator and SpliceSLEIA) in order to improve gene prediction by decreasing the error rate so that they no longer propagated in public databases. This work should contribute to a better understanding of organisms and their biological mechanisms
Los estilos APA, Harvard, Vancouver, ISO, etc.
10

Blandin, Gaëlle. "Évolution des génomes de levures : analyse de la redondance et génomique comparative". Paris 7, 2001. http://www.theses.fr/2001PA077171.

Texto completo
Los estilos APA, Harvard, Vancouver, ISO, etc.
11

Chelkha, Nisrine. "Etudes du génome de diverses amibes et de leurs interactions avec des virus géants et d’autres microorganismes". Thesis, Aix-Marseille, 2019. http://theses.univ-amu.fr.lama.univ-amu.fr/191122_CHELKHA_490trpga652cfvqep580b712k_TH.pdf.

Texto completo
Resumen
Acanthamoeba est un protiste phagocytaire ubiquitaire du sol et de l'eau. Les virus géants, incluant notamment les mimivirus, les marseillevirus ou les pandoravirus, sont d'autres micro-organismes résistants à Acanthamoeba. Ils vivent en sympatrie avec d'autres micro-organismes au sein de l'amibe, et de nombreux transferts latéraux de séquences ont été décrits avec Acanthamoeba castellanii. De plus, certaines espèces d'Acanthamoeba semblent présenter des susceptibilités différentes vis-à-vis des virus géants.L’objectif de ce travail a été d’explorer pour la première fois le répertoire génique de 14 espèces d’Acanthamoeba, ainsi que celui des deux espèces Vermamoeba vermiformis CDC-19 et Willaertia magna c2c maky, et d’étudier leurs relations génétiques avec les virus géants.Ce travail a permis de fournir des données génétiques importantes et originales pour plusieurs espèces d’amibes présentant des susceptibilités différentes à l’infection virale.Un autre travail a consisté à discuter des stratégies de défense observées ou possibles des virus géants et de leurs hôtes. La recherche d’homologues de séquences de virus géants montre la présence de plusieurs séquences potentiellement impliquées dans des mécanismes de défense. Par ailleurs, aucune trace significative d'intégration de génomes ou de séquences de virophages connus n'a été identifiée dans tous les génomes disponibles des espèces d'Acanthamoeba. Finalement, nous avons mis au point différents systèmes d'amorces permettant une identification des espèces d’Acanthamoeba. Ces travaux ouvrent plusieurs pistes potentielles pour des travaux futurs portant sur les interactions entre les amibes et les virus géants
Acanthamoeba spp. are ubiquitous phagocytic protists in soil and water. Giant viruses, including mimiviruses, marseillevirus or pandoraviruses, are among Acanthamoeba-resistant microorganisms. They have a sympatric lifestyle with other microorganisms within amoebae, and many lateral sequence transfers have been described that involved Acanthamoeba castellanii. In addition, some Acanthamoeba species appear to have different levels of susceptibility to giant viruses.The objective of this work was to explore for the first time the gene repertoire of the genomes of 14 different species of Acanthamoeba, as well as that of the two species Vermamoeba vermiformis CDC-19 and Willaertia magna c2c maky, and to study the genetic relationship of these amoebae with giant viruses.This work provided important genetic information for several species of amoebae with different susceptibility to giant viral infection. An additional work aimed to discuss the defense strategies observed or predicted for giant viruses and their hosts. The search for sequence homologies in other giant viruses genomes revealed the presence of several sequences suspected to be involved in defense mechanisms. However, no significant evidence of integration of known genomes or virophages sequences has been identified in all available genomes of Acanthamoeba species.Finally, we have designed three PCR primer systems targeting a conserved gene that encodes an alanine-tRNA ligase, for an effective and specific identification of Acanthamoeba. This work opens up several potential leads for future work on the interactions between amoebae and giant viruses
Los estilos APA, Harvard, Vancouver, ISO, etc.
12

Hubans, Christine. "Méthode ab initio de prédiction d'opérons chez les procaryotes et validations biologiques chez les Bordetelles". Lille 1, 2006. https://pepite-depot.univ-lille.fr/RESTREINT/Th_Num/2006/50376_2006_246.pdf.

Texto completo
Resumen
Aujourd'hui comprendre les mécanismes moléculaires qui régissent la vie est un challenge de la biologie. C'est avec l'objectif de comprendre les voies métaboliques et leur régulation que de nombreuses méthodes «in silico» ont été développées. La conservation de l'organisation des gènes sur les génomes procaryotes reflète des interactions fonctionnelles, c'est pourquoi annoter ces structures est primordial. Au cours de nos travaux, nous avons développé un algorithme de prédiction d'opérons travaillant uniquement sur base d'une séquence génomique. Notre méthode combine la prédiction de plusieurs éléments génomiques ainsi qu'une analyse de la fréquence de distribution des nucléotides et dinucléotides afin de discriminer les séquences intergéniques transcrites des non transcrites. La robustesse de notre algorithme a été éprouvée sur deux jeux de données validés d'E coli et de B. Subtilis et atteint une sensibilité de 88% et une spécificité de 89%. Afin d'annoter de nouvelles structures opéroniques chez E coli, nous avons biologiquement validé certains opérons prédits. Quatre nouveaux opérons ont été expérimentalement confinnés. De plus, nous avons vérifié biologiquement deux opérons, prédits par notre logiciel comme unités polycistroniques mais précédemment décrits dans la littérature comme juxtapositions d'unités monogéniques. Dans une dernIère partie, nous avons appliqué notre méthode au niveau de trois génomes de la famille des Bordetelles. Par une comparaison des annotations opéroniques, nous cherchons à mettre en évidence des différences d'organisation génomique pouvant entraîner des changements dans les spécificités d'hôte et pathogénicités de trois espèces très proches des Bordetelles, à savoir pertussis, parapertussis et bronchiseptica.
Los estilos APA, Harvard, Vancouver, ISO, etc.
13

Ral, Jean-Philippe. "Multiplicité et redondance des enzymes du métabolisme de l'amidon dans la lignée verte". Lille 1, 2004. https://pepite-depot.univ-lille.fr/RESTREINT/Th_Num/2004/50376-2004-23.pdf.

Texto completo
Resumen
Les ADP-glucose α-1,4 glucane α-4-glucosyltransférases ou amidon-synthétases catalysent le transfert du glucose libre de l'ADP-glucose vers les extrémités non réductrices des chaînes glucaniques en élongation créant ainsi une liaison O-glucosidique de type α-l,4. Une souche mutante au locus STA3 de l'algue verte Chlamydomonas reinhardtii présente une diminution forte de la quantité d'amidon couplée à une perturbation de la structure de l'amylopectine. Nos travaux font la démonstration que le locus STA3 correspond au gène de structure de l'amidon synthétase soluble III (SSIII). L'étude de l'activité SSIII en culture nycthémérale révèle l'existence de multiples niveaux de régulation le long du cycle. L'étude du mutant sta3 dans ces conditions révèle le rôle palliatif de la GBSSI en culture synchronisée. La mise à disposition concomitante des génomes de C. Reinhardtii mais également d'Ostreococcus tauri, une algue verte unicellulaire de la famille des prasinophyceae, a permis la création d'une première annotation des gènes. Impliqués dans la biosynthèse de l'amidon chez ces deux espèces. Cette approche génomique établit que toute la complexité et la redondance des enzymes du métabolisme de l'amidon sont apparues à la base de la ligne verte chez les végétaux. Chez les plantes et bactéries, les mécanismes d'initiation et de nucléation des grains lors de la synthèse du polysaccharide restent mal définis. Faisant suite à une caractérisation complète de l'amidon produit par O. Tauri, nous avons observé un phénomène original de scission et de fractionnement du grain en deux structures filles. Ce phénomène suggère la transmission d'une matrice polysaccharidique responsable de l'initiation du grain d'amidon.
Los estilos APA, Harvard, Vancouver, ISO, etc.
14

Bland, Céline. "Innovations pour l'annotation protéogénomique à grande échelle du vivant". Thesis, Montpellier 1, 2013. http://www.theses.fr/2013MON13508.

Texto completo
Resumen
La protéogénomique consiste à affiner l'annotation du génome d'organismes modèles pour lesquels des données protéomiques sont générées à haut-débit. Des erreurs d'annotation structurale ou fonctionnelle sont encore fréquentes. Innover dans les méthodologies permettant de lever ces ambiguïtés est essentiel. L'étude spécifique du N-terminome permet de vérifier expérimentalement l'identification du codon d'initiation de la traduction et de certifier les données obtenues. Pour cela, deux stratégies innovantes ont été développées basées sur : i) le marquage sélectif du N-terminal des protéines, ii) une digestion multienzymatique en parallèle, et ii) l'enrichissement spécifique des peptides N-terminaux marqués par chromatographies liquides successives ou immunocapture dirigée contre le groupement N-terminal ajouté. L'efficacité de ces méthodologies a été démontrée à partir du modèle bactérien Roseobacter denitrificans. Après enrichissement par chromatographie, 480 protéines ont été validées et 46 ré-annotées. Plusieurs sites d'initiation de la traduction ont été décelés et l'annotation par similarité a été remise en cause dans certains cas. Après immunocapture, 269 protéines ont été caractérisées dont 40% ont été identifiées spécifiquement après enrichissement. Trois gènes ont également été annotés pour la première fois. Les résultats complémentaires obtenus après analyse par spectrométrie de masse en tandem facilitent l'interprétation des données pour révéler les sites d'initiation réels de la synthèse des protéines et identifier de nouveaux produits d'expression des gènes. La ré-annotation peut devenir automatique et systématique pour améliorer les bases de données protéiques
Proteogenomics is a recent field at the junction of genomics and proteomics which consists of refining the annotation of the genome of model organisms with the help of high-throughput proteomic data. Structural and functional errors are still frequent and have been reported on several occasions. Innovative methodologies to prevent such errors are essential. N-terminomics enables experimental validation of initiation codons and certification of the annotation data. With this objective in mind, two innovative strategies have been developed combining: i) selective N-terminal labeling of proteins, ii) multienzymatic digestion in parallel, and iii) specific enrichment of most N-terminal labeled peptides using either successive liquid chromatography steps or immunocapture directed towards the N-terminal label. Efficiency of these methodologies has been demonstrated using Roseobacter denitrificans as bacterial model organism. After enrichment with chromatography, 480 proteins were validated and 46 re-annotated. Several start sites for translation initiation were detected and homology driven annotation was challenged in some cases. After immunocapture, 269 proteins were characterized of which 40% were identified specifically after enrichment. Three novel genes were also annotated for the first time. Complementary results obtained after tandem mass spectrometry analysis allows easier data interpretation to reveal real start sites of translation initiation of proteins and to identify novel expressed products. In this way, the re-annotation process may become automatic and systematic to improve protein databases
Los estilos APA, Harvard, Vancouver, ISO, etc.
15

Lehmann, Nathalie. "Development of bioinformatics tools for single-cell transcriptomics applied to the search for signatures of symmetric versus asymmetric division mode in neural progenitors". Electronic Thesis or Diss., Université Paris sciences et lettres, 2021. http://www.theses.fr/2021UPSLE070.

Texto completo
Resumen
Ces dernières années, l’émergence des approches en cellules uniques (scRNA-seq) a favorisé la caractérisation de l’hétérogénéité cellulaire avec une précision inégalée. Malgré leur démocratisation, l’analyse de ces données reste complexe, en particulier pour les organismes dont les annotations sont incomplètes. Au cours ma thèse, j’ai observé que les annotations génomiques du poulet sont lacunaires, ce qui engendre la perte d’un grand nombre de lectures de séquençage. J’ai évalué à quel point une annotation améliorée affecte les résultats biologiques et les conclusions issues de ces analyses. Nous proposons une nouvelle approche basée sur la ré-annotation du génome à partir de données scRNA-seq et de RNA-seq bulk en lectures longues. Ce projet de biologie computationnelle s’appuie sur une étroite collaboration avec l’équipe expérimentale de Xavier Morin (IBENS). Le principal objectif biologique est la recherche de signatures de mode de division symétrique et asymétrique au sein de progéniteurs neuronaux. Afin d’identifier les principaux changements transcriptionnels, j’ai mis en place des approches dédiées à la recherche de signatures géniques à partir de données scRNA-seq
In recent years, single-cell RNA-seq (scRNA-seq) has fostered the characterization of cell heterogeneity at a remarkable high resolution. Despite their democratization, the analysis of scRNA-seq remains a challenge, particularly for organisms whose genomic annotations are partial. During my PhD, I observed that the chick genomic annotations are often incomplete, thus resulting in a loss of a large number of sequencing reads. I investigated how an enriched annotation affects the biological results and conclusions from these analyses. We developed a novel approach based on the re-annotation of the genome with scRNA-seq data and long reads bulk RNA-seq. This computational biology project capitalises on a tight collaboration with the experimental team of Xavier Morin (IBENS). The main biological focus is the search for signatures of symmetric versus asymmetric division mode in neural progenitors. In order to identify the key transcriptional switches that occur during the neurogenic transition, I have implemented bioanalysis approaches dedicated to the search for gene signatures from scRNA-seq data
Los estilos APA, Harvard, Vancouver, ISO, etc.
16

Beyne, Emmanuelle. "Règles de cohérence pour l'annotation génomique : développement et mise en oeuvre in silico et in vivo". Phd thesis, Université Sciences et Technologies - Bordeaux I, 2008. http://tel.archives-ouvertes.fr/tel-00350902.

Texto completo
Resumen
L'annotation génomique identifie l'ensemble des éléments significatifs présents sur l'ADN génomique, le support du programme de fonctionnement de l'organisme. Elle prédit leurs fonctions biologiques et leurs relations. L'annotation d'un génome complet est soumise à diverses contraintes: elle doit être réalisée rapidement et représenter l'organisme comme système biologique fonctionnel cohérent. Nous proposons une méthode de vérification de la qualité de l'annotation génomique, basée sur un ensemble de règles de cohérence définies d'après les connaissances et contraintes biologiques admises par la communauté scientifique. Ces règles vérifient la complétude de l'annotation (présence des éléments vitaux pour l'organisme) et son absence d'erreur (sens biologique correct des éléments décrits). Notre méthode est appliquée dans le cadre du projet Génolevures, un projet de génomique comparée chez les levures hémiascomycètes. Nous avons mis en place un système d'annotation facilitant le travail d'annotation manuelle par les experts. L'intégration de nos règles dans ce système permet de garantir la bonne qualité de l'annotation produite. Nous avons choisi de valider expérimentalement l'application de ces règles en étudiant les interactions protéine-protéine chez les levures Saccharomyces cerevisiae et Yarrowia lipolytica par la technique de l'électrophorèse en gel de polyacrylamide en bleu natif et SDS (BN/SDS PAGE). Les résultats obtenus apportent de nouvelles connaissances chez les levures étudiées. Ils démontrent l'universalité de certaines règles et le bien fondé de la stratégie d'annotation.
Los estilos APA, Harvard, Vancouver, ISO, etc.
17

Andréani, Julien. "Etude des grands virus à ADN nucléo-cytoplasmique : isolements et caractérisations". Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0695.

Texto completo
Resumen
La plupart des virus sont connus pour leur capacité à causer des maladies symptomatiques chez l’Homme et chez les autres animaux. Certains d’entre eux sont des grands virus à ADN nommés Virus à Grand ADN Nucléo-Cytoplasmique (NCLDV), rapportés comme infectant les cellules eucaryotiques. Au début du XXI ème siècle, quatre familles ont été définies par Iyer et al. comme ayant une origine commune (groupe monophylétique) : Asfarviridae, Phycodnaviridae, Irido-Ascoviridae et Poxviridae.En 2003, la description d’Acanthamoeba polyphaga mimivirus a cassé un paradigme dans le monde des virus. Par leur taille de particule (450nm), par leur longueur de génomes(supérieure à 1Mb) et leur contenu génique, leur découverte a changé la définition traditionnelle des virus (Lwoff). Depuis 2013 et notamment par les isolements successifs de Pandoravirus,Pithovirus et Mollivirus, ces virus ont été décrits comme possédant de nouvelles propriétés.Leur découverte a été rendue possible grâce à la méthode de co-culture utilisant des protistes, notamment des cellules du genre Acanthamoeba. Cette méthode a été de nombreuses fois modulée par différentes équipes. Dans notre cas, nous avons combiné différentes stratégies appliquées à notre co-culture : la co-culture a été couplée à la cytométrie en flux pour détecter la lyse des protistes. De plus, la cytométrie a été utilisée avec un marqueur à ADN dans le but d’identifier de façon putative le virus et de discriminer les différentes populations virales. Enfin,nous sommes capables de séparer ces populations en utilisant un appareil FACS trieur.L’ensemble de ces techniques a permis l’isolement de nouveaux virus
Most viruses are known for their ability to cause symptomatic diseases in humans andother animals. Some of them are large DNA viruses named Nucleo-cytoplasmic Large DNAviruses (NCLDV), known for infecting eukaryotic cells. At the beginning of the 21st centuryfour families were defined by Iyer et al. as having a common origin (monophyletic group):Asfarviridae, Phycodnaviridae, Irido-Ascoviridae and Poxviridae.In 2003, the description of Acanthamoeba polyphaga Mimivirus broke this paradigmin the virus world. Because of their particles size (450 nm), their genome size (up to 1Mb),and their gene contents, their discovery changed the traditional definition of viruses (Lwoff).Since 2013 and the successive isolations of Pandoravirus, Pithovirus and Mollivirus; theseviruses have been characterized as possessing various novel properties.Their discoveries have been possible thanks to the co-culture method using protistnotably Acanthamoeba genus cells. This method went through multiple improvements and isemployed by different teams in different ways. In our case and in order to enhance thismethod we combined strategies applied in our co-culture. Indeed, this method consists inusing flow cytometry to detect lysis of protist cells (after all steps of co-culture enrichment).In addition, the flow cytometry was used with a DNA marker in order to identity viruses anddiscriminate viral populations. Then, we were able, using a FACS sorter device, to separatedifferent viral populations from our supernatants.Altogether these techniques have permitted the isolation of new viruses
Los estilos APA, Harvard, Vancouver, ISO, etc.
18

Djebali, Sarah. "Un cadre formel pour l'annotation experte des gènes eucaryotes". Phd thesis, Université d'Evry-Val d'Essonne, 2006. http://tel.archives-ouvertes.fr/tel-00112099.

Texto completo
Resumen
Malgré des avancées considérables dans le domaine de l'annotation automatique de gènes, l'annotateur de référence reste l'expert humain. Nous avons donc développé Exogean, une méthode automatique qui suit le même processus que l'expert humain. Pour cela, Exogean utilise des multi-graphes orientés acycliques colorés (DACMs) où les sommets sont des objets biologiques, et les multiples couleurs d'arêtes entre les sommets sont des relations entre ces objets. Les DACMs sont parcourus suivant des chemins qui répliquent les règles suivies par l'expert humain lorsqu'il analyse les données.

Le fait que les règles heuristiques utilisées par l'expert soient de différentes natures, soient susceptibles d'évoluer au cours du temps et s'appliquent à des ressources de types différents, a fait ressortir le besoin d'un cadre formel à la fois flexible, intuitif et générique pour l'annotation de gènes. Nous avons donc également développé DACMLang, un langage dédié à l'annotation de gènes fondé sur les DACMs.
Los estilos APA, Harvard, Vancouver, ISO, etc.
19

Smith, Adam Alexander Thil. "Exploitation automatisée des contextes métabolique et génomique pour l'annotation fonctionnelle des génomes prokaryotes". Thesis, Evry-Val d'Essonne, 2012. http://www.theses.fr/2012EVRY0002/document.

Texto completo
Resumen
Cette thèse porte sur le développement d'approches bioinformatiques exploitant de l'information de contextes génomiques et métaboliques afin de générer des annotations fonctionnelles de gènes prokaryotes, et comporte deux projets principaux. Le premier projet focalise sur les activités enzymatiques orphelines de séquence. Environ 27% des activités définies par le International Union of Biochemistry and Molecular Biology sont encore aujourd'hui orphelines. Pour celles-ci, les méthodes bioinformatiques traditionnelles ne peuvent proposer de gènes candidats; il est donc impératif d'utiliser des méthodes exploitant des informations contextuelles dans ces cas. La stratégie CanOE (fishingCandidate genes for Orphan Enzymes) a été développée et rajoutée à la plateforme MicroScope dans ce but, intégrant des informations génomiques et métaboliques sur des milliers d'organismes prokaryotes afin de localiser des gènes probants pour des activités orphelines. Le projet miroir au précédent est celui des protéines de fonction inconnue. Un projet collaboratif a été initié au Genoscope afin de formaliser les stratégies d'exploration des fonctions de familles protéiques prokaryotes. Une version pilote du projet a été mise en place sur la famille “DUF849” dont une fonction enzymatique avait été récemment découverte. Des stratégies de proposition d'activités enzymatiques alternatives et d'établissement de sous familles isofonctionnelles ont été mises en place dans le cadre de cette thèse, afin de guider les expérimentations de paillasse et d'analyser leurs résultats
The subject of this thesis concerns the development of bioinformatic strategies exploiting genomic and metabolic contextual information in order to generate functional annotations for prokaryote genes. Two main projects were involved during this work: the first focuses on sequence-orphan enzymatic activities. Today, roughly 27% of activities defined by International Union of Biochemistry and Molecular Biology are sequence-orphans. For these, traditional bioinformatic approaches cannot propose candidate genes. It is thus imperative to use alternative, context-based approaches in such cases. The CanOE strategy fishing Candidate genes for Orphan Enzymes) was developed and added to the MicroScope bioinformatics platform in this aim. It integrates genomic and metabolic information across thousands of prokaryote genomes in order to locate promising gene candidates for orphan activities. The mirror project focuses on protein families of unknown function. A collaborative project has been set up at the Genoscope in hope of formalising functional exploration strategies for prokaryote protein families. A pilot version was created on the “DUF849” Pfam family, for which a single activity had recently been elucidated. Strategies for proposing novel functions and activities and creating isofunctional sub-families were researched, so as to guide biochemical experimentations and to analyse their results
Los estilos APA, Harvard, Vancouver, ISO, etc.
20

Descorps-Declere, Stéphane. "Modélisation du processus d'annotation par une architecture blackboard". Paris 6, 2006. http://www.theses.fr/2006PA066165.

Texto completo
Resumen
Devant la multiplication des projets de séquençage de génomes complets, il est aujourd’hui essentiel de disposer d’outils informatiques performants capables d'aider l’utilisateur biologiste vers un meilleur usage des méthodes d’analyses. Ceci s’avère particulièrement important en raison des très nombreuses méthodes d’analyse disponibles ainsi que des grandes quantités de données concernées. Ce travail vise à apporter une contribution à cette problématique, par l’élaboration d’un modèle bio-informatique adapté à l’annotation de génomes complets. Avec l’étude de l’état de l’art, nous avons dégagé l’existence de deux approches différentes pour modéliser le processus d'annotation. Cette constatation nous a permis, dans un premier temps, de re-formaliser la démarche d’annotation de séquences génomiques. Puis, dans un second temps, de proposer une nouvelle architecture logicielle adéquate afin de traiter la question ainsi reformulée : l’architecture blackboard
Because of the huge increase in sequencing projects of complete genomes, it is essential today to have powerful computer softwares able to help biologists towards a better use of analysis methods. This is particularly important because there exists many methods of analysis as well as a great amount of data. In order to solve this issue, we propose in this thesis to develop of a new bioinformatic model suitable for the annotation of complete genomes. From studying the "state of the art", we concluded that we could approach the modelisation of the annotation process of two different ways. This enabled us to propose a new model based on this analysis. We then decided to re-formalize the annotation process; it gave us the opportunity to propose an adequate software architecture in order to handle the process thus reformulated. The thesis is then a double contribution : it is both a modelisation of the annotation process, and a technical proposal based on a blackboard architecture
Los estilos APA, Harvard, Vancouver, ISO, etc.
21

Carpentier, Mathilde. "Méthodes de détection des similarités structurales : caractérisation des motifs conservés dans les familles de structures pour l' annotation des génomes". Paris 6, 2005. http://www.theses.fr/2005PA066571.

Texto completo
Los estilos APA, Harvard, Vancouver, ISO, etc.
22

Arnaiz, Olivier. "Annotation des génomes de paramécies Improved methods and resources for paramecium genomics: transcription units, gene annotation and gene expression The Paramecium Germline Genome Provides a Niche for Intragenic Parasitic DNA: Evolutionary Dynamics of Internal Eliminated Sequences ParTIES: a toolbox for Paramecium interspersed DNA elimination studies". Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASL046.

Texto completo
Resumen
Les nouvelles technologies de séquençage (NGS) ont révolutionné nos approches de la génomique.De nombreux génomes d'organismes ont été séquencés et assemblés.Le décryptage de l'information qu'ils contiennent (annotation) est plus que jamais une étape cruciale.Dans ce manuscrit, je vais me focaliser sur l’impact qu'ont eu les NGS sur l'annotation des génomes de paramécies, et notamment l'annotation de gènes et d'éléments transposables (ET).La paramécie est un eucaryote unicellulaire possédant deux types de noyaux. Un noyau germinal (MIC) utilisé pour transmettre l'information génétique à la génération sexuelle suivante, et un noyau somatique (MAC) assurant l'expression des gènes.Les caractéristiques particulières des gènes de paramécies m'ont incité à développer une chaîne de procédures dédiée à leur annotation, utilisant des données ARN-seq.A chaque cycle sexuel, le MAC parental est perdu et un nouveau MAC est généré à partir d'un MIC impliquant des réarrangements programmés de génome et notamment de l'élimination d'ADN portant des ET et de petites séquences à copie unique appelées IES (Internal Eliminated Sequence). Nous avons développé le logiciel ParTIES, utilisant des données ADN-seq, pour identifier les ~45 000 IES du génome de Pararamecium tetraurelia et montré que les IES sont des reliques d'ET.Une série de trois duplications globales de génome (WGD) anciennes mais encore visible, pendant l'histoire évolutive de la lignée, nous a permis de décrire la dynamique d'invasion et d'évolution des ET à l'origine des IES
The next generation sequencing technologies (NGS) have revolutionized genomics.Genomes of numerous organisms have been sequenced and assembled.Deciphering the encoded information (annotation) has more than ever become crucial. In this thesis manuscript, I focus on the impact of NGS on the annotation of Paramecium genomes, in particular the annotation of genes and transposable elements (TE).Paramecia is a unicellular eukaryote possesses two types of nuclei. A germline nucleus (MIC) transmits the genetic information to the next sexual generation, and a somatic nucleus (MAC) is responsible for gene expression.Special genes caracteristics of paramecia stimulated me to develop a workflow dedicated to their annotation, using RNA-seq data.At each sexual cycle, the parental MAC is lost and a new MAC develops from a copy of the MIC, through programmed genome rearrangements, notably the elimination of DNA corresponding to TE and short unique copy sequences called IES (Internal Eliminated Sequence).I developed the ParTIES software, using DNA-Seq data, to identify the ~45,000 IESs in the germline genome of Paramecium tetraurelia and to show that the IESs are remnants of TE.A series of three whole genome duplications (WGD) in the evolutionary history of the lineage, ancient but still visible, allow us to describe the dynamics of the invasion and evolution of TE that decay to become IES
Los estilos APA, Harvard, Vancouver, ISO, etc.
23

Carvunis, Anne-Ruxandra. "Des protéines et de leurs interactions aux principes évolutifs des systèmes biologiques". Thesis, Grenoble, 2011. http://www.theses.fr/2011GRENS001/document.

Texto completo
Resumen
Darwin a révélé au monde que les espèces vivantes ne cessent jamais d’évoluer, mais les mécanismes moléculaires de cette évolution restent le sujet de recherches intenses. La biologie systémique propose que les relations entre génotype, environnement et phénotype soient sous-tendues par un ensemble de réseaux moléculaires dynamiques au sein de la cellule, mais l’organisation de ces réseaux demeure mystérieuse. En combinant des concepts établis en biologie évolutive et systémique avec la cartographie d’interactions protéiques et l’étude des méthodologies d’annotation de génomes, j’ai développé de nouvelles approches bioinformatiques qui ont en partie dévoilé la composition et l’organisation des systèmes cellulaires de trois organismes eucaryotes : la levure de boulanger, le nématode Caenorhabditis elegans et la plante Arabidopsis thaliana. L’analyse de ces systèmes m’a conduit à proposer des hypothèses sur les principes évolutifs des systèmes biologiques. En premier lieu, je propose une théorie selon laquelle la traduction fortuite de régions intergéniques produirait des peptides sur lesquels la sélection naturelle agirait pour aboutir occasionnellement à la création de protéines de novo. De plus, je montre que l’évolution de protéines apparues par duplication de gènes est corrélée avec celle de leurs profils d’interactions. Enfin, j’ai mis en évidence des signatures de la co-évolution ancestrale hôte-pathogène dans l’organisation topologique du réseau d‘interactions entre protéines de l’hôte. Mes travaux confortent l’hypothèse que les systèmes moléculaires évoluent, eux aussi, de manière darwinienne
Darwin exposed to the world that living species continuously evolve. Yet the molecular mechanisms of evolution remain under intense research. Systems biology proposes that dynamic molecular networks underlie relationships between genotype, environment and phenotype, but the organization of these networks is mysterious. Combining established concepts from evolutionary and systems biology with protein interaction mapping and the study of genome annotation methodologies, I have developed new bioinformatics approaches that partially unveiled the composition and organization of cellular systems for three eukaryotic organisms: the baker’s yeast, the nematode Caenorhabditis elegans and the plant Arabidopsis thaliana. My analyses led to insights into the evolution of biological systems. First, I propose that the translation of peptides from intergenic regions could lead to de novo birth of new protein-coding genes. Second, I show that the evolution of proteins originating from gene duplications and of their physical interaction repertoires are tightly interrelated. Lastly, I uncover signatures of the ancestral host-pathogen co-evolution in the topology of a host protein interaction network. My PhD work supports the thesis that molecular systems also evolve in a Darwinian fashion
Los estilos APA, Harvard, Vancouver, ISO, etc.
24

Carvunis, Anne-ruxandra. "Des protéines et de leurs interactions aux principes évolutifs des systèmes biologiques". Phd thesis, Université de Grenoble, 2011. http://tel.archives-ouvertes.fr/tel-00586614.

Texto completo
Resumen
Darwin a révélé au monde que les espèces vivantes ne cessent jamais d'évoluer, mais les mécanismes moléculaires de cette évolution restent le sujet de recherches intenses. La biologie systémique propose que les relations entre génotype, environnement et phénotype soient sous-tendues par un ensemble de réseaux moléculaires dynamiques au sein de la cellule, mais l'organisation de ces réseaux demeure mystérieuse. En combinant des concepts établis en biologie évolutive et systémique avec la cartographie d'interactions protéiques et l'étude des méthodologies d'annotation de génomes, j'ai développé de nouvelles approches bioinformatiques qui ont en partie dévoilé la composition et l'organisation des systèmes cellulaires de trois organismes eucaryotes : la levure de boulanger, le nématode Caenorhabditis elegans et la plante Arabidopsis thaliana. L'analyse de ces systèmes m'a conduit à proposer des hypothèses sur les principes évolutifs des systèmes biologiques. En premier lieu, je propose une théorie selon laquelle la traduction fortuite de régions intergéniques produirait des peptides sur lesquels la sélection naturelle agirait pour aboutir occasionnellement à la création de protéines de novo. De plus, je montre que l'évolution de protéines apparues par duplication de gènes est corrélée avec celle de leurs profils d'interactions. Enfin, j'ai mis en évidence des signatures de la co-évolution ancestrale hôte-pathogène dans l'organisation topologique du réseau d'interactions entre protéines de l'hôte. Mes travaux confortent l'hypothèse que les systèmes moléculaires évoluent, eux aussi, de manière darwinienne.
Los estilos APA, Harvard, Vancouver, ISO, etc.
25

Scott-Boyer, Marie Pier. "Annotation des ARN non codants du génome de Candida albicans par méthode bioinformatique". Thèse, 2009. http://hdl.handle.net/1866/2978.

Texto completo
Resumen
La bio-informatique est un champ pluridisciplinaire qui utilise la biologie, l’informatique, la physique et les mathématiques pour résoudre des problèmes posés par la biologie. L’une des thématiques de la bio-informatique est l’analyse des séquences génomiques et la prédiction de gènes d’ARN non codants. Les ARN non codants sont des molécules d’ARN qui sont transcrites mais pas traduites en protéine et qui ont une fonction dans la cellule. Trouver des gènes d’ARN non codants par des techniques de biochimie et de biologie moléculaire est assez difficile et relativement coûteux. Ainsi, la prédiction des gènes d’ARNnc par des méthodes bio-informatiques est un enjeu important. Cette recherche décrit un travail d’analyse informatique pour chercher des nouveaux ARNnc chez le pathogène Candida albicans et d’une validation expérimentale. Nous avons utilisé comme stratégie une analyse informatique combinant plusieurs logiciels d’identification d’ARNnc. Nous avons validé un sous-ensemble des prédictions informatiques avec une expérience de puces à ADN couvrant 1979 régions du génome. Grace à cette expérience nous avons identifié 62 nouveaux transcrits chez Candida albicans. Ce travail aussi permit le développement d’une méthode d’analyse pour des puces à ADN de type tiling array. Ce travail présente également une tentation d’améliorer de la prédiction d’ARNnc avec une méthode se basant sur la recherche de motifs d’ARN dans les séquences.
Bioinformatics is a multidisciplinary field that uses biology, computer science, physics and mathematics to solve problems in biology. One of the topics of bioinformatics is the analysis of genomic sequences and prediction of genes from non-coding RNA (ncRNA). The non-coding RNAs are RNA molecules that are transcribed but not translated into protein and have a function in the cell. The use of biochemistry and molecular biology techniques in order to find non-coding RNA genes is rather difficult and relatively expensive. Thus, the prediction of genes by bioinformatics methods is an important issue. This research describes a computer analysis to search for new ncRNA in the pathogen Candida albicans and an experimental validation. The strategy used was to combine several algorithms and to validate a subset of computer predictions with a microarray experience covering 1979 regions of the genome. We have identified 62 new transcripts in Candida albicans. We have also developed an analytical method for tiling array and attempted to improve the prediction of ncRNAs this with a method based on the search of RNA motifs in the sequences.
Los estilos APA, Harvard, Vancouver, ISO, etc.
26

Sarrasin, Matthew. "An approach to improved microbial eukaryotic genome annotation". Thèse, 2017. http://hdl.handle.net/1866/20415.

Texto completo
Los estilos APA, Harvard, Vancouver, ISO, etc.
27

Moreira, Sandrine. "Décodage de l'expression de gènes cryptiques". Thèse, 2016. http://hdl.handle.net/1866/18548.

Texto completo
Resumen
Pour certaines espèces, les nouvelles technologies de séquençage à haut débit et les pipelines automatiques d'annotation permettent actuellement de passer du tube Eppendorf au fichier genbank en un clic de souris, ou presque. D'autres organismes, en revanche, résistent farouchement au bio-informaticien le plus acharné en leur opposant une complexité génomique confondante. Les diplonémides en font partie. Ma thèse est centrée sur la découverte de nouvelles stratégies d'encryptage de l'information génétique chez ces eucaryotes, et l'identification des processus moléculaires de décodage. Les diplonémides sont des protistes marins qui prospèrent à travers tous les océans de la planète. Ils se distinguent par une diversité d'espèces riche et inattendue. Mais la caractéristique la plus fascinante de ce groupe est leur génome mitochondrial en morceaux dont les gènes sont encryptés. Ils sont décodés au niveau ARN par trois processus: (i) l'épissage en trans, (ii) l'édition par polyuridylation à la jonction des fragments de gènes, et (iii) l'édition par substitution de A-vers-I et C-vers-T; une diversité de processus posttranscriptionnels exceptionnelle dans les mitochondries. Par des méthodes bio-informatiques, j'ai reconstitué complètement le transcriptome mitochondrial à partir de données de séquences ARN à haut débit. Nous avons ainsi découvert six nouveaux gènes dont l'un présente des isoformes par épissage alternatif en trans, 216 positions éditées par polyuridylation sur 14 gènes (jusqu'à 29 uridines par position) et 114 positions éditées par déamination de A-vers-I et C-vers-T sur sept gènes (nad4, nad7, rns, y1, y2, y3, y5). Afin d'identifier les composants de la machinerie réalisant la maturation des ARNs mitochondriaux, le génome nucléaire a été séquencé, puis je l'ai assemblé et annoté. Cette machinerie est probablement singulière et complexe car aucun signal en cis ni acteur en trans caractéristiques des machineries d'épissage connues n'a été trouvé. J'ai identifié plusieurs candidats prometteurs qui devront être validés expérimentalement: des ARN ligases, un nombre important de protéines de la famille des PPR impliquées dans l'édition des ARNs dans les organites de plantes, ainsi que plusieurs déaminases. Durant ma thèse, nous avons mis en évidence de nouveaux types de maturation posttranscriptionnelle des ARNs dans la mitochondrie des diplonémides et identifié des candidats prometteurs de la machinerie. Ces composants, capables de lier précisément des fragments d'ARN et de les éditer pourraient trouver des applications biotechnologique. Au niveau évolutif, la caractérisation de nouvelles excentricités moléculaires de ce type nous donne une idée des processus de recrutement de gènes, de leur adaptation à de nouvelles fonctions, et de la mise en place de machineries moléculaires complexes.
Thanks to new high throughput sequencing technologies and automatic annotation pipelines, proceeding from an eppendorf tube to a genbank file can be achieved in a single mouse click or so, for some species. Others, however, fiercely resist bioinformaticians with their confounding genomic complexity. Diplonemids are one of them. My thesis is centered on the discovery of new strategies for encrypting genetic information in eukaryotes, and the identification of molecular decoding processes. Diplonemids are a group of poorly studied marine protists. Unexpectedly, metagenomic studies have recently ranked this group as one of the most diverse in the oceans. Yet, their most distinctive feature is their multipartite mitochondrial genome with genes in pieces, and encryption by nucleotide deletions and substitutions. Genes are decrypted at the RNA level through three processes: (i) trans-splicing, (ii) polyuridylation at the junction of gene pieces and (iii) substitutions of A-to-I and C-to-T. Such a diverse arsenal of mitochondrial post-transcriptional processes is highly exceptional. Using a bioinformatics approach, I have reconstructed the mitochondrial transcriptome from RNA-seq libraries. We have identified six new genes including one that presents alternative trans-splicing isoforms. In total, there are 216 uridines added in 14 genes with up to 29 U insertions, and 114 positions edited by deamination (A-to-I or C-to-T) among seven genes (nad4, nad7, rns, y1, y2, y3, y5). In order to identify the machinery that processes mitochondrial RNAs, the nuclear genome has been sequenced. I have then assembled and annotated the genome. This machinery is probably unique and complex because no cis signal or trans actor typical for known splicing machineries have been found. I have identified promising protein candidates that are worth to be tested experimentally, notably RNA ligases, numerous members of the PPR family involved in plants RNA editing and deaminases. During my thesis, we have identified new types of post-transcriptional RNA processing in diplonemid mitochondria and identified new promising candidates for the machinery. A system capable of joining precisely or editing RNAs could find biotechnological applications. From an evolutionary perspective, the discovery of new molecular systems gives insight into the process of gene recruitment, adaptation to new functions and establishment of complex molecular machineries.
Los estilos APA, Harvard, Vancouver, ISO, etc.
28

Kannan, Sivakumar. "Molecular protein function prediction using sequence similarity-based and similarity-free approaches". Thèse, 2007. http://hdl.handle.net/1866/15681.

Texto completo
Los estilos APA, Harvard, Vancouver, ISO, etc.
Ofrecemos descuentos en todos los planes premium para autores cuyas obras están incluidas en selecciones literarias temáticas. ¡Contáctenos para obtener un código promocional único!

Pasar a la bibliografía