Rozprawy doktorskie: „Classification génomique”

1

Idbaih, Ahmed. "Etude contributive pour une classification génomique des tumeurs gliales de l'adulte". Paris 11, 2007. http://www.theses.fr/2007PA11T006.

Pełny tekst źródła

Style APA, Harvard, Vancouver, ISO itp.

2

Hennart, Mélanie. "Taxonomie génomique des souches bactériennes et émergence de l'antibiorésistance". Electronic Thesis or Diss., Sorbonne université, 2022. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2022SORUS547.pdf.

Pełny tekst źródła

Streszczenie:

Les maladies infectieuses font partie des préoccupations mondiales en santé publique, en particulier en raison de la résistance aux antimicrobiens chez certaines bactéries pathogènes. L'espèce Klebsiella pneumoniae est identifiée comme l'une des bactéries multirésistantes les plus préoccupantes. Corynebacterium diphtheriae, responsable de la diphtérie, reste largement sensible aux antibiotiques de première intention dont la pénicilline et peut être contrôlée par les vaccins, mais ré-émerge lorsque la couverture vaccinale est insuffisante. Parmi les moyens de contrôle des maladies infectieuses, la détection et l'identification précise de ces agents pathogènes, ainsi que leur suivi épidémiologique, jouent un rôle primordial. La mise en œuvre du séquençage génomique a révolutionné le génotypage bactérien grâce à son haut pouvoir discriminant, qui permet la distinction des agents pathogènes à l'échelle des souches. Le séquençage génomique permet également la détection de variants et de leurs caractéristiques importantes, telles que leur virulence ou leur résistance. Les travaux de recherche de cette thèse s'articulent sur deux axes principaux. Le premier axe apporte des analyses bio-informatiques de la structure populationnelle de la résistance aux antibiotiques chez C. diphtheriae. Une étude d'association génomique (GWAS) a été réalisée pour définir les bases moléculaires de la résistance, ainsi que les associations avec la production de toxine diphtérique et d'autres caractéristiques des souches. Un nouveau gène de résistance à la pénicilline a été découvert sur un élément mobile chez C. diphtheriae. Un outil de génotypage a été développé spécifiquement pour C. diphtheriae, pour laquelle les liens entre génotypes et phénotypes cliniques sont mal connus. Cet outil consolide et facilite la détection et le génotypage des principaux facteurs de virulence et des gènes de résistance, ainsi que l'usage des nomenclatures des souches à partir de génomes assemblés. Il permet également de prédire les biovars et la toxicité des souches. Le second axe est consacré à la taxonomie génomique infra-spécifique. Une nouvelle approche de classification et de nomenclature génomiques est proposée en utilisant comme modèle l'espèce K. pneumoniae. Ces travaux détaillent la conception et l'implémentation d'un système de codes-barres qui combine le regroupement par Single Linkage MultiLevel (MLSL) et les LIN (Life Identification Number) codes, tous deux basés sur le même schéma de typage core-genome MLST (cgMLST). Cette approche taxonomique innovante résulte en une nomenclature infra-spécifique précise et stable, qui est de plus largement déployable chez les autres espèces bactériennes. Une étude de la structure phylogénétique de C. diphtheriae a également été réalisée, avec la mise en œuvre d'un système cgMLST sur la base duquel une taxonomie génomique des souches a été proposée. Sur la base des nouveaux apports et concepts précédemment exposés, plusieurs études de cas ont été réalisées : mise en évidence et caractérisation d'une nouvelle espèce bactérienne (C. rouxii), précédemment confondue avec C. diphtheriae ; et épidémiologie génomique de la diphtérie dans différentes régions du monde, ou à partir de sources cliniques humaines et animales. Ces applications de la taxonomie génomique associée à la détection des gènes de résistance aux antibiotiques illustrent le potentiel des méthodes et des outils développés durant cette thèse afin de contribuer à la recherche et à la surveillance génomique des bactéries pathogènes
Infectious diseases are a global public health concern, particularly due to antimicrobial-resistance in some pathogenic bacteria. Klebsiella pneumoniae is one of the most worrying multiresistant bacteria. Corynebacterium diphtheriae, which causes diphtheria, remains largely susceptible to first-line antibiotics, including penicillin, and can be controlled through vaccination, but re-emerges when vaccination coverage is insufficient. Among the effective infection control measures, the accurate detection and identification of these pathogens, as well as their epidemiological monitoring, play a key role. In the recent years, the implementation of whole-genome sequencing (WGS) has revolutionised bacterial genotyping, by providing discrimination at the strain level. Genomic sequencing also enables the detection of variants and their important characteristics, such as virulence or antimicrobial resistance. The research work of this thesis is structured around two main axes. The first axis provides bioinformatic analyses of the population structure of antimicrobial resistance in C. diphtheriae. A genome-wide association study (GWAS) was performed to determine the genetic basis behind the resistance phenotypes, as well as the associations with diphtheria toxin production and other strain characteristics. A new penicillin resistance gene was discovered on a mobile element in C. diphtheriae. A genotyping tool was developed specifically for C. diphtheriae, for which the links between genotypes and clinical phenotypes are poorly known. This tool consolidates and facilitates the detection and genotyping of the main virulence factors and resistance genes, as well as the use of strain nomenclatures from assembled genomes. It also enables the prediction of biovars and toxicity of strains. The second axis relates to infra-species genomic taxonomy. A new approach of genome-based classification and nomenclature of strains was developed using K. pneumoniae as a model. This work describes the design and implementation of a barcoding system that combines Single Linkage MultiLevel (MLSL) clustering and Life Identification Number (LIN) codes, both based on the same core-genome MLST (cgMLST) typing scheme. This innovative taxonomic approach, widely applicable to other bacterial species, yields precise and stable nomenclatures. A study of the phylogenetic structure of C. diphtheriae was also carried out, with the implementation of a cgMLST scheme on the basis of which a genomic taxonomy of strains was proposed. Based on the contributions and concepts presented above, several case studies were carried out: identification and characterisation of a new species (C. rouxii), previously misidentified as C. diphtheriae; genomic epidemiology of diphtheria in different world regions or clinical sources. These applications of genomic taxonomy in combination with antimicrobial resistance gene detection illustrate the potential of the methods and tools developed during this thesis to support genomic research and surveillance of pathogenic bacteria

Style APA, Harvard, Vancouver, ISO itp.

3

Marisa, Laetitia. "Classification et caractérisation des cancers colorectaux par approches omiques". Thesis, Paris 6, 2015. http://www.theses.fr/2015PA066235/document.

Pełny tekst źródła

Streszczenie:

Le cancer du côlon (CC) est l'un des cancers les plus fréquents et les plus mortels en France et dans le monde. Près de la moitié des patients décèdent dans les 5 ans suivant le diagnostic. La classification clinique en stade histologique et la classification moléculaire selon les formes d'instabilité du génome (l'instabilité des microsatellites (MSI), l'instabilité chromosomique (CIN) et l'hyperméthylation des promoteurs (CIMP)) ne suffisent pas à définir des entités homogènes du point de vue moléculaire et à prédire de manière efficace la récidive. Pour améliorer la prise en charge des patients, il apparaît indispensable de mieux appréhender la diversité de la maladie afin de trouver des marqueurs pronostiques et prédictifs efficaces. Mon travail de thèse a donc été d'étudier la diversité des CC à l'échelle moléculaire par l'utilisation d'approches omiques sur une large cohorte de patients. Il a abouti à l'établissement d'une classification transcriptomique robuste de ce cancer dans son ensemble, validée sur des données indépendantes, et à la caractérisation fine de chacun des sous-types. Six sous-types ont ainsi été définis présentant des caractéristiques clinico-pathologiques, des altérations moléculaires de l'ADN, des enrichissements de signatures liées aux lésions et cellules d'origines, des voies de signalisation dérégulées et des survies bien distinctes. Les résultats de ce travail ont été confortés par un travail de classification consensus mis en place avec un consortium de travail international auquel j'ai participé. Ces résultats ont permis de confirmer que le cancer colorectal n'est pas une maladie homogène. Ils ouvrent de nouvelles perspectives pour l'établissement de signatures pronostiques et la recherche de cibles pour de nouveaux traitements ainsi que pour l'évaluation de la réponse au traitement au sein d'essais cliniques
Colon cancer (CC) is one of the most frequent and most deadly cancer in France and worldwide. Nearly half of patients die within 5 years after diagnosis. Clinical stage based on histological features and molecular classification based genomic instabilities (microsatellite instability (MSI), chromosomal instability (CIN) and hypermethylation of the promoters (ICPM)) are not sufficient to define homogeneous molecular entities and to predict recurrence effectively. To improve patient care, it is essential to better understand the diversity of the disease so that effective prognostic and predictive markers could be found. My PhD work has been focused on studying the diversity of CC at the molecular level through the use of omics approaches on a large cohort of tumor samples. It led to the establishment of a robust transcriptomic classification of these cancers, validated on independent data sets, and to a detailed characterization of each of the subtypes. Six subtypes have been defined and were associated with distinct clinicopathological characteristics and molecular alterations, specific enrichments of supervised gene expression signatures related to cell and lesions of origin, specific deregulated signaling pathways and distinct survival. The results of this work have been strengthened by a consensus classification defined by an international consortium working group in which I've been involved. These results confirm that colorectal cancer is an heterogeneous disease. They provide a renewed framework to develop prognostic signatures, discover new treatment targets, identify new therapeutic strategies and assess response to treatment in clinical trials

Style APA, Harvard, Vancouver, ISO itp.

4

Schmitt, Louise-Amelie. "Développement de modèles spécifiques aux séquences génomique virales". Thesis, Bordeaux, 2017. http://www.theses.fr/2017BORD0649/document.

Pełny tekst źródła

Streszczenie:

Le séquençage ADN d'échantillons complexes contenant plusieurs espèces est une technique de choix pour étudier le paysage viral d'un milieu donné. Or les génomes viraux sont difficiles à identifier, de par leur extrême variabilité et la relation étroite qu'ils entretiennent avec leurs hôtes. Nous proposons de nouvelles pistes de recherche pour apporter une solution spécifique aux séquences virales afin de répondre au besoin d'identification pour lequel les solutions génériques existantes n'apportent pas de réponse satisfaisante
DNA sequencing of complex samples containing various living species is a choice approach to study the viral landscape of a given environment. Viral genomes are hard to identify due to their extreme variability and the tight relationship they have with their hosts. We hereby provide new leads for the development of a virusesspecific solution to the need for accurate identification that hasn't found a satisfactory solution in the existing universal software so far

Style APA, Harvard, Vancouver, ISO itp.

5

Darde, Thomas. "Identification et classification de composés reprotoxiques par des approches de toxicogénomique prédictive". Thesis, Rennes 1, 2017. http://www.theses.fr/2017REN1B022/document.

Pełny tekst źródła

Streszczenie:

L’un des plus importants défis de la toxicologie est de pouvoir extrapoler les résultats issus des différentes phases de l’analyse du risque sanitaire à partir de systèmes expérimentaux vers les populations humaines. Dans ce contexte, les techniques globales dites "omiques" sont de plus en plus utilisées pour caractériser les différents états des systèmes biologiques. Ainsi, la toxicogénomique permet non seulement d’étudier les mécanismes d’action des composés, d’identifier des marqueurs d’exposition, mais aussi de générer des signatures moléculaires à potentiel prédictif. En effet, des composés ayant des signatures moléculaires semblables ont également de forts risques de présenter les mêmes effets toxicologiques. L’objectif de cette thèse est d’appliquer ce concept de manière systématique, en explorant les données publiées et disponibles dans les banques dédiées à la toxicogénomique via des modèles statistiques multivariés. Ces analyses ont pour objectif de permettre le regroupement et donc la classification des composés sur la base des gènes dont ils affectent l’expression. L’appartenance de produits toxiques bien caractérisés aux classes ainsi constituées permet alors d’émettre des hypothèses quant à la toxicité des autres composés. Un jeu de données quantitatives intégrant 18 études réalisées avec la même technologie de puce à ADN et chez une seule espèce a été assemblé. De ce jeu de données, 3022 signatures toxicogénomiques correspondant à 452 composés différents ont été obtenues. Des approches de classification non supervisées afin de définir des classes de traitements induisant des altérations transcriptionnelles proches ont été mises en place. 95 et 104 classes ont été obtenues en fonction des méthodes utilisées. Finalement, une attention toute particulière a été portée sur les potentiels nouveaux perturbateurs endocriniens et xénobiotiques reprotoxiques sur-représentés dans trois classes spécifiquement. 22 composés sont en cours de test sur une lignée cellulaire humaine exprimant les enzymes de la stéroïdogenèse (NCI-H295R) pour évaluer leur potentiel effet perturbateur endocrinien. L’ensemble de ce travail a ainsi permis de démontrer la pertinence de nos approches de toxicogénomique pour la prédiction des effets toxiques de composés testés dans d’autres organes et/ou chez d’autres espèces. Il se poursuit à l’heure actuelle par la mise en place d’une base de données, TOXsIgN, permettant l’hébergement et l’accès à l’ensemble de signatures de toxicogénomique générées dans ce projet. De même, mon travail a également permis la mise en place de plusieurs outils dédiés à la toxicologie prédictive et à la visualisation de données, tels que le navigateur de génomes comme le ReproGenomics Viewer (RGV)
The core aim of my thesis project is to develop predictive toxicology approaches based on the integration of massive toxicogenomics datasets using bioinformatics and biostatistics methodologies. Specific objectives include: (1) classification of chemicals based on toxicogenomics signatures, i.e. the set of genes whose expression is known to be positively or negatively altered after exposure to these compounds; (2) the association of the resulting classes with human disorders or deleterious phenotypes based on the well-known toxicants present in those classes; (3) the prediction of novel reprotoxicants and/or endocrine disruptors based on toxicogenomics signature similarities with known chemicals affecting testis development and function. The assembled toxicogenomics dataset contains 23,657 samples covering 7092 experimental conditions (one chemical, one dose, one exposure time, one tissue) for 541 chemicals in seven distinct tissues in the rat from 18 different studies. From this dataset, 3,022 experimental conditions corresponding to 452 distinct compounds are associated to a toxicogenomics signature containing more than ten genes showing an altered expression pattern after exposure. Using unsupervised classification methods, 95 chemical clusters were defined showing close toxicogenomics signatures. The phenotype association analysis using data extracted from de Comparative Toxicogenomics Database (CTD) allowed us to identify three clusters significantly enriched in known endocrine-disrupting chemicals. Currently, 22 compounds are being tested on a human cell line expressing the enzymes of steroidogenesis (NCI-H295R) to evaluate their potential endocrine disrupting effects. These researches allowed us to demonstrate the relevance of integrating massive toxicogenomics datasets to predict adverse effects of compounds tested in different organs. It is currently being pursued through the development of a novel repository, TOXsIgN. This resource provides a flexible environment to facilitate online submission, storage and retrieval of toxicogenomics signatures by the scientific community. Similarly, the current PhD project also yielded to the implementation of several tools dedicated to predictive toxicology and data visualization including the ReproGenomics Viewer (RGV)

Style APA, Harvard, Vancouver, ISO itp.

6

Jourdan, Laetitia. "Métaheuristiques pour l'extraction de connaissances : application à la génomique". Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2003. http://tel.archives-ouvertes.fr/tel-00007983.

Pełny tekst źródła

Streszczenie:

Le travail présenté dans cette thèse traite de l'extraction de connaissances à l'aide de métaheuristiques et de ses applications à des problématiques en génomique. Dans un premier temps, nous donnons un état de l'art des métaheuristiques utilisées pour l'extraction de connaissances et plus particulièrement de l'utilisation des algorithmes génétiques en orientant notre présentation sur trois aspects fondamentaux des métaheuristiques : la représentation d'une solution, la fonction d'évaluation et le choix des opérateurs. Nous présentons ensuite deux problématiques issues d'une collaboration avec l'Institut de Biologie de Lille autour de la recherche de facteurs génétiques de prédisposition à certaines maladies multifactorielles (diabète de type II, obésité). Nous proposons une modélisation de ces problèmes en problèmes d'extraction de connaissances. Nous traitons ensuite les différentes taches d'extraction de connaissances identifiées comme des problèmes d'optimisation et proposons un schéma d'algorithme génétique possédant des mécanismes avancés d'intensification et de diversification pour les résoudre. Les apports de ces mécanismes sont testés modulairement afin de montrer leurs performances. Nous intégrons également des connaissances du domaine biologique afin de répondre aux problématiques posées. Cette intégration s'effectue aussi bien au niveau des fonctions d'évaluation proposées qu'au niveau de certains mécanismes utilisés. Enfin, différents modèles de parallélisme sont utilisés.

Style APA, Harvard, Vancouver, ISO itp.

7

Hussain, Syed Fawad. "Une Nouvelle Mesure de Co-Similarité : Applications aux Données Textuelles et Génomique". Phd thesis, Grenoble, 2010. http://tel.archives-ouvertes.fr/tel-00525366.

Pełny tekst źródła

Streszczenie:

La classification de données (ou apprentissage non-supervisé) vise à regrouper un ensemble d'observations sous la forme de classes homogènes et contrastées. Lorsque les données sont caractérisées par un grand nombre de variables, il devient nécessaire d'adapter les méthodes classiques, notamment au niveau des métriques, afin de maintenir des classes pertinentes ; ce phénomène est connu sous le nom de "malédiction de la dimension". Dans cette thèse, nous proposons une mesure de co-similarité basée sur la notion de co-occurrences d'ordre supérieur, directement extraites à partir des données. Dans le cas de l'analyse de texte, par exemple, les similarités entre documents sont calculées en prenant en compte les similarités entre mots, qui simultanément prennent en compte les similarités entre documents. Par cette approche " circulaire ", nous parvenons à mettre en correspondance des documents sans mots communs mais ayant juste des mots similaires. Cette approche s'effectue de manière purement numérique sans nécessiter de thesaurus externe. En outre, notre méthode peut également être étendue pour tirer parti de connaissances "a priori" afin de réaliser des tâches de catégorisation de textes : l'étiquette des documents est utilisée pour influencer les mesures de similarité entre les mots afin de classer de nouvelles données. Ainsi, le même cadre conceptuel, exprimable en terme de théorie des graphes, peut être utilisé à la fois pour les tâches de classification et de catégorisation en fonction de la quantité d'information initiale. Nos résultats montrent une amélioration significative de la précision, par rapport à l'état de l'art, à la fois pour le co-clustering et la catégorisation sur les jeux de données qui ont été testés.

Style APA, Harvard, Vancouver, ISO itp.

8

Hussain, Syed Fawad. "Une nouvelle mesure de co-similarité : applications aux données textuelles et génomique". Phd thesis, Grenoble, 2010. http://www.theses.fr/2010GRENM049.

Pełny tekst źródła

Streszczenie:

La classification de données (apprentissage non-supervisé) vise à regrouper un ensemble d'observations sous la forme de classes homogènes et contrastées. Lorsque les données sont caractérisées par un grands nombre de propriétés, il devient nécessaire d'adapter les méthodes classique, notamment au niveau des métriques, afin de maintenir des classes pertinentes; ce phénomène est connu sous le nom de "malédiction de la dimension". Dans cette thèse nous proposons une mesure de co-similarité basée sur la notion de co-occurrences d'ordre supérieur, directement extraites à partir des données. Dans le cas de l'analyse de texte, par exemple, les similarités entre documents sont calculées en prenant en compte les similarités entre mots, qui simultanément prennent en compte les similarités entre documents. Par cette approche circulaire, nous mettons en correspondance des documents sans mots communs mais juste des mots similaires. Cette approche s'effectue sans nécessiter de thesaurus externe. En outre, notre méthode peut également être étendu pour tirer partie de connaissances "a priori" pour réaliser des tâches de catégorisation de textes: l'étiquette des documents est utilisée pour influencer les mesures de similarité entre les mots afin de classer de nouvelles données. Ainsi, le même cadn conceptuel, exprimable en terme de la théorie des graphes, peut être utilisé à la fois pour les tâches de classification et de catégorisation en fonction de la quantité d'information initiale. Nos résultats montrent une amélioration significative de la précision, par rapport à l'état de l'art, pour le co-clustering et la catégorisation sur les jeux d données qui ont été testés
Clustering is the unsupervised classification of patterns (observations, data items, or feature vectors) into homogeneous and contrasted groups (clusters As datasets become larger and more varied, adaptations to existing algorithms are required to maintain the quality of cluster. Ln this regard, high¬dimensional data poses sorne problems for traditional clustering algorithms known as the curse of dimensionality. This thesis proposes a co-similarity based algorithm that is based on the concept of higher-order co-occurrences, which are extracted from the given data. Ln the case of text analysis, for example, document similarity is calculated based on word similarity, which in turn is calculated on the basis of document similarity. Using this iterative approach, we can bring similar documents closer together even if they do not share the same words but share similar words. This approach doesn't need externallinguistic resources like a thesaurus Furthermore this approach can also be extended to incorporate prior knowledge from a training dataset for the task of text categorization. Prior categor labels coming from data in the training set can be used to influence similarity measures between worlds to better classify incoming test dataset among the different categories. Thus, the same conceptual approach, that can be expressed in the framework of the graph theory, can be used for both clustering and categorization task depending on the amount of prior information available. Our results show significant increase in the accuracy with respect to the state of the art of both one-way and two-way clustering on the different datasets that were tested

Style APA, Harvard, Vancouver, ISO itp.

9

Abou, Abdallah Rita. "La génomique : un outil robuste et émergent utilisé dans la taxonomie bactérienne et l'analyse comparative". Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0256/document.

Pełny tekst źródła

Streszczenie:

Le nombre de nouvelles espèces bactériennes identifiées augmente constamment. L'un des facteurs les plus importants de cette situation est l'approche culturomique. Par conséquent, la nécessité de classifier et de décrire taxonomiquement ces microorganismes pour comprendre leur évolution, leurs caractéristiques et leurs relations avec d'autres organismes vivants a émergé. À ce jour, plus de 170000 génomes bactériens sont disponibles. Face à cette situation, la taxonomie bactérienne ne peut être éloignée des informations fournies par le génome entier. La stratégie taxonogénomique a été élaborée dans notre laboratoire pour inclure les séquences du génome dans le schéma taxonomique. Cette nouvelle stratégie consiste en la combinaison de diverses données phénotypiques, et l'analyse génomique et la comparaison, aboutissant à une description rationnelle et complète de nouveaux taxons bactériens. Un deuxième aspect de notre travail de thèse a été l'analyse pangénomique de Coxiella burnetii. Profitant de la disponibilité de 75 génomes de C. burnetii, nous avons montré que ce pangénome est ouvert, ce qui s’oppose à ceux des autres bactéries intracellulaires. Aucun contenu génique spécifique à une maladie, ou à un géovar spécifique n'a pu être identifié. En revanche, l'analyse phylogénétique basée sur le core génome correspondait à celle obtenue à partir du typage. Ainsi, nous démontrons ici que le séquençage du génome peut être bien adapté à la description officielle ainsi que l'analyse pangénomique des bactéries associées à l'homme, et permettre de répondre à de nombreuses questions microbiologiques telles que l'évolution, la résistance aux antibiotiques et la pathogénicité
The number of new identified bacterial species is constantly increasing. One of the most important contributors to this situation is the microbial culturomics approach. Consequently, the need to classify and taxonomically describe those microorganisms to understand their evolution, characteristics and relationships with other living organisms has emerged. To date, more than 170000 bacterial genomes are available. Facing this situation, bacterial taxonomy cannot be disconnected from the information provided from the whole genome. The taxono-genomics strategy was elaborated in our laboratory to include genome sequences in the taxonomic scheme. This new strategy consists in the combination of various phenotypic data and genomic analysis and comparison, resulting in a rational and comprehensive description of new bacterial taxa. A second aspect of our thesis work was the pangenomic analysis of Coxiella burnetii. Taking advantage of the availability of 75 C. burnetii genomes, we showed that this pangenome is open, which contrasts with those of other intracellular bacteria. No disease-specific, or geovar-specific gene content could be identified. In contrast, the core gene-based phylogenetic analysis matched that obtained from multi-spacer typing. Thus, we herein demonstrate that genome sequencing may, among its many applications, be well suited for the official description as well as pangenome analysis of human-associated bacteria, including pathogens, and may allow addressing many microbiological questions, such as evolution, outbreaks, antibiotic resistance, and pathogenicity

Style APA, Harvard, Vancouver, ISO itp.

10

Pages, Mélanie. "Integrative genomic, epigenetic, radiologic and histological characterization of pediatric glioneuronal tumors". Thesis, Sorbonne Paris Cité, 2018. http://www.theses.fr/2018USPCB217.

Pełny tekst źródła

Streszczenie:

Pas de résumé
The large-scale genomic studies performed recently has enabled the objective identification of numerous novel genomic alterations and highlighted that pediatric brain tumors often harbor quiet cancer genomes, with a single driver genomic alteration. This characteristic is of special interest in the current context of precision medicine development. Low-grade glioneuronal tumor group is highly heterogeneous and remains particularly challenging since it includes a broad spectrum of tumors, often poorly discriminated by their histopathological features and not completely molecularly characterized. We used targeted methods (IHC, FISH, targeted sequencing), and large scale genomic and epigenetic methodologies to perform an integrative analysis to further characterized papillary glioneuronal tumors (PGNT), midline gangliogliomas and dysembryoplastic neuroepithelial tumors (DNT). We demonstrated that PGNT is a distinct entity characterized by a PRKCA fusion. We highlighted that H3 K27M mutation can occur in association with BRAF V600E mutation in midline grade I glioneuronal tumors, showing that despite the presence of H3 K27M mutations, these cases should not be graded and treated as grade IV tumors because they have a better spontaneous outcome than classic diffuse midline H3 K27M-mutant glioma. The DNT study enable us 1) to specify that non-specific DNT corresponds to a clinico-histological tumor group encompassing diverse molecularly distinct entities and 2) to demonstrate that specific DNTs can be progressive tumors and harbored a distinct DNA methylation profile. Diagnosis and genomic profiling that can guide precision medicine require tissue acquisition by neurosurgical procedures that are often difficult or not possible. We validated a sample collection procedure and we developed methodologies to detect circulating tumor DNA (ctDNA) in CSF, plasma and urine to identify clinically relevant genomic alterations from a cohort of 235 pediatric patients with brain tumors. We optimized a method to process ctDNA and performed ultra-low pass whole genome sequencing (ULP-WGS) using unique molecular identifiers, confirming we can reliably construct sequencing libraries from CSF-, plasma- and urine-derived ctDNA. ULP-WGS has also been used to assess sequencing library quality, copy number variations (CNVs) and tumor fraction. The vast majority of samples undergoing ULPWGS exhibited no CNVs, consistent with either absence in the tumor or low levels of tumorderived cfDNA. To distinguish between these, we developed a hybrid capture sequencing panel allowing identification of specific mutations and fusions more common in pediatric brain tumors

Style APA, Harvard, Vancouver, ISO itp.

11

Marchandin, Hélène. "Organisation génomique, phylogénie et taxonomie polyphasique des bactéries du genre Veillonella et des genres apparentés du sous-groupe Sporomusa". Montpellier 1, 2001. http://www.theses.fr/2001MON1T017.

Pełny tekst źródła

Streszczenie:

Une etude portant sur 120 souches de cocci a gram negatif anaerobies stricts a ete menee, permettant l'isolement de 116 veillonella sp. Dont une atypique de 5 souches inconnues. Ces isolats atypiques ou inconnus ont ete caracterises au plan phenotypique, genotypique et phylogenetique permettant la description de 2 nouveaux genres et 3 nouvelles especes bacteriennes. Toutes ces bacteries a gram negatif sont phylogenetiquement classees dans le sous-groupe sporomusa au sein du phylum bacillus/clostridium des bacteries a gram positif, une etude de microscopie electronique a permis de preciser le type gram negatif de leur paroi. Aucun test phenotypique ne permettant d'identifier les differentes especes du genre veillonella, nous avons conduit une etude de structure de population utilisant des methodes genetiques et genomiques. [. . . ] l'ensemble de ces resultats est discute afin de preciser la taxonomie du genre veillonella, ainsi que la notion d'espece au sein de ce genre. Notre travail complete les connaissances sur ces bacteries jusqu'alors tres peu etudiees tant au plan genetique qu'au plan genomique.

Style APA, Harvard, Vancouver, ISO itp.

12

El, Houmami Nawal. "Génomique de Kingella kingae et Kingella negevensis : applications en microbiologie clinique et en biotechnologie pour l'édition du génome". Thesis, Aix-Marseille, 2017. http://www.theses.fr/2017AIXM0595.

Pełny tekst źródła

Streszczenie:

Kingella kingae est un pathogène important en pédiatrie responsable d'infections ostéo-articulaires, de bactériémies, et d'endocardite, principalement chez les enfants entre 6 et 36 mois, et survenant soit de façon sporadique ou épidémique dans les crèches. L'endocardite à K. kingae est une infection sévère qui, lorsqu'elle survient chez un enfant en crèche, devrait impérativement conduire à une investigation épidémiologique pour identifier d'éventuels cas suspects, prendre en charge rapidement les cas épidémiques, et prévenir la survenue de nouveaux cas.L'analyse génomique du genre Kingella a conduit à la description taxonomique de K. negevensis; au développement de nouveaux tests diagnostiques et de génotypage pour K. kingae et K. negevensis. Le développement du premier test par PCR en temps réel spécifique de K. negevensis a ainsi révélé que cette bactérie pouvait être occasionnellement pathogène chez l'enfant, voire mortelle chez le patient immunodéprimé. La découverte d'un locus RTX dans le génome de K. negevensis homologue à celui de K. kingae a ensuite permis de réajuster les stratégies diagnostiques des infections à K. kingae et K. negevensis
Kingella kingae is an important paediatric pathogen responsible for bone and joint infections, bacteremia, and endocarditis. Invasive infections affect primary children aged 6-36 months, and may occur either sporadically, or break out in daycare centers. Kingella kingae endocarditis is a serious infection, which should prompt the search for an outbreak of K. kingae infections when it occurs in a day-care attendee and the prevention of new cases.The genomic analysis of the Kingella genus conducted to the taxonomic description of K. negevensis. The design of the first K. negevensis-specific real-time PCR test allowed to disclose that this organism may occasionally be invasive in infants, and even fatal in immunosuppressed patients. The discovery of an homologuous Kingella RTX locus within the K. negevensis genome allowed to refine diagnostic strategies in clinical microbiology for the molecular detection of K. kingae and K. negevensis

Style APA, Harvard, Vancouver, ISO itp.

13

Roger, Frédéric. "Mode d’évolution et taxonomie au sein du genre Aeromonas : que nous apprend l'étude de la diversité génétique et génomique ?" Thesis, Montpellier 1, 2012. http://www.theses.fr/2012MON13504/document.

Pełny tekst źródła

Streszczenie:

L'étude des bactéries pathogènes opportunistes d'origine environnementale ayant des modes de vie variés, libre et autonome ou contraint à une niche spécifique représentée par l'hôte, présente un intérêt dans la compréhension de l'adaptation des bactéries à leurs hôtes et de l'apparition de nouveaux pathogènes. Le genre Aeromonas regroupe des bactéries communes des milieux aquatiques, principalement des eaux douces. Elles sont capables d'entretenir différents types de relations avec leurs hôtes (parasitisme/symbiose) et peuvent être hébergées par un large spectre d'organismes. Chez l'homme, elles sont la cause d'une large variété d'infections (gastroentérite, bactériémie, infection de la peau et des tissus mous, etc.) mais les difficultés d'identification des souches et une taxonomie confuse engendrent une méconnaissance de la pathogénicité réelle des différentes espèces décrites.Le but de ce travail était d'étudier les mécanismes d'évolution génomique et génétique à l'origine de la remarquable capacité d'adaptation des Aeromonas à leurs hôtes, notamment à l'homme. Une analyse comparative de la diversité génétique et génomique d'une large collection de 195 souches représentative des différentes espèces du genre et d'origines variées (humaine, animale et environnementale) a été menée. La diversité génétique a été appréhendée au moyen d'une approche multilocus incluant l'étude des séquences de 7 gènes de ménage (dnaK, gltA, gyrB, radA, rpoB, tsf, zipA). En parallèle, nous avons étudié la variabilité des copies multiples du gène rrs en explorant leur diversité génétique par une méthode d'électrophorèse en condition dénaturante (PCR-TTGE) et la variabilité du nombre et de la répartition des opérons rrn dans le chromosome de ces bactéries par électrophorèse en champ pulsé.Ces différentes approches nous ont permis de mettre en évidence : i) une diversité très élevée des 7 gènes de ménage analysés ainsi que l'existence de transferts latéraux, ii) l'existence de sous-groupes de souches adaptées à un hôte ou à une localisation anatomique particulière, iii) un nombre important d'opérons rrn (8 à 11), iv) l'existence de profils de distribution chromosomique des opérons rrn spécifique d'espèce ou de groupes d'espèces proches, v) une forte proportion (41,5%) des souches présentant une hétérogénéité de séquences des différentes copies du gène rrs. Nos résultats montrent également la valeur taxonomique de l'étude de la diversité génétique et génomique à l'aide des approches proposées au sein du genre Aeromonas.Nous montrons que : i) l'ARN ribosomique 16S est un marqueur informatif pour étudier les modes d'évolution et conduire des études de taxonomie mixte et consensuelle dans le genre Aeromonas à condition d'étudier la diversité de ses multiples copies, ii) A. caviae présente des caractéristiques génétiques particulières témoignant d'un processus d'adaptation en cours à une niche écologique que nous supposons être l'intestin humain. Nos résultats supportent également un mode d'évolution des bactéries du genre Aeromonas dit en complexes d'espèces accompagné de phénomènes de spéciation pouvant en partie expliquer les difficultés rencontrées pour établir une taxonomie claire du genre Aeromonas
Abstract :Studying opportunistic pathogenic bacteria with an environmental origin and a wide variety of lifestyles, either free-living or host-adapted, is useful to improve the understanding of bacterial adaptation to hosts and the emergence of novel pathogens. The genus Aeromonas groups water-living bacteria, mainly in freshwater. They are able to support several types of relations with their hosts (parasitism/ symbiosis) and are harbored by a large spectrum of hosts. In human, they are involved in a wide range of infections (gastroenteritis, bacteraemia, wound and soft tissue infection, etc.) but difficulties in identifying strains and a confused taxonomy results in incomplete knowledge of the real strain pathogenicity of each described species.The aim of this work was to study the mechanisms of genomic and genetic evolution related to the outstanding ability of Aeromonas adaptation to host, including human. We led a comparative analysis of the genetic and genomic diversity on a large strain collection (195 strains) representative of the species of the genus and from various sources (human, animal, environmental). We studied the genetic diversity using a 7 housekeeping gene multilocus strain analysis (dnaK, gltA, gyrB, radA, rpoB, tsf, zipA). We also described the variability in the i) rrs multiple gene copies using a PRC-TTGE method and ii) the number and distribution of the rrn operons within the chromosome using a pulse field gel electrophoresis. Our results also showed the taxonomic value of the study of genetic and genomic diversity using the approaches proposed in the genus Aeromonas.These various approaches enabled us to highlight: i) a high genetic diversity in the housekeeping genes together with horizontal gene transfers events, ii) some clusters that were either host-adapted or adapted to particular anatomical locations, iii) a high number of rrn operons (from 8 to 11), iv) the presence of patterns of rrn operon that were either species-specific or specific to groups of closely related species, v) a high frequency (41,5%) of strains harboring sequence heterogeneities between rrs copies. We showed that: i) 16 rRNA is a valuable marker for studying the modes of evolution of aeromonads and the taxonomy within the genus Aeromonas provided that multiple copy diversity is taken into account, ii) A. caviae displays particular genetic characteristic that suggested an ongoing process of adaptation to a niche that we supposed to be human digestive tract. Our results also support an evolution mode in complex of species with some speciation process that could at least in part explain difficulties for determining a clarified taxonomy within the genus Aeromonas

Style APA, Harvard, Vancouver, ISO itp.

14

Yengo, Loïc. "Contribution à la classification de variables dans les modèles de régression en grande dimension". Thesis, Lille 1, 2014. http://www.theses.fr/2014LIL10028/document.

Pełny tekst źródła

Streszczenie:

Cette thèse propose une contribution originale au domaine de la classification de variables en régression linéaire. Cette contribution se base sur une modélisation hiérarchique des coefficients de régression. Cette modélisation permet de considérer ces derniers comme des variables aléatoires distribuées selon un mélange de lois Gaussiennes ayant des centres différents mais des variances égales. Nous montrons dans cette thèse que l'algorithme EM, communément utilisé pour estimer les paramètres d'un modèle hiérarchique ne peut s'appliquer. En effet, l'étape E de l'algorithme n'est pas explicite pour notre modèle.Nous avons donc proposé une approche plus efficace pour l'estimation des paramètres grâce à l'utilisation de l'algorithme SEM-Gibbs. En plus de cette amélioration computationnelle, nous avons introduit une contrainte dans le modèle pour permettre d'effectuer une sélection de variables simultanément. Notre modèle présente de très bonnes qualités prédictives relativement aux approches classiques pour la réduction de la dimension en régression linéaire. Cette thèse présente aussi une extension de notre méthodologie dans le cadre de la régression Probit pour données binaires. Notre modèle modèle a de plus été généralisé en relâchant l'hypothèse de l'égalité des variances pour les composantes du mélange Gaussien. Les performances de ce modèle généralisé ont été comparées à celles du modèle initial à travers différents scénarios de simulations. Ce travail de recherche a conduit au développement du package R clere. Ce dernier package met en œuvre tous les algorithmes décrits dans cette thèse
We proposed in this thesis an original contribution to the field of variable clustering in linear regression through a model-based approach. This contribution was made via a hierarchical modeling of the regression coefficients as random variables drawn from a mixture of Gaussian distributions with equal variances. Parameter estimation in the proposed model was shown to be challenging since the classical EM algorithm could not apply. We then developped a more efficient algorithm for parameter estimation, through the use of the SEM-Gibbs algorithm. Along with this computational improvement, we also enhanced our model to allow variable selection. Given the good predictive performances of the CLERE method compared to standard techniques for dimension reduction, we considred an extension of the latter to binary response data. This extension was studied in the context of Probit regression. We generalized our model by relaxing the assumption of equal variance for the components in the mixture of Gaussians. The performances of this generalization were compared to those of the initial model under different scenarios on simulated data. This research led to the development of the R package clere which implements most of the algorithms described in this thesis

Style APA, Harvard, Vancouver, ISO itp.

15

Abuelqumsan, Mustafa. "Assessment of supervised classification methods for the analysis of RNA-seq data". Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0582/document.

Pełny tekst źródła

Streszczenie:

Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du niveau d’expression des gènes selon les organes et circonstances, sous-tendent la différentiation cellulaire et la réponse aux changements d’environnement. Comme les maladies affectent souvent l’expression génique, les profils transcriptomiques peuvent servir des fins médicales (diagnostic, pronostic). Différentes méthodes d’apprentissage artificiel ont été proposées pour classer des individus sur base de données multidimensionnelles (par exemple, niveau d’expression de tous les gènes dans des d’échantillons). Pendant ma thèse, j’ai évalué des méthodes de « machine learning » afin d’optimiser la précision de la classification d’échantillons sur base de profils transcriptomiques de type RNA-seq
Since a decade, “Next Generation Sequencing” (NGS) technologies enabled to characterize genomic sequences at an unprecedented pace. Many studies focused of human genetic diversity and on transcriptome (the part of genome transcribed into ribonucleic acid). Indeed, different tissues of our body express different genes at different moments, enabling cell differentiation and functional response to environmental changes. Since many diseases affect gene expression, transcriptome profiles can be used for medical purposes (diagnostic and prognostic). A wide variety of advanced statistical and machine learning methods have been proposed to address the general problem of classifying individuals according to multiple variables (e.g. transcription level of thousands of genes in hundreds of samples). During my thesis, I led a comparative assessment of machine learning methods and their parameters, to optimize the accuracy of sample classification based on RNA-seq transcriptome profiles

Style APA, Harvard, Vancouver, ISO itp.

16

Caputo, Aurélia. "Analyse du génome et du pan-génome pour classifier les bactéries émergentes". Thesis, Aix-Marseille, 2017. http://www.theses.fr/2017AIXM0606/document.

Pełny tekst źródła

Streszczenie:

La bio-informatique est essentielle aujourd'hui dans de nombreux domaines comme par exemple la gestion et l'analyse des données, la génomique avec l'assemblage et l'annotation de génomes, la phylogénie, la métagénomique, la recherche de nouvelles espèces bactériennes et la classification taxonomique. Mon premier travail a porté sur l'assemblage et l'analyse d'un génome bactérien à partir de données de métagénomique. Le génome de Akkermansia muciniphila a pu être assemblé par mapping directement à partir de données issues d'échantillons de selle humaine. En 2012, la culturomics a permis de décrire le plus grand génome d'une bactérie isolée chez l'homme ; Microvirga massiliensis (9.3 Mb). Mon deuxième travail a permis d'assembler ce génome. Par la suite, nous avons essayé de comprendre pourquoi cette bactérie a un génome si grand. En effet, on observe qu'elle possède un plasmide, un nombre important d'ORFans et d'ARNr 16S ainsi que des gènes de grande taille. Elle comporte également un nombre important de transposons. Enfin, la troisième et dernière partie de mon travail se base sur les analyses de pan-génome pour la taxonomie bactérienne. La taxonomie est sujette à de nombreux changements selon les données disponibles et les méthodes utilisées, et suit l'évolution des techniques d'identification des bactéries. Nous avons alors redéfinit la notion d'espèce à l'aide du pan-génome pour le genre Klebsiella. En effet, une différence trop importante entraînant une cassure au niveau du ratio core/pan-génome, révèle l'apparition d'une nouvelle espèce. Cette découverte nous amène à utiliser le pan-génome comme outils novateur pour la taxonomie bactérienne
Since the introduction of DNA sequencing by Sanger and Coulson in 1977, considerable progress has been made. A growing number of data is being generated in several areas and requires more and more advances in computing. Bio-informatics is essential today in many fields such as data management and analysis, genomics with assembly and genome annotation, comparative genomics, phylogeny, metagenomics, research new bacterial species and taxonomic classification. My first work based on assembling and analyzing bacterial genome from metagenomic data. The genome of Akkermansia muciniphila could be assembled by mapping directly from data from human stool sample. In 2012,culturomics allowed to describe the largest genome of a bacterium isolated in human; Microvirga massiliensis (9.3 Mb). My second work allowed to assemble this genome. Subsequently, we tried to understand why this bacterium has such a large genome. Indeed, it is observed that it possesses a plasmid, a large number of ORFans and 16S rRNAs as well as large genes which one is more than 14kb. It also includes a large number of transposasons. Finally, the third and last part of the work concerns pan-genome analyzes for bacterial taxonomy. Taxonomy is a set of many changes based on available data, methods used and evolution of bacterial identification techniques. We have examined the notion of species using the genome at the genus Klebsiella. Indeed, a too large difference leading to a break in the core/pan-genome ratio undoubtedly reveals the appearance of a new species. This discovery leads us to use the pan-genome as an innovative tool for bacterial taxonomy

Style APA, Harvard, Vancouver, ISO itp.

17

Diop, Awa. "Analyse des séquences des génomes bactériens en tant que source d'information taxonomique". Thesis, Aix-Marseille, 2018. http://www.theses.fr/2018AIXM0276/document.

Pełny tekst źródła

Streszczenie:

L’Identification rapide et la classification microbienne précise sont cruciales en microbiologie médicale pour la surveillance de la santé humaine et animale, établir un diagnostic clinique approprié et choisir des mesures thérapeutiques et de contrôle optimales. Cependant, les seuils universels utilisés pour la définition des espèces ne sont pas applicables à de nombreux genres bactériens. C'est notamment le cas des espèces du genre Rickettsia, qui expriment peu de caractéristiques phénotypiques distinctives. Compte tenu de la disponibilité des séquences de près de 100 génomes de Rickettsia, nous avons voulu évaluer une gamme de paramètres taxonomiques basés sur l’analyse des séquences génomiques afin de mettre au point des recommandations pour la classification des isolats au niveau de l’espèce et du genre. En comparant le degré de similarité des séquences de 78 génomes de Rickettsia et 61 génomes de 3 genres étroitement apparentés en utilisant 4 paramètres génomiques, nous avons montré que les outils taxonomiques basés sur les séquences génomiques sont simples à utiliser et rapides, et permettent une classification taxonomique fiable et reproductible des isolats de rickettsies avec des seuils spécifiques. Les résultats obtenus nous ont permis d'élaborer des recommandations pour la classification des isolats de rickettsies au niveau du genre et de l'espèce. À l'aide de la taxono-génomique, nous avons également pu décrire 17 nouvelles espèces bactériennes associées à l'homme. L'utilisation des outils génomiques est donc parfaitement adaptée à la classification taxonomique et peut changer radicalement notre vision de la taxonomie et de l'évolution bactérienne à l'avenir
Rapid identification and precise microbial classification are crucial in medical microbiology for human and animal health monitoring, appropriate clinical diagnosis and selection of optimal therapeutic and control measures. Indeed, the universal used for the definition of species are not applicable to many bacterial genera. This is particularly true of species of the genus Rickettsia which are strictly intracellular alpha-proteobacteria that express few phenotypic characteristics. Given the availability of genomic sequences of nearly 100 rickettsial genomes, we wanted to evaluate a range of taxonomic parameters based on genomic sequence analysis, to develop guidelines for the classification of Rickettsia isolates at the genus and species levels. By comparing the degree of similarity of the sequences of 78 genomes from Rickettsia species and 61 genomes from 3 closely related genera using several genomic parameters, we have shown that genome-based taxonomic tools are simple to use and fast, and allow for a reliable and reproducible taxonomic classification of isolates within species of the genus Rickettsia, with specific thresholds. The obtained results enabled us to develop guidelines for classifying rickettsial isolates at the genus and species levels. Using taxono-genomics, we have also been able to describe 17 new human-associated bacterial species on the basis of a combination of genomic analysis and phenotypic properties. The use of genomic tools is therefore perfectly adapted to taxonomic classification and can dramatically change our vision of taxonomy and bacterial evolution in the future

Style APA, Harvard, Vancouver, ISO itp.

18

Rouli, Laetitia. "Etude systématique des génomes bactériens". Thesis, Aix-Marseille, 2014. http://www.theses.fr/2014AIXM5038.

Pełny tekst źródła

Streszczenie:

Débutée en 2005, l'ère du pangénome a connu un important essor ces dernières années, notamment grâce aux progrès des techniques de séquençage haut débit. Le pangénome, qui est divisé en deux grandes parties, le core génome et le génome accessoire, offre un grand éventail d'utilisation. Au cours de ces trois dernières années, nous avons étudié cette gamme de possibilités en nous basant sur des pathogènes humains tel que Coxiella burnetii, Kingella kingae et Bacillus anthracis. Ainsi, outre la découverte d'une nouvelle espèce de Kingella et l'étude de quelques génomes spécifiques, nous nous sommes attardés sur le lien entre pangénome et pathogénicité, sur l'importance des SNPs (Single Nucleotide Polymorphism), ainsi que sur la corrélation entre pangénome et taxonomie et donc, par extension, nous avons étudié la notion d'espèce bactérienne
The pangenome area began in 2005 and had known a huge increase thanks to the improvement of the Next Generation Sequencing methods. The pangenome, which is divided into two parts, the core and the accessory genome, offer a large panel of uses. During the last three years, we have studied all these possibilities. We based our work on human pathogens as Coxiella burnetii, Kingella kingae and Bacillus anthracis. Thus, in addition to the discovery of a new Kingella species and the study of some specific genomes, we studied in details the link between pangenome and pathogenicity, the importance of SNPs (Single Nucleotide Polymorphism) and the correlation between pangenome and taxonomy. Finally, we worked on the bacterial species definition

Style APA, Harvard, Vancouver, ISO itp.

19

Bailly-Bechet, Marc. "Biais de codons et régulation de la traduction chez les bactéries et leurs phages". Phd thesis, Université Paris-Diderot - Paris VII, 2007. http://tel.archives-ouvertes.fr/tel-00200730.

Pełny tekst źródła

Streszczenie:

Cette thèse regroupe des travaux concernant le biais d'usage de codons et son rôle chez les bactéries et leurs phages, en particulier sur les processus de traduction et l'organisation des génomes bactériens. Après une introduction portant sur i) la traduction chez les procaryotes, et ii) les techniques de classification et leurs liens avec la théorie de l'information, un nouvel algorithme de partition d'un ensemble de gènes en fonction de leur usage de codons est présenté. Son application aux génomes d'E. coli et de B. subtilis permet de mettre en évidence plusieurs phénomènes. Le génome de ces organismes se décompose respectivement en 4 et 5 groupes de gènes ayant des usages de codons distincts. Les gènes du même groupe tendent à partager des fonctions similaires, et sont organisés sur le chromosome en domaines cohérents d'une longueur de 10 à 15 gènes. Cette organisation non triviale pourrait permettre une régulation de la vitesse de traduction des gènes en fonction de leur similarité avec leur environnement génétique.
Dans la seconde partie le biais de codons et le contenu en ARN de transfert (ARNt) de bactériophages sont analysés, comparativement à ceux de leurs hôtes. L'étude statistique montre que le contenu en ARNt des phages n'est pas aléatoire, mais biaisé en faveur d'ARNt complémentaires aux codons fréquents dans le génome du phage. Un modèle d'équation maîtresse montre que cette distribution des ARNt au sein des génomes de phages pourrait être le résultat de deux processus : l'acquisition aléatoire par le phage d'ARNt, parmi ceux de l'hôte, et la perte préférentielle des ARNt correspondants à des codons moins utilisés par le phage que par son hôte. Un tel mécanisme permettrait au phage de s'adapter en ne conservant au final que les ARNt présents en quantité insuffisante chez son hôte pendant l'infection. Finalement, on observe plus d'ARNt chez les phages lytiques que chez les tempérés, laissant supposer que les processus de traduction sont soumis à une plus forte pression de sélection chez eux.

Style APA, Harvard, Vancouver, ISO itp.

20

Lagier, Jean-Christophe. "Diversité du microbiote digestif humain par culturomics et pyroséquençage". Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM5023.

Pełny tekst źródła

Streszczenie:

Les relations entre le microbiote intestinal et la santé humaine ont été suggérées par les études métagénomiques. Microbial culturomics utilise de nombreuses conditions de culture avec une méthode d'identification rapide par MALDI-TOF, ou par séquençage de l'ARN 16S pour les colonies non identifiées. L'étude pionnière a permis d'identifier 340 bactéries différentes, dont 31 nouvelles espèces bactériennes et 174 espèces bactériennes décrite pour la première de l'intestin humain. Le séquençage du génome de chaque nouvelle espèce a permis de décrire le plus grand génome d'une bactérie isolée chez l'homme (Microvirga massiliensis, 9,3 Mo) et de générer environ 10 000 gènes précédemment inconnus (ORFans) facilitant les futures études métagénomiques. Le pyroséquençage sur les mêmes échantillons a révélé que seulement 51 espèces étaient détectées par les 2 techniques. Culturomics a démontré sa supériorité par rapport au pyroséquençage lors de l'étude d'une selle d'une patiente traitée pour une tuberculose ultra-résistante. Le pyroséquençage de 2 échantillons de selles de patients traités par antibiotiques a révélé 45 à 80% de séquences assignées au phylum des Verrucomicrobia. L'étude par culture de ces mêmes échantillons n'a pas permis d'isoler cette espèce.Grâce à l'étude de 14 échantillons de selles différents par culturomics, nous avons cultivé 520 espèces bactériennes différentes, dont 57 nouvelles espèces bactériennes et 260 espèces décrites pour la première fois à partir du microbiote digestif. Après cette phase de description, les études suivantes pourront tenter d'établir un lien entre les nouvelles espèces bactériennes et le statut clinique des patients étudiés
Relationships between gut microbiota and human health have been already suggested thanks to metagenomics studies. Microbial culturomics is based on the use of a large number of culture conditions with a rapid identification method by MALDI-TOF or by 16SrRNA amplification and sequencing for the unidentified colonies. The seminal study allowed to identify 340 different bacteria including 31 new bacterial species, 174 bacterial species first described from the human gut. The genome sequencing of each new species allowed to describe the largest genome for a human bacteria (Microvirga massiliensis; 9,3 Mb) and to generate approximately 10,000 previously unknown genes (ORFans) facilitating the future metagenomics studies. In parallel, pyrosequencing performed on the 3 same samples revealed a dramatic low overlapping between the 2 methods with only 51 species detected. In addition, culturomics has demonstrated its superiority than pyrosequencing of a stool from a patient treated for a XDR-tuberculosis. Conversely, the pyrosequencing performed on 2 stool samples of patients treated by antibiotics revealed from 45 to 80% of sequences assigned to Verrucomicrobia although the culturomics study of these same samples did not allowed to culture this species.Currently, thanks to the study of 14 different stool samples by culturomics, we have cultured 520 different bacterial species including 57 new bacterial species and 260 species first described from human gut. After this comprehensive description phase, the following studies will attempt to make a link between new bacterial species and clinical status of the patients studied

Style APA, Harvard, Vancouver, ISO itp.

21

Vignes, Matthieu. "Modèles markoviens graphiques pour la fusion de données individuelles et d'intéractions : application à la classification de gènes". Grenoble 1, 2007. http://www.theses.fr/2007GRE10208.

Pełny tekst źródła

Streszczenie:

Les recherches que nous présentons dans ce mémoire s'inscrivent dans le cadre de l'intégration statistique de données post-génomiques hétérogènes. La classification non supervisée de gènes vise à regrouper en ensembles significatifs les gènes d'un organisme, vu comme un système complexe, conformément aux données expérimentales afin de dégager des actions concertées de ces gènes dans les mécanismes biologiques mis en jeu. Nous basons notre approche sur des modèles probabilistes graphiques. Plus spécifiquement, nous utilisons l'outil de champs de Markov cachés qui permet la prise en compte simultanée de données propres à chacun des gènes grâce a des distributions de probabilités et de données traduisant un réseau d'interaction au sein de l'organisme a l'aide d'un graphe non-orienté entre les gènes. Apres avoir présenté la problématique et le contexte biologique, nous décrivons le modèle utilise ainsi que les stratégies algorithmiques d'estimation des paramètres (Le. Approximations de type champ moyen). Puis nous nous intéresserons à deux particularités des données auxquelles nous avons été confrontés et qui amènent des développements du modèle utilise, notamment la prise en compte de l'absence de certaines observations et la haute dimensionnalité de celles-ci. Enfin nous présenterons des expériences sur données simulées ainsi que sur données réelles sur la levure qui évaluent le gain apporté par notre travail. Notamment nous avons voulu mettre l'accent sur des interprétations plausibles des résultats obtenus
The research work presented in this dissertation is on keeping with the statistical integration of post -genomics data of heterogeneous kinds. Gene clustering aims at gathering the genes of a living organism -modeled as a complex system- in meaningful groups according to experimental data to decipher the roi es of the genes acting within biological mechanisms under study. We based our approach on probabilistic graphical models. More specifically, we used Hidden Markov Random Fields (HMRF) that allow us to simultaneously account for gene-individual features thanks to probability distributions and network data that translate our knowledge on existing interactions between these genes through a non-oriented graph. Once the biological issues tackled are set, we describe the model we used as weil as algorithmic strategies to deal with parameter estimation (namely mean field-like approximations). Then we examine two specificities of the data we were faced to: the missing observation problem and the high dimensionality ofthis data. They lead to refinements ofthe model under consideration. Lastly, we present our experiments both on simulated and real Yeast data to assess the gain in using our method. Ln particular, our goal was to stress biologically plausible interpretations of our results

Style APA, Harvard, Vancouver, ISO itp.

22

Al, Bayssari Charbel. "Etude des mécanismes moléculaires de la résistance aux antibiotiques dans le bassin méditerranéen". Thesis, Aix-Marseille, 2015. http://www.theses.fr/2015AIXM5028.

Pełny tekst źródła

Streszczenie:

La détection, la surveillance et la diffusion de la résistance des bactéries aux antibiotiques est un enjeu majeur au niveau mondial depuis la découverte et la diffusion de bactéries multi résistantes, en particulier la résistance aux carbapénèmes, spécifiquement chez les Entérobactéries et les bactéries du genre Pseudomonas et Acinetobacter. L’émergence et la dissémination des pathogènes Gram- résistants aux carbapénèmes est un contributeur significatif de la morbidité et la mortalité du patient. Malgré les efforts radicaux dans le contrôle de l’infection et les améliorations dans le diagnostique moléculaire, les bacilles Gram- résistants aux carbapénèmes demeurent une formidable menace vue que quelques agents antimicrobiens sont actifs et très peu devraient être disponibles dans le futur proche.L’origine et la source des gènes de résistance dans le monde sont mal connues et des travaux récents suggèrent que les animaux domestiques et sauvages, l’environnement mais également le tube digestif des mammifères et des humains pourraient représenter un réservoir et une source importante de gènes de résistance susceptibles d’être transmissibles à l’homme. C’est dans cette optique que ce projet de thèse s’articule avec comme objectifs : (i) la réalisation d’études épidémiologiques moléculaires d’isolats cliniques et animales résistants aux carbapénèmes isolés dans le basin Méditerranéen et la caractérisation des supports moléculaires de cette résistance ; (ii) la description de nouveaux mécanismes de résistance a l’imipenème ; et enfin (iii) le séquençage de génomes d’isolats cliniques résistants aux carbapénèmes et l’analyse de ces derniers
The detection, monitoring and dissemination of bacterial resistance to antibiotics are a major issue worldwide since the discovery and spread of multi-resistant bacteria, in particular resistance to carbapenems, specifically among Enterobacteriaceae and bacteria of the genus Pseudomonas and Acinetobacter.The emergence and dissemination of carbapenem-resistant Gram-negative pathogens is a significant contributor to patient morbidity and mortality. Despite radical efforts in infection control and improvements in molecular diagnostics, carbapenem-resistant Gram-negative bacilli remain a formidable threat as few antimicrobial agents are reliably active and very little is expected to be available in the near future.The origin and source of resistance genes in the world are not well known and recent works suggest that domestic and wild animals, the environment (soil, water, rivers ..) but also the digestive tract of mammals and humans could represent a reservoir and an important source of resistance genes that may be transmissible to humans.It is in this context that this thesis project articulates with the following objectives: (i) The achievement of molecular epidemiological studies on carbapenem-resistant clinical and animal isolates collected from countries in the Mediterranean basin (Lebanon, Libya, France) and the characterization of the genetic determinants of this resistance; (ii) the description of new resistance mechanisms to imipenem; and finally (iii) The genome sequencing of clinical isolates resistant to carbapenems, the analysis of these genomes and the identification of mechanisms and genetic supports of the resistance to carbapenems and other antibiotics

Style APA, Harvard, Vancouver, ISO itp.

23

Sassi, Mohamed. "La diversité des espèces du groupe Mycobacterium abscessus et leurs mycobactériophages". Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM5041/document.

Pełny tekst źródła

Streszczenie:

Premièrement, nous avons analysé 14 génomes publiés de M. abscessus montrant quece taxon comprend au moins cinq taxons différents spécifiés par des caractéristiques microbiologiques d’intérêt médical. Au cours d'un deuxième travail, nous avons développé une technique d’identification et de génotypage de M. abscessus qui a permis de distinguer sans ambiguïté M. massiliense de M. bolletii et M. abscessus.Nous avons ensuite analysé le bactériophage de M. bolletii que nous avons nommé Araucaria. La résolution de sa structure 3D a montré une capside et un connecteur similaires à ceux de plusieurs bactériophages de bactéries à Gram négatif et positif; et une queue hélicoïdale décorée par des pointes radiales. La partie basale (baseplate) du phage Araucaria présente des caractéristiques observées dans les phages se liant à des récepteurs de protéines. Araucaria se lie à son hôte en deux temps, un premier par liaison de la queue aux saccharides de l'hôte puis un deuxième par liaison de la baseplate aux protéines de la paroi cellulaire.Nous avons analysé la présence de séquence de phages dans 48 génomes disponibles de M. abscessus. Notre analyse phylogénétique suggère que les espèces de M. abscessus ont été infectées par différents mycobactériophages et ont une histoire évolutive différente de celle des hôtes mycobactériens et contiennent aussi des protéines acquises par transfert horizontal.Enfin, nous avons séquencé et analysé deux mycobactéries non-tuberculeuses responsables d’infections opportunistes, Mycobacterium simiae et Mycobacterium septicum
In a first step, we reviewed the published genomes of 14 M. abscessus strains showing that M. abscessus sensu lato comprises of five different taxons specified by particular characteristics of microbiological and medical interests. In a second step, based on sequencing of eight intergenic spaces, we developed a Multispacer Sequence Typing technique (MST) for M. abscessus group sub-species identification and strain genotyping. MST clearly differentiates formerly “M. massiliense” organisms from other M. abscessus subsp. bolletii organisms. We also analyzed a bacteriophage from M. bolletii that we named Araucaria. We resolved Araucaria 3D structure, its capsid and connector share close similarity with several phages from Gram- or Gram+ bacteria. The helical tail decorated by radial spikes, possibly host adhesion devices. Its host adsorption device, at the tail tip, assembles features observed in phages binding to protein receptors. All together, these results suggest that Araucaria may infect its mycobacterial host using a mechanism involving adhesion to cell wall saccharides and protein, a feature that remains to be further explored. We also analysed 48 M. abscessus sequenced genomes for encoding prophages. Our phylogenetic analyses suggested that M. abscessus species were infected by different mycobacteriophages and have a different evolutionary history than the bacterial hosts and some proteins that are acquired by horizontal gene transfer mostly mycobacteriophages’ proteins and hypothetical proteins. Finally, we sequenced and analyzed two non-tuberculosis mycobacterium causing human infections, Mycobacterium simiaie and Mycobacterium septicum

Style APA, Harvard, Vancouver, ISO itp.

24

Bigot, Diane. "Biodiversité et évolution des virus présents dans les métagénomes animaux". Thesis, Tours, 2017. http://www.theses.fr/2017TOUR4019.

Pełny tekst źródła

Streszczenie:

Les virus font partie des entités les plus abondantes sur Terre, mais la diversité des virus est très peu connue puisque biaisée en faveur d’hôtes animaux d’intérêts sociétal, agronomique et économique. L’apport des nouvelles techniques de séquençage permet actuellement d’obtenir des informations qui étaient tout simplement inaccessibles. Le but de mon travail de thèse a été l’étude de la diversité virale présente au sein d’un grand nombre d’animaux non-modèles. Pour répondre à cette problématique il m’a fallu mettre en place une méthodologie analytique innovante de découverte de nouveaux virus par une approche de méta-transcriptomique. Ce travail i) montre que la méthodologie bioinformatique mise en place est pertinente, ii) permet de découvrir de nouveaux virus ayant des caractéristiques génomiques particulières relevant de nouveaux genres ou familles de virus, iii) révèle de nouveaux hôtes pour des virus appartenant à des familles virales très étudiées et iv) montre que la gamme d’hôte de virus connus peut être plus étendue qu’attendu grâce à un focus sur la diversité des virus d’hyménoptères. D’une manière plus globale, mon travail permet de combler quelques lacunes existantes dans les connaissances liées à l’étude de la diversité virale et met en évidence l’importance de l’étude des animaux non-modèles
Viruses are among the most abundant entities on Earth, but the viral diversity remains mostly unknown as currently biased in favour of animals of social, agronomic and economic interest. Next Generation Sequencing technologies provide access to so far inaccessible information. The aim of my PhD thesis was the study of the viral diversity within a large range of non-model animals. To address this question I set up an innovative analytical framework to discover new viruses based on a meta-transcriptomic approach. This work i) shows that this bioinformatics method is efficient and powerful, ii) allows the discovery of new viruses with particular genomic organisations suggesting they belong to new virus genera of families, iii) uncovered new viruses from new hosts in well-known viral families and iv) shows wider viral host range than previously expected based on a particular focus on hymenopteran viral diversity. Overall, my work allows to fill some gaps in the knowledge of viral diversity and shows the importance of studying non-model animal species in virology

Style APA, Harvard, Vancouver, ISO itp.

25

Lalonde, Christian. "Amélioration des services de génomiques et de surveillance du virus du syndrome reproducteur et respiratoire porcin". Thesis, 2020. http://hdl.handle.net/1866/24260.

Pełny tekst źródła

Streszczenie:

Le virus du syndrome reproducteur et respiratoire porcin (VSRRP) est un pathogène important, entrainant des pertes économiques de 130 millions de dollars annuellement au Canada. La surveillance est effectuée par séquençage Sanger du gène ORF5 mais nous croyons que le séquençage du génome entier (SGE) du VSRRP permettrait une meilleure surveillance épidémiologique comparé au séquençage du gène ORF5. Pour développer une méthode efficace de SGE du VSRRP, 149 échantillons (sérums, poumons, tissus, autres) d’animaux malades ou récoltés pour fin de surveillance ont été analysés. L'ARN viral a été concentré par enrichissement d'ARN à queue poly (A) et le séquençage effectué sur une plateforme Illumina. Le SGE a été efficace dans 67,11% des échantillons, réussissant dans certains échantillons de poumons et de sérums possédant une valeur de quantification (Cq) du virus par RTqPCR jusqu’à 26,50 et 34.13, respectivement. La méthodologie développée de SGE du VSRRP a été 4650 fois plus sensible que les méthodes décrites précédemment. Pour quantifier l’impact du SGE, 88 échantillons (dont le SGE a réussi) ont été utilisés pour comparer le SGE au séquençageORF5. Deux génomes de VSRRP différents ont été trouvés dans quatre échantillons différents (taux de coinfection de 4,55%). Six génomes de VSRRP (6,52% des souches) ont été classés différemment par rapport à la classification ORF5. Ainsi, le SGE du VSRRP a permis une meilleure caractérisation de 9,10% des échantillons VSRRP positifs comparé au séquençage ORF5. Donc, le SGE du VSRRP est à la fois sensible et plus précis que la classification par l’ORF5.
Porcine reproductive and respiratory syndrome virus (PRRSV) is an important pathogen, costing over 130 million dollars annually in Canada. Surveillance is done by Sanger sequencing of the ORF5 gene, but we hypothesized that whole genome sequencing (WGS) of PRRSV genome will allow a better epidemiological monitoring of PRRSV compared to ORF5 gene sequencing. To develop an efficient method of PRRSV WGS, 149 PRRSV samples (sera, lungs, pool of tissues and others) collected for surveillance or from sick animals were tested. Viral RNA was concentrated using a poly(A) tailed RNA enrichment method, and sequencing was done on an Illumina platform. WGS was successful in 67.11% of cases. WGS was successful in some tissues and lungs samples with RT-qPCR cycle quantification (Cq) values up to 26.50, and in some sera with Cq value up to 34.13. The developed WGS methodology was 4650 times more sensitive for PRRSV WGS than previously described methods. To quantify the impact of WGS, 88 successful samples for the WGS of PRRSV were used to compare efficiency of WGS and ORF5 sequencing. Two different full-length genomes of PRRSV were found in four of those samples (coinfection rate of 4.55%). Six full-length PRRSV genomes (6.52% of PRRSV strains) were found to cluster differently compared to ORF5 sequencing. WGS of PRRSV also enabled a better classification or characterisation of 9.10% of the PRRSV infected samples compared to ORF5 sequencing. Thus, WGS can be both sensitive and more accurate then ORF5 classification for the characterisation of PRRSV strains.

Style APA, Harvard, Vancouver, ISO itp.

26

Vignes, Matthieu. "Modèles markoviens graphiques pour la fusion de données individuelles et d'interactions : application à la classification de gènes". Phd thesis, 2007. http://tel.archives-ouvertes.fr/tel-00178348.

Pełny tekst źródła

Streszczenie:

Les recherches que nous présentons dans ce mémoire s'inscrivent dans le cadre de l'intégration statistique de données post-génomiques hétérogènes. La classification non supervisée de gènes vise à regrouper en ensembles significatifs les gènes d'un organisme, vu comme un système complexe, conformément aux données expérimentales afin de dégager des actions concertées de ces gènes dans les mécanismes biologiques mis en jeu.

Nous basons notre approche sur des modèles probabilistes graphiques. Plus spécifiquement, nous utilisons l'outil de champs de Markov cachés qui permet la prise en compte simultanée de données propres à chacun des gènes grâce a des distributions de probabilités et de données traduisant un réseau d'interaction au sein de l'organisme à l'aide d'un graphe non-orienté entre les gènes.

Apres avoir présenté la problématique et le contexte biologique, nous décrivons le modèle utilisé ainsi que les stratégies algorithmiques d'estimation des paramètres (i.e. approximations de type champ moyen). Puis nous nous intéresserons à deux particularités des données auxquelles nous avons été confrontés et qui amènent des développements du modèle utilisé, notamment la prise en compte de l'absence de certaines observations et la haute dimensionnalité de celles-ci. Enfin nous présenterons des expériences sur données simulées ainsi que sur données réelles sur la levure qui évaluent le gain apporté par notre travail. Notamment, nous avons voulu mettre l'accent sur des interprétations biologiques plausibles des résultats obtenus.

Style APA, Harvard, Vancouver, ISO itp.

Rozprawy doktorskie na temat „Classification génomique”

Utwórz poprawne odniesienie w stylach APA, MLA, Chicago, Harvard i wielu innych