Academic literature on the topic 'Séquençage de l’ARN'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Séquençage de l’ARN.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Séquençage de l’ARN":

1

Mathieu, Maxime, Amandine Girousse, and Coralie Sengenès. "Et si l’origine des progéniteurs fibro-adipeux contribuait à leur hétérogénéité dans le muscle ?" médecine/sciences 39 (November 2023): 15–21. http://dx.doi.org/10.1051/medsci/2023129.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les progéniteurs fibro-adipogéniques (FAPs), cellules stromales mésenchymateuses (CSMs) résidentes du muscle squelettique, jouent un rôle crucial dans l’homéostasie et la régénération musculaire via leur activité paracrine. Les avancées technologiques récentes dans le domaine du séquençage de l’ARN en cellule unique ont permis la description de l’hétérogénéité de cette population cellulaire. Dans cet article, nous présenterons les différentes sous-populations de FAPs en condition basale, lésionnelle ou de dégénérescence, ainsi que leurs fonctions associées chez la souris et l’homme. Nous discuterons ensuite de l’origine extra-musculaire possible d’une population de FAPs post-lésionnelle. En effet, nos travaux récents démontrent que des CSMs provenant du tissu adipeux et infiltrées dans le muscle pourraient participer à l’hétérogénéité des FAPs.
2

Montel, Fabien. "Séquençage de l’ADN par nanopores." médecine/sciences 34, no. 2 (February 2018): 161–65. http://dx.doi.org/10.1051/medsci/20183402014.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Après des années de développement, l’utilisation du nanopore comme sonde pour séquencer les molécules d’ADN est maintenant une possibilité viable et prometteuse. La détection d’une seule paire de bases lors du transport de l’ADN permet d’enregistrer de très longs fragments de polynucléotides, avec une parallélisation et des vitesses élevées. Dans cette revue, les méthodologies actuelles fondées sur la détection électrique et les nanopores biologiques seront présentées de même que les nouvelles méthodes utilisant des nanopores à l’état solide, ou la détection optique.
3

M., J. M. "Un réseau français de séquençage de l’ADN." Revue Francophone des Laboratoires 2016, no. 486 (November 2016): 15. http://dx.doi.org/10.1016/s1773-035x(16)30311-2.

Full text
APA, Harvard, Vancouver, ISO, and other styles
4

Dekeuwer, Catherine. "Séquençage de l’ADN à haut débit et relation de soin." Cahiers Droit, Sciences & Technologies, no. 8 (March 13, 2019): 41–52. http://dx.doi.org/10.4000/cdst.688.

Full text
APA, Harvard, Vancouver, ISO, and other styles
5

Bailleul, Quentin, Andria Rakotomalala, Isabelle Ferry, Pierre Leblond, Samuel Meignan, and Alessandro Furlan. "L’art de la guerre appliqué aux DIPG." médecine/sciences 37, no. 2 (February 2021): 159–66. http://dx.doi.org/10.1051/medsci/2020279.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les tumeurs cérébrales pédiatriques représentent la principale cause de mortalité par cancer chez l’enfant. Alors que l’exérèse complète a une valeur pronostique dans certains gliomes de haut grade, les DIPG (diffuse intrinsic pontine gliomas) ne peuvent en bénéficier du fait d’une localisation critique au niveau du tronc cérébral et de leur caractère infiltrant. La radiothérapie demeure le traitement de référence contre ces tumeurs depuis bientôt cinquante ans, et les tentatives pour améliorer le pronostic vital des patients à l’aide de chimiothérapies ou de thérapies ciblées se sont révélées infructueuses. La connaissance des altérations moléculaires dans ces gliomes a fortement progressé cette dernière décennie, grâce aux progrès du séquençage à haut débit. Cela a permis de révéler des entités distinctes au niveau moléculaire et de préciser des diagnostics discriminants. Dans cette revue, nous faisons le point sur ces nouvelles connaissances et les perspectives qu’elles apportent en termes de stratégies cliniques.
6

Lamoril, J., N. Ameziane, J. C. Deybach, P. Bouizegarène, and M. Bogard. "Les techniques de séquençage de l’ADN : une révolution en marche. Première partie." Immuno-analyse & Biologie Spécialisée 23, no. 5 (October 2008): 260–79. http://dx.doi.org/10.1016/j.immbio.2008.07.016.

Full text
APA, Harvard, Vancouver, ISO, and other styles
7

Henry, Jean-Pierre. "Génétique et origine d’Homo sapiens." médecine/sciences 35, no. 1 (January 2019): 39–45. http://dx.doi.org/10.1051/medsci/2018311.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La comparaison de l’ADN d’Homo sapiens avec celui des grands singes ou des hommes archaïques informe sur les mécanismes de l’hominisation. Le séquençage de 1 000 génomes bien identifiés géographiquement a permis des études génomiques. En utilisant la diversité régionale des génotypes, un modèle de généalogie d’Homo sapiens a été proposé. L’origine de l’homme moderne est africaine et date d’environ 200 000 ans ; Il est sorti d’Afrique il y a 50 000 à 100 000 ans et a alors envahi le reste du monde. En Europe et en Asie, il a rencontré les hommes archaïques (Néanderthal et Denisova) et la présence de 1 à 3 % d’ADN néanderthalien dans le génome de l’homme moderne atteste de croisements entre les espèces. Certains gènes provenant de ces croisements ont été sélectionnés.
8

Oden, Élise. "La génomique équine : tour d’horizon des outils disponibles pour les applications actuelles et à venir." Le Nouveau Praticien Vétérinaire équine 17, no. 59 (2023): 48–53. http://dx.doi.org/10.1051/npvequi/2024005.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Depuis quelques décennies, de nombreux outils technologiques initialement destinés à l’étude de la génomique humaine ont été rapidement déployés chez les animaux d’élevage, dont les chevaux. Tout d’abord, le génotypage permet l’analyse des variations génétiques dans l’ADN génomique d’un organisme : par exemple, les marqueurs microsatellites, séquences répétées présentes partout dans les génomes eucaryotes ou bien les SNP (Single Nucleotide Polymorphism) qui correspondent à des variations d’une seule base nucléotidique. En laboratoire, le génotypage est actuellement utilisé pour la réalisation des contrôles de filiation ou pour la recherche d’un caractère d’intérêt et des maladies monogéniques équines. La technologie de séquençage permet, quant à elle, de déterminer la séquence nucléotidique d’un fragment d’ADN ou d’un génome entier : ainsi, Twilight, premier cheval dont le génome a été entièrement séquencé en 2009. D’autres alternatives au séquençage permettent de mesurer l’expression des gènes dans un tissu donné par une approche de transcriptomique (ou RNAseq), de comprendre la régulation de cette expression génique par des études épigénétiques ou bien de connaître le microbiote d’un échantillon par analyse métagénomique. L’ensemble de ces développements génomiques offre de belles perspectives pour le diagnostic équin de demain grâce à une meilleure connaissance des maladies multifactorielles et la mise en place d’une médecine personnalisée. Ces outils apporteront également des éléments nouveaux aux professionnels de la filière en termes d’élevage ou de sélection ainsi qu’une amélioration de la prédiction des aptitudes au sport des chevaux athlètes.
9

Vasselon, V., F. Rimet, I. Domaizon, O. Monnier, Y. Reyjol, and A. Bouchez. "Évaluer la pollution des milieux aquatiques avec l’ADN des diatomées : où en sommes-nous ?" Techniques Sciences Méthodes, no. 5 (May 2019): 53–70. http://dx.doi.org/10.1051/tsm/201905053.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
L’évaluation de l’état écologique des cours d’eau repose sur le calcul d’indices de qualité basés sur la sensibilité de certains groupes biologiques, dont les diatomées, à la pollution. La détermination et la quantification des espèces de diatomées reposent généralement sur des méthodes d’identification morphologique en microscopie qui peuvent paraître complexes, chronophages et relativement onéreuses. Au cours de la dernière décennie, une nouvelle méthode de biologie moléculaire basée sur l’ADN a été développée, permettant d’identifier les espèces sur la base de critères génétiques plutôt que sur des critères morphologiques : le métabarcoding. En combinaison avec les technologies de séquençage à haut débit, le métabarcoding permet d’identifier l’ensemble des espèces présentes au sein d’un échantillon environnemental et de traiter plusieurs centaines d’échantillons en parallèle. Cet article présente les résultats de deux études récentes menées sur les cours d’eau de Mayotte (2013-2018) et de France métropolitaine (2016-2018), visant à tester le potentiel d’application du métabarcoding pour la bio-indication au sens de la directive cadre sur l’eau (DCE). Nous abordons les différents développements méthodologiques et optimisations qui ont été réalisés pour fiabiliser les inventaires taxonomiques de diatomées produits en métabarcoding, notamment en matière de quantification des espèces basée sur l’abondance relative des séquences ADN. Nous présentons ensuite les résultats d’application de l’approche moléculaire pour l’évaluation de l’état écologique de plus de 500 sites de cours d’eau nationaux, en les confrontant avec les résultats obtenus via l’approche classique en morphologie. Finalement, nous discutons du potentiel d’application en routine du métabarcoding à l’échelle des réseaux de surveillance des cours d’eau, de ses limites d’application et proposons certaines recommandations pour une future implémentation complémentaire à l’approche morphologique actuellement prescrite dans les arrêtés réglementaires.
10

Mattei, Jean-François. "Avis no 124 du CCNE sur l’évolution des tests génétiques liée au séquençage de l’ADN humain à très haut débit." Bulletin de l'Académie Nationale de Médecine 200, no. 6 (June 2016): 1263–68. http://dx.doi.org/10.1016/s0001-4079(19)30646-6.

Full text
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Séquençage de l’ARN":

1

Polit, Lélia. "Régulation de l’expression génique par le facteur de transcription SPI1/PU.1 dans l’érythroleucémie : mécanismes de répression des gènes par sa liaison à l’ADN, conséquences de sa liaison à l’ARN." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPASL064.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
SPI1/PU.1 est un facteur de transcription de la famille ETS, cette famille est caractérisée par un domaine de fixation à l’ADN très conservé (domaine ETS) et un noyau de fixation commun : la séquence 5’-GGAA/T-3’. C’est un régulateur clé de l’hématopoïèse dont la régulation de l’expression et la fonction dépendent du lignage. La dérégulation de l’expression de spi1 ou de son activité contribue à des hémopathies, il peut se comporter comme un oncogène ou comme un suppresseur de tumeur selon les lignages. Dans différentes pathologies, la macroglobulémie de Waldenström, la leucémie aïgue lymphoblastique à cellules T pédiatrique et dans l’érythroleucémie, SPI1 se comporte comme un oncogène. Les leucémies aïgues érythroïdes sont des leucémies rares mais à haut risque et dont les bases génétiques sont mal connues. Dans le lignage érythroïde, une expression anormale et non-contrôlée de SPI1 entraîne une leucémie aiguë, en partie en inhibant la différenciation érythroïde et l'apoptose des progéniteurs engagés dans la différenciation érythroïde. SPI1 est un facteur de transcription dont les fonctions les plus connues et les mieux établies concernent l’activation de l’expression génique. C’est un facteur de transcription pionnier qui est capable de se fixer sur de la chromatine non-accessible afin de recruter des facteurs épigénétiques, des (co-)facteurs ou des facteurs de transcription spécifiques de lignage. Il a également une fonction dans l’épissage de l’ARN. En revanche, les fonctions répressives de SPI1 sont très peu connues, en effet on ne sait pas si ces fonctions sont liées à sa capacité à lier l’ADN et/ou l’ARN. Mon travail de thèse concerne la caractérisation des mécanismes par lesquels SPI1 réprime l’expression génique dans un modèle d’érythroleucémie murine. J’ai étudié son implication dans les modifications épigénétiques ainsi que les conséquences de sa fixation à l’ARN. En utilisant des cellules pré-leucémiques issues de souris transgéniques pour spi1, dans lesquelles l’expression de spi1 peut être contrôlée (sur-exprimée ou réprimée), j’ai comparé des données de séquençage à haut débit pour caractériser l’accessibilité de la chromatine, les modifications épigénétiques des protéines histones et l’expression des gènes en fonction de la présence ou de l’absence de SPI1. Pour comparer les signaux de ChIP-seq entre différentes conditions, nous avons développé un package R : ChIP-seq Intersample Normalization (CHIPIN) dont l’algorithme est basé sur l’hypothèse biologique selon laquelle les gènes dont l’expression est constante entre les conditions, ont, en moyenne, des intensités de ChIP-seq similaires. Nous avons ainsi démontré que la répression des gènes par SPI1, dont certains sont liés à la différenciation érythroïde et à l’apoptose, est basée sur la coordination de deux mécanismes qui impliquent et sont contrôlés par l’histone dé-acétylase 1 (HDAC1) et le complexe répressif Polycomb (PRC2). J’ai également caractérisé la fixation de SPI1 à l’ARN en utilisant des données de CLIP-seq et démontré que cette fixation à l’ARN n’était pas liée à la régulation de l’expression génique. Ainsi, le rôle exact de la fixation de SPI1 à l’ARN n’est pas encore totalement expliqué, même si nous avons pu montrer que SPI1 se fixait majoritairement dans des régions introniques. Mes travaux de thèse ont donc permis de mettre en évidence de nouveaux mécanismes, jusqu’ici inconnus, pour la répression de l’expression génique par SPI1 dans l’érythroleucémie en coopération avec deux facteurs épigénétiques : PRC2 et HDAC1. De plus, une partie de mon travail de thèse a été dédié au développement d’un nouveau package R pour la normalisation de signaux de ChIP-seq entre différentes conditions ou échantillons. Cette méthode peut également être appliquée à des données d’ATAC-seq, elle est facile d’utilisation et peut ainsi être mise en oeuvre par les bioinformaticiens mais aussi par les biologistes
SPI1/PU.1 is a transcription factor belonging to the ETS family characterized by a highly conserved DNA binding domain (ETS domain) and a common core binding the 5’-GGAA/T-3’ DNA sequence. SPI1 is a key regulator of haematopoiesis, the regulation of SPI1 expression and function depends on lineage. Deregulation of Spi1 expression or activity contributes to hemopathies; SPI1 behaves as an oncogene or a tumor suppressor according to the hematopoietic lineage. SPI1 has been shown to be oncogenic in Waldenström’s macroglobulinemia, pediatric T cell acute lymphoblastic leukemia and erythroleukemia. Acute erythroid leukemia is a rare but high-risk leukaemia of poorly understood genetic basis. In the murine erythroid lineage, SPI1 abnormal unrestrained expression leads to acute leukemia, in part by inhibiting erythroid differentiation and apoptosis of erythroid progenitors.SPI1 is a transcription factor that also affects splicing processes. The ways SPI1 activates gene expression are now mostly established. As a pioneering transcription factor, SPI1 is able to bind closed chromatin and then to recruit many epigenetic and/or lineage specific co- or transcriptional factors. In contrast, Spi1 repressive functions on gene expression remain poorly understood. Whether it acts through its ability to bind DNA and/or RNA is not known. My PhD thesis is dedicated to the characterization of the mechanisms by which SPI1 represses gene expression. In particular, I studied how SPI1 represses gene expression in a model of murine erythroleukemia by investigating the role of SPI1 on epigenetic modifications. I also investigated the consequences of SPI1 binding to RNA. Using pre-leukemic cells issued from Spi1 transgenic mice, cells in which spi1 expression can be controlled (overexpressed or down-regulated), I performed an integrated analysis of several high throughput sequencing data sets to characterize epigenetic histone modifications, chromatin accessibility and gene expression. In order to compare histone modification signals from different conditions, we developed an R package, named ChIP-seq Inter-sample Normalization (CHIPIN). The algorithm of CHIPIN is based on the biological assumption that genes with constant expression across conditions have, on average, similar “true” ChIP-seq binding intensities. Using bioinformatic analysis combined with biological experiments, we demonstrate that SPI1 gene repression activity was based on the coordination of two mechanisms that involved and are controlled by histone deacetylase 1 (HDAC1) and polycomb repressive complex 2 (PRC2). Repressed genes include genes coding for apoptosis and erythroid differentiation. Finally, I studied the landscape of SPI1 binding on RNA using CLIP-seq data and showed that SPI1 binding on RNA was not related to gene expression regulation. Thus, the role of SPI1 when it binds RNA is not fully explain, even if we showed that SPI1 binds mainly in intronic regions on RNA. To sum up, my work highlighted new mechanisms for gene repression regulation by SPI1 in erythroleukemia in cooperation with two epigenetics factors: PRC2 and HDAC1. This work provides new insights in the role of the major hematopoietic regulator SPI1 for gene repression mechanisms. In addition, part of my work was dedicated to develop an R package called CHIPIN allowing for normalization of ChIP-seq signals from several conditions or samples. This method can be also used for ATAC-seq data. The R package is user friendly and can therefore be used by both bioinformaticians and biologists
2

Mailler, Élodie. "Structural rearrangements of the HIV-1 genomic RNA during maturation of the viral particle." Thesis, Strasbourg, 2017. http://www.theses.fr/2017STRAJ055.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le VIH-1 bourgeonne sous forme immature et doit subir l’étape de maturation afin d’acquérir son caractère infectieux. La maturation protéolytique du précurseur Pr55Gag induit le réarrangement morphologique de la particule alors que le dimère d’ARNg acquiert une compaction optimale. Ces réarrangements conformationnels restent encore inconnus et sont facilités par l’activité chaperonne de la protéine NCp7. Notre but a été de déterminer les différentes étapes menant à l’obtention d’un dimère d’ARNg mature. Nous avons donc étudié la structure des 550 premiers nucléotides du génome par cartographie chimique, à la fois 1. in vitro en présence des protéines Pr55Gag, GagΔp6, intermédiaires contenant le domaine NC et NCp7 et 2. in viro par l’approche hSHAPE-Seq que nous avons développé. Les particules matures et bloquées aux différentes étapes de maturation de Pr55Gag ont été analysées ainsi que des particules matures et totalement immatures traitées avec l’éjecteur de zinc AT-2. Ce traitement permet d’identifier les sites de protection de Pr55Gag et NCp7 ainsi que leur activité déstabilisatrice
The HIV-1 particle buds from the infected cell as an immature particle and has to undergo a maturation process to become infectious. Proteolytic processing of Pr55Gag triggers morphological rearrangements of the particle whereas the gRNA dimer becomes more stable. Genomic rearrangements remain poorly understood and are facilitated by the RNA chaperone activity of the NCp7 protein. Our goal was to determining the different steps leading to the formation of the mature dimeric gRNA. To this end, the structure of the first 550 nucleotides of the HIV-1 genome was assessed by chemical probing 1. in vitro with Pr55Gag, GagΔp6, NC-containing intermediates and NCp7 proteins and 2. in viro with the hSHAPE-Seq approach we developed. Wild type and mutant viruses mimicking the sequential processing of Pr55Gag were analysed, as well as immature PR- and mature particles treated with the AT-2 zinc ejector, in order to identify the Pr55Gag and NCp7 binding sites and their gRNA destabilising activity
3

Pradat, Yoann. "Analyses of genomic and transcriptomic profiles of metastatic tumors from precision medicine clinical trials." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASL010.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
À l’ère de l’analyse des données, les connaissances sur l’apparition et la progression du cancer se sont approfondies grâce à l’analyse moléculaire de nombreuses tumeurs dans le monde. Le séquençage de nouvelle génération, apparu dans les années 2000, a transformé la recherche sur les cellules cancéreuses en permettant le profilage complet de l’exome, du transcriptome et même du génome entier. Bien que le séquençage à haut débit ne soit pas systématique dans la pratique clinique, il est couramment utilisé dans les essais thérapeutiques. Le vaste réservoir de données ainsi généré alimente de nombreuses recherches qui contribuent aux progrès de l’oncologie de précision. Cette thèse explore l’analyse de cohortes de patients atteints de cancer et les outils modernes d’oncologie. Le premier chapitre couvre les principes essentiels de la biologie du cancer, en mettant l'accent sur le rôle évolutif du profilage moléculaire dans le traitement et la recherche. Le deuxième chapitre passe en revue les outils informatiques et les bases de données employés pour l’analyse des données de séquençage. Ces chapitres donnent les clés pour le troisième chapitre, axé sur la cohorte META- PRISM, comprenant 1 031 patients issus d’essais de médecine de précision à Gustave Roussy. Il met en évidence les spécificités génétiques des patients réfractaires et les possibilités de modélisation prédictive sur les données du séquençage haut débit. Le quatrième chapitre examine les marqueurs de résistance aux traitements connus et émergents dans la cohorte META-PRISM et dans deux études cliniques récentes, révélant des altérations de cibles et des activations de voies alternatives comme facteurs de résistance clés
In the era of extensive data analysis, insights into cancer onset and progression have deepened through molecular analysis of numerous tumors globally. Next-generation sequencing, emerging in the 2000s, transformed cancer cell investigation by enabling exome, transcriptome, and now whole genome profiling. While high-throughput sequencing has not yet entered clinical pratice for all, it is commonly used in trials. The vast data pool thus generated fuels many research areas which contribute to precision oncology advancements. This thesis explores cancer patient cohort analysis and modern oncology tools. The first chapter covers cancer biology fundamentals, emphasizing molecular profiling's evolving role in treatment and research. The second chapter reviews computing tools and databases for sequencing data analysis. These chapters set the stage for the third chapter, focusing on the META-PRISM cohort, comprising 1,031 patients from precision medicine trials at Gustave Roussy. It highlights the molecular specificities of refractory and the promises of predictive modeling based on high-throughput sequencing data. The fourth chapter delves into known and emerging treatment resistance markers in the META-PRISM cohort and two recent clinical studies, revealing target alterations and alternative pathway activations as key resistance factors
4

Sengenès, Jennifer. "Développement de méthodes de séquençage de seconde génération pour l’analyse des profils de méthylation de l’ADN." Paris 6, 2012. http://www.theses.fr/2012PA066123.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
L’analyse des profils de méthylation présente un grand intérêt car des altérations du méthylome sont impliquées dans de nombreuses pathologies. Le MeDIP (Methylated DNA ImmunoPrecipitation) immunoprécipite les séquences méthylées sur le génome entier, la plupart étant localisées dans les séquences répétées. De telles séquences sont difficiles à aligner après séquençage (MeDIP-Seq) et bon nombre d’entre elles ne peuvent donc être utilisées pour la suite des analyses. Nous présentons une méthode innovante appelée MeDIP-dep-Seq permettant de supprimer une quantité significative de plusieurs familles de ces éléments répétés (diminution d’un facteur de 300 au maximum) tandis que les séquences uniques d’intérêt ne sont pas affectées. Après séquençage sur un séquenceur de seconde génération (GAIIx, Illumina), le taux d’alignement est amélioré de façon conséquente permettant ainsi d’augmenter la quantité de séquences analysables. Nous avons également développé une plateforme d’analyse des données issues du MeDIP-Seq. Des régions candidates identifiées par cette technique sur le génome entier peuvent ensuite être validées en utilisant des sélectors, sondes permettant la capture de régions génomiques d’intérêt. Nous avons introduit un traitement au bisulphite dans le protocole de sélection afin de développer un nouvel outil pour une analyse multiplexe. 98 loci ont été enrichis dans 6 échantillons puis séquencés en parallèle sur un séquenceur de paillasse (GS Junior, Roche). La combinaison de ces technologies permettra d’établir des cartes du méthylome et d’identifier des nouveaux biomarqueurs épigénétiques pour diagnostiquer et pronostiquer les cancers et maladies complexes
The analysis of DNA methylation patterns has become of great interest as methylome alterations have been found in many diseases. MeDIP (Methylated DNA ImmunoPrecipitation) immunoprecipitates genome-wide methylated sequences many of which are located in the repetitive sequences. Such sequences are difficult to align unambiguously after sequencing (MeDIP-Seq) leading to a large number of sequences that are currently not used for further analysis. We present an innovative method called MeDIP-dep-Seq which depletes a significant part of several classes of these highly repetitive sequences (up to 300-fold decrease), while unique sequences of interest are not affected. After sequencing on a second generation sequencer (GAIIx, Illumina) the alignment rate substantially enhanced increasing thus the amount of usable sequences. We have further developed a pipeline for the analysi of MeDIP-Seq datasets. Potential candidate regions identified in this genome-wide assay can then be validated by the use of selector probes that specifically capture genomic regions of interest. We introduced a bisulfite treatment in the selection protocol and developed a novel multiplex assay. 98 gene loci were enriched in 6 samples and were then sequenced in parallel on a bench sequencer (GS Junior, Roche). The combination of these technologies will permit the establishment of methylome maps and the identification of novel epigenetic biomarkers for cancer and complex diseases diagnostics and prognosis
5

Gorgé, Olivier. "Diagénèse de l’ADN bactérien et analyses métagénomiques de pathologies bactériennes du passé." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLS572/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette étude a pour objet la mise en évidence de traces d'ADN bactérien pathogène dans des échantillons animaux et humains anciens, et ainsi améliorer les connaissances sur l'évolution des maladies au cours du temps. En parallèle, nous avons étudié les phénomènes de dégradation de l'ADN dans le sol sur des cadavres de souris enterrées après avoir été contaminées par des bactéries non pathogènes. Cette étude des processus taphonomiques s'est étalée sur trois ans et a permis de montrer une disparition rapide des bactéries simulantes, remplacé par l'ADN des bactéries du sol, qui colonisent rapidement la dépouille et dégradent tant l'ADN endogène (murin) qu'exogène (bactérien). Cette disparition rapide explique la grande difficulté à mettre en évidence des pathogènes dans des échantillons anciens, à de rares exceptions près. Notre étude n'a pas permis de détecter d'agents pathogènes particuliers dans les échantillons que nous avons étudié, mais nous avons mis en évidence l'intérêt d'analyser certains types de restes pour accéder à une information génétique préservée. Le tartre dentaire indique est un bon indicateur de la flore buccale de l'hôte et les kystes calcifiés assurent une bonne préservation de l'ADN endogène, moins soumis à contamination et digestion par les bactéries de l'environnement. Les kystes présentent en règle générale une teneur en ADN endogène supérieure à tous les autres tissus étudiés
The aim of this study was the identification of pathogenic bacterial DNA traces in ancient animal and human samples, and thus improve knowledge of past diseases that affect humankind over time. In parallel, we studied the DNA degradation phenomena in the soil on the buried corpses of mice after being contaminated by non-pathogenic bacteria. This study of taphonomic processes was spread over three years and has shown a rapid disappearance of simulant bacteria, replaced with the DNA of soil bacteria that colonize the body quickly after burial and degrade both the endogenous DNA (murine) that exogenous (bacteria). This quick degradation can explain the high difficulty to detect and identify bacterial pathogens in old samples, with very few exceptions. Despite the fact in our study we were not able to detect specific pathogens in the samples we have studied, we have shown the interest to analyze certain types of remnants to access preserved and informative genetic data. Dental calculus is a good indicator of the oral flora of the host and calcified cysts ensure good preservation of the endogenous DNA, less subject to contamination and digestion by bacteria from the environment. Cysts generally have an endogenous DNA content higher than all other tissues examined
6

Kaltenbach, Sophie. "Rôle des facteurs de la réparation de l’ADN dans la dynamique du génome au sein du système immunitaire." Thesis, Sorbonne Paris Cité, 2015. http://www.theses.fr/2015PA05T038/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le système immunitaire est particulièrement dépendant des mécanismes de réparation de l’ADN, en effet le développement du système immunitaire adaptatif nécessite certains mécanismes de réparation de l’ADN, lors de la recombinaison V(D)J et lors de la commutation de classe des immunoglobulines. De plus, le système hématopoïétique est par sa nature très sensible aux lésions spontanées de l’ADN. Il existe chez l’homme de nombreux déficits immunitaires directement liés à un défaut de réparation de l’ADN. L’identification du gène responsable est importante pour un conseil génétique familial approprié et pour la prise en charge médicale. Nous avons accès aujourd’hui à de puissants outils de dépistage génétique grâce au séquençage à haut débit et la liste des gènes responsables d’un déficit immunitaire s’allonge de plus en plus en rapidement. La première partie de ce travail porte sur la mise au point d’un nouvel outil de dépistage rapide des déficits de la réparation de l’ADN, en particulier dans le cas de déficit immunitaires. Ce test est fondé sur l’observation d’un biais du répertoire du TCRdes lymphocytes T circulants lorsque les thymocytes ont une durée de vie diminuée, or un défaut de réparation de l’ADN entraîne une diminution de la survie thymocytaire. Nous avons mis au point deux techniques, par biologie moléculaire et par cytométrie en flux, pour détecter un éventuel biais du répertoire du TCRα et évaluer la pertinence de ce test dans les déficits immunitaires liés à un défaut de réparation de l’ADN. Un biais a notamment été détecté dans les cas de déficit en facteur du NHEJ et en ATM. Nous avons également établi en collaboration avec le service d’Immunologie Clinique de l’hôpital Saint-Louis une cohorte de patients atteints de déficit immunitaire commun variable (DICV) dont la présentation clinique est évocatrice d’un défaut de réparation de l’ADN. Une série de test fonctionnels de dépistages de déficit de la réparation de l’ADN ainsi que des analyses génétiques (CGH array, séquençage complet de l’exome) ont été fait chez ces patients afin d’identifier de nouveaux gènes impliqués dans les DICV. Parmi les 18 patients analysés, dans 5 cas on retrouve une sensibilité cellulaire accrue aux agents génotoxiques et chez 15 patients, un gène candidat a été identifié. Ces résultats sont encore préliminaires et la caractérisation génétique et fonctionnelle des mutations identifiées sera poursuivie par notre équipe. Pour finir, nous avons entrepris l’exploration génétique et fonctionnelle de deux mutations identifiées chez une jeune patiente atteinte de déficit immunitaire combiné (CID) associé à un syndrome lymphoprolifératif et une auto-immunité, et chez qui une hypersensibilité cellulaire à la Mitomycine C, agent pontant de l’ADN, a été détectée. La première mutation a été identifiée dans le gène ELKS qui code pour un facteur impliqué dans la réparation de l’ADN. La complémentation fonctionnelle de ce gène prouve l’implication de cette mutation dans l’hypersensibilité des cellules de la patiente à la MMC. Nous avons développé un modèle murin KO conditionnel de ce gène dans les cellules hématopoïétiques qui n’a pas montré de défaut de développement du système immunitaire. La deuxième mutation identifiée se situe dans le gène BACH2 codant pour un répresseur transcriptionnel très impliqué dans le développement du système immunitaire. Les souris KO pour ce gène ont un phénotype proche du déficit immunitaire décrit chez cette patiente. Les investigations de cette mutation sont en cours chez elle et chez les membres de sa famille également porteurs de la mutation
The immune system is particularly dependent on DNA damage response (DDR) pathways. The development of the adaptive immune system requires certain DDR mechanisms, in particular during the V(D)J recombination and during class switch recombination (CSR), furthermore, the hematopoietic system is very sensitive to spontaneous DNA lesions. Therefore, there are many immune deficiencies in human directly related to a DDR deficiency. The identification of the responsible gene is important for appropriate genetic counseling. Today, we have access to powerful genetic screening tools, in particular next generation sequencing (NGS) and the list of genes responsible for immune deficiency is growing rapidly. The first part of this work focuses on the development of a new screening tool for DDR defects, in particular in the case of immune deficiency, and evaluation of clinical interest. This test is based on the observation of a bias of the TCRα repertoire in circulating T lymphocytes when thymocytes lifespan is diminished and we know that DDR defect causes decreased thymocyte survival. We have developed two techniques, by molecular biology and by flow cytometry, to detect a potential bias of the TCRα repetoire and assess the suitability of this test in some immunodeficiencies linked to a DDR defect. A significant bias was detected in the case of ATM and NHEJ factor deficiency. Furthermore, we have established a cohort of patients suffering from common variable immunodeficiency (CVID) with a clinical presentation highly suggestive of DDR defect, in collaboration with the Clinical Immunology Service of Hôpital Saint-Louis (Paris). Functional test for DDR defect and genetic analysis (CGHarray, whole exome sequencing) were performed in these patients to identify new genes involved in CVID. Among the 18 patients analyzed until now, five cases of cellular sensitivity to genotoxic agents have been detected and a candidate gene was identified in 15 of them. These results are still preliminary and our team will pursue genetic and functional characterization of the identified mutations. Finally, we undertook genetic and functional exploration of two mutations identified in a young patient with combined immunodeficiency (CID) associated with a lymphoproliferative disease and autoimmunity, and in whom a cellular hypersensitivity to mitomycin C, a DNA crosslinking agent, was detected. The first mutation was identified in the ELKS gene, which codes for a factor involved in DNA repair. Functional complementation of this gene demonstrates the involvement of this mutation in the hypersensitivity of patient’s cells to MMC. We have developed a conditional knockout mouse model of this gene in hematopoietic cells that did not show any defect in development of the immune system. The second mutation was identified in BACH2 gene encoding a transcriptional repressor involved in the development of the immune system. Knockout mice for this gene have a similar phenotype to the immune deficiency described in this patient. Investigations on this mutation are ongoing in the patient and among family members that also carry the mutation
7

Kabalane, Hadi. "Caractérisation pangénomique et analyse comparative du programme de réplication de l'ADN dans 12 lignées cellulaires humaines." Thesis, Lyon, 2019. http://www.theses.fr/2019LYSEN063.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Le programme spatiotemporel de réplication de l'ADN est régulé au cours du développement et altéré durant la progression cancéreuse. Nous proposons une caractérisation originale de la plasticité du programme de réplication de l’ADN se basant sur le profilage de 12 lignées cellulaires humaines normales ou cancéreuses par la méthode Ok-seq de purification et séquençage des fragments d'Okazaki qui permet de déterminer l'orientation de la progression des fourches de réplication (OFR) à haute résolution (10 kilo bases). L'analyse comparative des profils OFR montre que les changements réplicatifs permettent la classification des lignées cellulaires en fonction de leur tissu d'origine, la nature cancéreuse ou non de la lignée n'intervenant qu'en second ordre. Il n’apparait pas de point chaud pour l’accumulation des changements réplicatifs, ceux-ci étant largement dispersés sur tout le génome. Néanmoins, les régions riches en G+C et en gènes actifs, répliquées précocement au cours de la phase S, ont le programme de réplication le plus stable, elles présentent une forte densité de zones d'initiation de la réplication (ZI) efficaces et conservées entre lignées cellulaires. En contraste, les dernières régions répliquées, à faible densité de gènes et pauvres en G+C, présentent peu de ZI efficaces, souvent spécifiques d'un tissu ou d'une lignée. Ceci nous conduit à quantifier le degré de dissociation entre ZI et activation de la transcription. Ce travail propose un panorama original des modifications du programme de réplication au cours de la différentiation normale ou pathologique, dont un contrôle lignée cellulaire spécifique des ZI dans les déserts de gènes à réplication tardive
The spatiotemporal program of DNA replication is regulated during development and altered during cancer progression. We propose an original characterization of the plasticity of the DNA replication program based on the profiling of 12 normal or cancerous human cell lines by the Ok-seq method of purification and sequencing of Okazaki fragments which allows to determine the orientation of the progression of replication forks (RFD) at high resolution (10 kilo bases). Comparative analysis of the RFD profiles shows that the replicative changes allow the classification of the cell lines according to their tissue of origin, the cancerous or non-cancerous nature of the cell line type intervening only in second order. There is no hotspot for the accumulation of replicative changes, they are widely dispersed throughout the genome. Nevertheless, the G+C rich and active gene regions, replicated early in the S phase, have the most stable replication program, they present a high density of efficient replication initiation zones (IZ) conserved between cell lines. In contrast, the late replicated, low gene density and low G+C content regions have few efficient IZs, often specific to a tissue or lineage. This leads us to quantify the degree of dissociation between IZ and activation of transcription. This work provides an original overview of replication program changes during normal or pathological differentiation, including a cell line specific control of IZ in late-replication gene deserts
8

Riaz, Tiayyba. "Approches bioinformatiques pour l'assessment de la biodiversité." Phd thesis, Université de Grenoble, 2011. http://tel.archives-ouvertes.fr/tel-00716330.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Cette thèse s'intéresse à la conception et le développement des techniques de bioinfor- matique qui peuvent faciliter l'utilisation de l'approche metabarcoding pour mesurer la diversité d'espèces. Le metabarcoding peut être utilisé avec le séquencage haut débit pour l'identification d'espèces multiples à partir d'un seul échantillon environnemental. La véritable force du metabarcoding réside dans l'utilisation de barcode marqueurs choisi pour une étude particulière et l'identification d'espèces ou des taxons peut être réalisé avec des marqueurs soigneusement conçu. Avec l'avancement des techniques haut débit de séquençage, une énorme quantité des données de séquences est produit qui contient un nombres substantiel des mutations. Ces mutations posent un grand problème pour les estimations correctes de la biodiversité et pour le d'assignation de taxon. Les trois problèmes majeurs dans le domaine de la bioinformatique que j'ai abordés dans cette thèse sont: i) évaluer la qualité d'une barcode marker , ii) concevoir des nouveaux région barcode et iii) d'analyser les données de séquençage pour traiter les erreurs et éliminer le bruit en séquences. Pour évaluer la qualité d'un barcode marker, on a développé deux mesures quantita- tive,formelle: la couverture (Bc) et la spécificité (Bs). La couverture donne une mesure de universalité d'une pairs de primer pour amplifier un large nombre de taxa, alors que la spécificité donne une mesure de capacité à discriminer entre les différents taxons. Ces mesures sont très utiles pour le classement des barcode marker et pour sélectionner les meilleurs markers. Pour trouver des nouveaux région barcode notamment pour les applications metabarcod- ing, j'ai développé un logiciel, ecoPrimers3. Basé sur ces deux mesures de qualité et de l'information taxinomique intégré, ecoPrimers nous permet de concevoir barcode markers pour n'importe quel niveau taxonomique . En plus, avec un grand nombre de paramètres réglables il nous permet de contrôler les propriétés des amorces. Enfin, grâce a des algorithmes efficaces et programmé en langage C, ecoPrimers est suffisamment efficace pour traiter des grosses bases de données, y compris génomes bactériens entièrement séquencés. Enfin pour traiter des erreurs présentes dans les données de séquencage , nous avons analysé un ensemble simple d'échantillons de PCR obtenus à partir de l'analyse du régime alimentaire de Snow Leopard. En mesurant les corrélations entre les différents paramètres des erreurs, nous avons observé que la plupart des erreurs sont produites pendant l'amplification par PCR. Pour détecter ces erreurs, nous avons développé un algorithme utilisant les graphes, qui peuvent différencier les vrai séquences des erreurs induites par PCR. Les résultats obtenus à partir de cet algorithme a montré que les données de-bruitée a donnent une estimation réaliste de la diversité des espèces étudiées dans les Alpes françaises.
9

Benoit, Bouvrette Louis Philip. "Caractérisation systématique des motifs de régulation en cis à l’échelle transcriptomique et liens avec la localisation des ARN." Thesis, 2020. http://hdl.handle.net/1866/24578.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
La localisation subcellulaire de l’ARN permet un déploiement prompt et spatialement restreint autant des activités protéiques que des ARN noncodant. Le trafic d’ARN est dirigé par des éléments de séquences (sous-séquences primaires, structures secondaires), aussi appelés motifs de régulation, présents en cis à même la molécule d’ARN. Ces motifs sont reconnus par des protéines de liaisons aux ARN qui médient l’acheminement des transcrits vers des sites précis dans la cellule. Des études récentes, chez l’embryon de Drosophile, indiquent que la majorité des ARN ont une localisation subcellulaire asymétrique, suggérant l’existence d’un « code de localisation » complexe. Cependant, ceci peut représenter un exemple exceptionnel et la question demeurait, jusqu’ici, si une prévalence comparable de localisation d’ARN est observable chez des cellules standards développées en culture. De plus, des informations facilement disponibles à propos des caractéristiques de distribution topologique d’instances de motifs à travers des transcriptomes complets étaient jusqu’à présent manquantes. Afin d’avoir un aperçu de l’étendue et des propriétés impliquées dans la localisation des ARN, nous avons soumis des cellules de Drosophile (D17) et de l’humain (HepG2) à un fractionnement biochimique afin d’isoler les fractions nucléaire, cytosolique, membranaire et insoluble. Nous avons ensuite séquencé en profondeur l’ARN extrait et analysé par spectrométrie de masse les protéines extraites de ces fractions. Nous avons nommé cette méthode CeFra-Seq. Par des analyses bio-informatiques, j’ai ensuite cartographié l’enrichissement de divers biotypes d’ARN (p. ex. ARN messager, ARN long non codant, ARN circulaire) et protéines au sein des fractions subcellulaires. Ceci a révélé que la distribution d’un large éventail d’espèces d’ARN codants et non codants est asymétrique. Une analyse des gènes orthologues entre mouche et humain a aussi démontré de fortes similitudes, suggérant que le processus de localisation est évolutivement conservé. De plus, j’ai observé des attributs (p. ex. la taille des transcrits) distincts parmi les populations d’ARN messagers spécifiques à une fraction. Finalement, j’ai observé des corrélations et anti-corrélations spécifiques entre certains groupes d’ARN messagers et leurs protéines. Pour permettre l’étude de la topologie de motifs et de leurs conservations, j’ai créé oRNAment, une base de données d’instances présumée de sites de liaison de protéines chez des ARN codants et non codants. À partir de données de motifs de liaison protéique par RNAcompete et par RNA Bind-n-Seq, j’ai développé un algorithme permettant l’identification rapide d’instances potentielles de ces motifs dans un transcriptome complet. J’ai pu ainsi cataloguer les instances de 453 motifs provenant de 223 protéines liant l’ARN pour 525 718 transcrits chez cinq espèces. Les résultats obtenus ont été validés en les comparant à des données publiques de eCLIP. J’ai, par la suite, utilisé oRNAment pour analyser en détail les aspects topologiques des instances présumées de ces motifs et leurs conservations évolutives relatives. Ceci a permis de démontrer que la plupart des motifs sont distribués de façon similaire entre espèces. De plus, j’ai discerné des points communs entre les sous-groupes de protéines liant des biotypes distincts ou des régions d’ARN spécifiques. La présence de tels patrons, similaires ou non, entre espèces est susceptible de refléter l’importance de leurs fonctions. D’ailleurs, l’analyse plus détaillée du positionnement d’un motif entre régions transcriptomiques comparables chez les vertébrés suggère une conservation synténique de ceux-ci, à divers degrés, pour tous les biotypes d’ARN. La topologie régionale de certaines instances de motifs répétées apparaît aussi comme évolutivement conservée et peut être importante afin de permettre une liaison adéquate de la protéine. Finalement, les résultats compilés avec oRNAment ont permis de postuler sur un nouveau rôle potentiel pour l’ARN long non codant HELLPAR comme éponge de protéines liant l’ARN. La caractérisation systématique d’ARN localisés et de motifs de régulation en cis présentée dans cette thèse démontre comment l’intégration d’information à l’échelle transcriptomique permet d’évaluer la prévalence de l’asymétrie, les caractéristiques distinctes et la conservation évolutive de collections d’ARN.
The subcellular localization of RNA allows a rapid and spatially restricted deployment of protein and noncoding RNA activities. The trafficking of RNA is directed by sequence elements (primary subsequences, secondary structures), also called regulatory motifs, present in cis within the RNA molecule. These motifs are recognized by RNA-binding proteins that mediate the transport of transcripts to specific sites in the cell. Recent studies in the Drosophila embryo indicate that the majority of RNAs display an asymmetric subcellular localization, suggesting the existence of a complex "localization code". However, this may represent an exceptional example and the question remained, until now, whether a comparable prevalence of RNA localization is observable in standard cells grown in culture. In addition, readily available information about the topological distribution of pattern instances across full transcriptomes has been hitherto lacking. In order to have a broad overview of the extent and properties involved in RNA localization, we subjected Drosophila (D17) and human (HepG2) cells to biochemical fractionation to isolate the nuclear, cytosolic, membrane and insoluble fractions. We then performed deep sequencing on the extracted RNA and analyzed through mass spectrometry the proteins extracted from these fractions. We named this method CeFra-Seq. Through bioinformatics analyses, I then profiled the enrichment of various RNA biotypes (e.g. messenger RNA, long noncoding RNA, circular RNA) and proteins within the subcellular fractions. This revealed the high prevalence of asymmetric distribution of both coding and noncoding RNA species. An analysis of orthologous genes between fly and human has also shown strong similarities, suggesting that the localization process is evolutionarily conserved. In addition, I have observed distinct attributes (e.g. transcript size) among fraction-specific messenger RNA populations. Finally, I observed specific correlations and anti-correlations between defined groups of messenger RNAs and the proteins they encode. To study motifs topology and their conservation, I created oRNAment, a database of putative RNA-binding protein binding sites instances in coding and noncoding RNAs. Using data from protein binding motifs assessed by RNAcompete and by RNA Bind-n-Seq experiments, I have developed an algorithm allowing their rapid identification in a complete transcriptome. I was able to catalog the instances of 453 motifs from 223 RNA-binding proteins for 525,718 transcripts in five species. The results obtained were validated by comparing them with public data from eCLIP. I then used oRNAment to further analyze the topological aspects of these motifs’ instances and their relative evolutionary conservation. This showed that most motifs are distributed in a similar fashion between species. In addition, I have detected commonalities between the subgroups of proteins linking preferentially distinct biotypes or specific RNA regions. The presence or absence of such pattern between species is likely a reflection of the importance of their functions. Moreover, a more precise analysis of the position of a motif among comparable transcriptomic regions in vertebrates suggests a syntenic conservation, to varying degrees, in all RNA biotypes. The regional topology of certain motifs as repeated instances also appears to be evolutionarily conserved and may be important in order to allow adequate binding of the protein. Finally, the results compiled with oRNAment allowed to postulate on a potential new role for the long noncoding RNA HELLPAR as an RNA-binding protein sponge. The systematic characterization of RNA localization and cis regulatory motifs presented in this thesis demonstrates how the integration of information at a transcriptomic scale enables the assessment of the prevalence of asymmetry, the distinct characteristics and the evolutionary conservation of RNA clusters.
10

Aid, Malika. "Une nouvelle approche computationnelle pour la découverte des sites de fixation de facteurs de transcription à l’ADN, adaptée aux données de ChIP-chip et de ChIP-séquençage." Thèse, 2012. http://hdl.handle.net/1866/12729.

Full text
APA, Harvard, Vancouver, ISO, and other styles
Abstract:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.
Transcription factors (TF) play important roles in various biological processes such as differentiation, cell cycle progression and tumorigenesis. They regulate gene expression by binding to specific DNA sequences (TFBS). Identifying these cis-regulatory elements is a crucial step to understand gene regulatory networks. Technological developments have enhanced DNA sequencing at genomic scale. On the basis of the resulting sequences, computational biologists now attempt to localize the most important functional regions, starting with genes, but also importantly the whole genome characterization of transcription factor binding sites and allow the development of several computational DNA motif discovery tools. Although these various tools are widely used and have been successful at discovering novel motifs, they are not adapted to ChIP-chip and ChIP-sequencing data. The main drawback of these approaches is that most of the predicted motifs represent artifacts due to an inefficient assessment of their enrichment. This thesis is about transcription factor proteins and statistical analysis of their binding sites in ChIP-chip and ChIP-sequencing data. The first objective was to develop a new do novo DNA motif discovery tool adapted to ChIP-chip and ChIP-sequencing data. SAMD-ChIP combines enumerative and stochastic strategies to predict enriched motifs in the vicinity of the ChIP peak summits. Our approach is an automated pipeline that includes motif discovery, motif clustering, motif optimization and finally motif identification using transcription factor (TF) databases. SAMD-ChIP outperforms state-of-the-art motif discovery tools in term of the number of predicted motifs and the prediction of rare and degenerate motifs. In particular, SAMD-ChIP efficiently identifies gapped motifs such as inverted or direct repeats bound by nuclear receptors and composite motifs resulting from the association of different single TF binding sites. The underlying assumption of the second objective is that in regulatory regions, binding sites of interacting transcription factors co-occur more often than expected by chance in the vicinity of the ChIP-peak summits. We proposed an approach to predict transcription factor binding sites co-localization based on the prediction of single motifs by do novo motif discovery tools or by using TFBS models from TF data bases.

Book chapters on the topic "Séquençage de l’ARN":

1

PIERELLA KARLUSICH, Juan José, Charlotte NEF, Chris BOWLER, and Richard G. DORRELL. "Modèles biogéographiques et génomes des photoautotrophes aquatiques." In Planète bleue, photosynthèse rouge et verte, 45–82. ISTE Group, 2023. http://dx.doi.org/10.51926/iste.9082.ch3.

Full text
APA, Harvard, Vancouver, ISO, and other styles

To the bibliography