Academic literature on the topic 'Dépistage génétique – Méthodes statistiques'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Dépistage génétique – Méthodes statistiques.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Dépistage génétique – Méthodes statistiques"

1

Robette, Nicolas. "Les impasses de la sociogénomique." Population Vol. 77, no. 2 (September 28, 2022): 191–227. http://dx.doi.org/10.3917/popu.2202.0191.

Full text
Abstract:
À partir des années 2000, les technologies de séquençage et de génotypage à haut débit se développent très rapidement. On peut dès lors étudier simultanément un grand nombre de marqueurs génétiques chez un grand nombre de sujets, ce qui permet l’apparition des « études d’associations pangénomiques » et des « scores de risques polygénique ». C’est dans ce contexte de progrès technologiques et statistiques que la « sociogénomique » – entendue comme la combinaison de la sociologie et de la génétique – apparaît et se diffuse dans le champ des sciences sociales. Or les méthodes utilisées par les sociogénomistes reposent sur un certain nombre de présupposés conceptuels et statistiques, dont la validité pose problème. Indépendamment des limites des outils utilisés, il apparaît que, à l’heure actuelle, les travaux de sociogénomique n’apportent qu’une faible contribution à la connaissance sociologique et démographique. On est le plus souvent en présence d’un acte de foi dans le progrès de la sociogénomique par l’intermédiaire des progrès techniques, sans remise en cause du modèle biologique sur lequel tout repose. De ce point de vue, l’écho des divers appels à la prudence des sociétés savantes en génétique humaine ne semble pas (encore) avoir porté jusqu’à ces « entrepreneurs de génétique » en sciences sociales.
APA, Harvard, Vancouver, ISO, and other styles
2

POUJARDIEU, B., and J. MALLARD. "Les bases de la génétique quantitative : Les méthodes d’estimation de l’héritabilité et des corrélations génétiques." INRAE Productions Animales 5, HS (December 29, 1992): 87–92. http://dx.doi.org/10.20870/productions-animales.1992.5.hs.4268.

Full text
Abstract:
Pour sélectionner, il est nécessaire de connaître les valeurs de certains paramètres génétiques tels que les héritabilités et les corrélations génétiques. Leur estimation directe ne peut se faire puisque le déterminisme génétique des caractères d’importance économique est infiniment trop complexe pour que l’on puisse observer les valeurs génétiques additives. Il est par contre possible d’observer les covariances entre des individus apparentés, dues aux fractions de génome qu’ils possèdent en commun. On peut alors calculer à partir de ces paramètres statistiques les paramètres génétiques recherchés. Les estimateurs utilisés pour obtenir ces covariances entre apparentés sont complexes. Ils doivent porter sur des populations de très grande taille, et donc réparties sur une aire vaste et hétérogène. De plus, les dispositifs ainsi réalisés ne peuvent être orthogonaux. Les méthodes employées n’ont pas de propriétés statistiques permettant de conclure à l’absolue suprématie de l’une par rapport aux autres. Leur mise en oeuvre nécessite des procédures numériques compliquées, gourmandes de ressources informatiques. Mais, au bout du compte, les valeurs estimées donnent satisfaction au sélectionneur.
APA, Harvard, Vancouver, ISO, and other styles
3

DUCROCQ, V. "Les bases de la génétique quantitative : Du modèle génétique au modèle statistique." INRAE Productions Animales 5, HS (December 29, 1992): 75–8. http://dx.doi.org/10.20870/productions-animales.1992.5.hs.4266.

Full text
Abstract:
L’étape préliminaire à l’étude d’un caractère quantitatif est la modélisation statistique des observations, c’est-à-dire la représentation mathématique d’une réalité biologique, cohérente avec le modèle génétique. Ce modèle décrit très généralement chaque observation comme étant la somme d’effets du milieu et d’effets génétiques. Différentes façons de modéliser chacune de ces parties sont possibles en fonction des objectifs de l’étude, et ont des conséquences diverses sur les hypothèses requises pour l’obtention de résultats fiables. Ainsi, il est essentiel d’inclure dans l’analyse uniquement les facteurs du milieu ayant un effet important sur la performance observée, mais sans en omettre aucun. On peut ne faire intervenir dans la partie génétique du modèle que des animaux apparentés aux animaux "auteurs" des observations. Des simplifications importantes notamment calculatoires peuvent en découler, mais les résultats peuvent alors être fortement biaisés si certaines hypothèses qu’il faut faire ne sont pas vérifiées. Enfin, selon qu’une connaissance a priori des caractéristiques statistiques des effets est disponible et utilisée, il est possible de distinguer trois types de modèles (à effets fixés, aléatoires ou mixtes) auxquels correspondent des méthodes différentes d’estimation des paramètres étudiés.
APA, Harvard, Vancouver, ISO, and other styles
4

DUCROCQ, V. "Les techniques d’evaluation génétique des bovins laitiers." INRAE Productions Animales 3, no. 1 (February 3, 1990): 3–16. http://dx.doi.org/10.20870/productions-animales.1990.3.1.4355.

Full text
Abstract:
Les méthodes statistiques utilisées au cours des 50 dernières années pour l’évaluation génétique des taureaux et des vaches laitières sont présentées en insistant sur les raisons ayant motivé leur développement, puis leur abandon. La théorie classique des index de sélection appliquée aux données de base telles que les écarts des performances des vaches à leurs contemporaines d’étable est devenue obsolète car la correction des effets du milieu était imparfaite et le progrès génétique sous-jacent n’était pas pris en compte. La meilleure prédiction linéaire non biaisée (BLUP) permet une évaluation simultanée des effets génétiques et du milieu. Appliquée initialement à des modèles simples pour l’estimation des taureaux (modèles père ou père-grand-père), elle est maintenant de plus en plus utilisée avec un « modèle animal », qui permet l’évaluation conjointe des mâles et des femelles. Certaines propriétés intéressantes sont alors respectées. D’autres aspects, tels que la modélisation des performances, la prise en compte de plusieurs lactations et les difficultés de calcul des index sont également abordés.
APA, Harvard, Vancouver, ISO, and other styles
5

LE ROY, P. "Les bases de la génétique quantitative : Les méthodes de mise en évidence des gènes majeurs." INRAE Productions Animales 5, HS (December 2, 1992): 93–99. http://dx.doi.org/10.20870/productions-animales.1992.5.hs.4270.

Full text
Abstract:
S’il existe un gène à effet majeur sur un caractère, la distribution des phénotypes est un mélange de distributions élémentaires dans des proportions obéissant aux lois de Mendel. Différents tests statistiques basés sur ce principe sont présentés. Les données exploitées peuvent provenir d’expériences de croisements spécialement conçues pour détecter un gène majeur, mais aussi de fichiers de contrôle des performances de structure quelconque. Les méthodes utilisées sont des tests d’hypothèses permettant de choisir entre l’absence et la présence d’un locus majeur à partir des informations disponibles. Il s’agit soit d’indicateurs numériquement très simples à obtenir, soit de méthodes plus complexes faisant appel aux techniques du maximum de vraisemblance. Dans l’un et l’autre cas, les tests construits prennent plus ou moins en compte la structure généalogique de la population. La méthode la plus élaborée est l’analyse de ségrégation qui permet de synthétiser toute l’information disponible pour comparer différentes hypothèses de transmission du caractère et qui fournit des estimations des paramètres du modèle génétique retenu. Cependant, elle est numériquement très coûteuse et nécessite des simplifications pour être applicable aux populations d’animaux domestiques. Des critères moins puissants mais plus simples ont donc un intérêt non négligeable en permettant en première approche une recherche systématique des gènes à effet majeur.
APA, Harvard, Vancouver, ISO, and other styles
6

Foucambert, Denis, Tracy Heranic, Christophe Leblay, Maarit Mutta, and Minjing Zhong. "Intégration de la visualisation dans l’analyse de processus complexes : écritures et réécritures dans un corpus multilingue universitaire." SHS Web of Conferences 138 (2022): 06010. http://dx.doi.org/10.1051/shsconf/202213806010.

Full text
Abstract:
Cet article traite des processus d’écriture d’apprenants universitaires de français langue étrangère (L2/L3). Ces écritures ont été recueillies à l’aide du programme GenoGraphiX-Log qui est construit sur les exigences de la génétique textuelle et de la théorie mathématique des graphes. Notre corpus consiste en 44 écritures produites en français par des locuteurs ayant comme L1 soit l’anglais, soit le mandarin soit le finnois. Le premier objectif est de mieux décrire, en fonction des L1 des participants, les opérations d’écriture mises en oeuvre en français lors de la réalisation d’une même tâche. Le second objectif est d’évaluer comment la visualisation, basée sur la théorie des graphes et sur des méthodes statistiques inductives, soutient cette analyse des processus d’écriture. Les résultats se basent sur deux analyses issues des graphes : une analyse en composantes principales (ACP) et la visualisation des écritures exemplaires (les plus proches des centres de gravité de chaque groupe). Ces deux analyses complémentaires nous permettent de mesurer les spécificités des trois groupes et d’approfondir qualitativement l’analyse de signatures scripturales. Notre corpus et nos analyses montrent l’intérêt de l’utilisation des méthodes mixtes dans l’analyse des processus complexes d’écriture à l’aide d’outils de visualisation.
APA, Harvard, Vancouver, ISO, and other styles
7

Haddad, Nisrine, Ashley Weeks, Anita Robert, and Stephanie Totten. "Le VIH au Canada – Rapport de surveillance, 2019." Relevé des maladies transmissibles au Canada 47, no. 1 (January 29, 2021): 87–98. http://dx.doi.org/10.14745/ccdr.v47i01a11f.

Full text
Abstract:
Contexte : Environ 14 000 adultes sont actuellement incarcérés dans des prisons fédérales au Canada. Ces établissements étant vulnérables aux éclosions de maladies infectieuses, une évaluation du niveau de dépistage et de la maladie à coronavirus 2019 (COVID-19) dans ces milieux est nécessaire. L’objectif de la présente étude était d’examiner les résultats des dépistages de COVID-19, la prévalence, les cas en rétablissement et les décès liés à la COVID-19 dans les prisons fédérales, et de comparer ces données avec celles de la population générale. Méthodes : Les données publiques des séries chronologiques des résultats de dépistage concernant les prisonniers et la population générale ont été obtenues en ligne auprès du Service correctionnel du Canada et de l’Agence de la santé publique du Canada, respectivement, du 30 mars au 27 mai 2020. Pour chaque issu, des statistiques de fréquence par prison, par province et par sexe ont été calculées. Au total, 50 établissements ont été inclus dans cette étude. Résultats : Sur ces 50 établissements, 64 % ont déclaré avoir testé moins de personnes sur 1 000 que ce qui a été observé dans la population générale et 12 % ont déclaré n’avoir effectué aucun dépistage au cours de la période de l’étude. Le niveau de dépistage avait tendance à être de caractère réactif, n’augmentant qu’une fois que les prisons enregistraient des résultats positifs. Six prisons ont signalé des éclosions, trois d’entre elles enregistrant une prévalence cumulée de plus de 20 % de COVID-19 chez les détenus. Dans l’ensemble des prisons, 29 % des personnes testées ont reçu un résultat positif, comparativement à 6 % dans la population générale. Deux des 360 cas se sont soldés par la mort (taux de létalité de 0,6 %). Quatre foyers d’éclosion semblent avoir été maîtrisés (plus de 80 % des cas ont été guéris), mais d’importantes populations vulnérables restent exposées au risque d’infection. Les femmes détenues (5 % de la population carcérale totale) étaient surreprésentées parmi les cas (17 % des cas dans l’ensemble). Conclusion : Les résultats suggèrent que les milieux pénitentiaires sont vulnérables à la transmission généralisée du coronavirus du syndrome respiratoire aigu sévère 2 (SRAS-CoV-2). Les lacunes en matière de dépistages méritent l’attention de la santé publique. Les pratiques de dépistage fondées sur la présence de symptômes ne sont peut-être pas les meilleures dans les prisons, étant donné les observations de transmission généralisée. Il peut être approprié d’augmenter les pratiques de dépistage sentinelle ou de dépistage universel. Il faudra multiplier les dépistages, mettre en place des pratiques rigoureuses de prévention des infections et potentiellement libérer des prisonniers pour aplatir la courbe à l’avenir.
APA, Harvard, Vancouver, ISO, and other styles
8

Blair, Alexandra, Abtin Parnia, and Arjumand Siddiqi. "Une analyse en séries chronologiques du niveau de dépistage et des éclosions de COVID-19 dans les prisons fédérales canadiennes, dans le but d’éclairer la prévention et la surveillance." Relevé des maladies transmissibles au Canada 47, no. 1 (January 29, 2021): 75–86. http://dx.doi.org/10.14745/ccdr.v47i01a10f.

Full text
Abstract:
Contexte : Environ 14 000 adultes sont actuellement incarcérés dans des prisons fédérales au Canada. Ces établissements étant vulnérables aux éclosions de maladies infectieuses, une évaluation du niveau de dépistage et de la maladie à coronavirus 2019 (COVID-19) dans ces milieux est nécessaire. L’objectif de la présente étude était d’examiner les résultats des dépistages de COVID-19, la prévalence, les cas en rétablissement et les décès liés à la COVID-19 dans les prisons fédérales, et de comparer ces données avec celles de la population générale. Méthodes : Les données publiques des séries chronologiques des résultats de dépistage concernant les prisonniers et la population générale ont été obtenues en ligne auprès du Service correctionnel du Canada et de l’Agence de la santé publique du Canada, respectivement, du 30 mars au 27 mai 2020. Pour chaque issu, des statistiques de fréquence par prison, par province et par sexe ont été calculées. Au total, 50 établissements ont été inclus dans cette étude. Résultats : Sur ces 50 établissements, 64 % ont déclaré avoir testé moins de personnes sur 1 000 que ce qui a été observé dans la population générale et 12 % ont déclaré n’avoir effectué aucun dépistage au cours de la période de l’étude. Le niveau de dépistage avait tendance à être de caractère réactif, n’augmentant qu’une fois que les prisons enregistraient des résultats positifs. Six prisons ont signalé des éclosions, trois d’entre elles enregistrant une prévalence cumulée de plus de 20 % de COVID-19 chez les détenus. Dans l’ensemble des prisons, 29 % des personnes testées ont reçu un résultat positif, comparativement à 6 % dans la population générale. Deux des 360 cas se sont soldés par la mort (taux de létalité de 0,6 %). Quatre foyers d’éclosion semblent avoir été maîtrisés (plus de 80 % des cas ont été guéris), mais d’importantes populations vulnérables restent exposées au risque d’infection. Les femmes détenues (5 % de la population carcérale totale) étaient surreprésentées parmi les cas (17 % des cas dans l’ensemble). Conclusion : Les résultats suggèrent que les milieux pénitentiaires sont vulnérables à la transmission généralisée du coronavirus du syndrome respiratoire aigu sévère 2 (SRAS-CoV-2). Les lacunes en matière de dépistages méritent l’attention de la santé publique. Les pratiques de dépistage fondées sur la présence de symptômes ne sont peut-être pas les meilleures dans les prisons, étant donné les observations de transmission généralisée. Il peut être approprié d’augmenter les pratiques de dépistage sentinelle ou de dépistage universel. Il faudra multiplier les dépistages, mettre en place des pratiques rigoureuses de prévention des infections et potentiellement libérer des prisonniers pour aplatir la courbe à l’avenir.
APA, Harvard, Vancouver, ISO, and other styles
9

Bradley, Shannon, Nadine Dumas, Mark Ludman, and Lori Wood. "Hereditary renal cell carcinoma associated with von Hippel–Lindau disease: a description of a Nova Scotia cohort." Canadian Urological Association Journal 3, no. 1 (April 25, 2013): 32. http://dx.doi.org/10.5489/cuaj.1013.

Full text
Abstract:
Background: von Hippel–Lindau (VHL) disease is an autosomaldominant condition characterized by the development of benignand malignant tumours, including cases of renal cell carcinoma(RCC). Early detection of RCC through routine surveillance canlead to decreased morbidity and mortality. Data on the numberof patients in Nova Scotia (NS) who have VHL disease, diseasemanifestations and the frequency and mode of the surveillancehave not previously been collected or reported. This project wasdesigned to obtain that information.Methods: The number and management of patients with VHL diseasewas determined by multiple sources: the Maritime MedicalGenetics Service, patient charts, and pathology, radiology and laboratorydata. The actual surveillance being performed was comparedwith that recommended in the literature.Results: Twenty-one patients from 11 families in NS were identified.Manifestations included cases of RCC (31.6%), central nervoussystem (CNS) hemangioblastoma (73.7%), retinal hemangioma(47.4%), renal cyst (47.4%) and pheochromocytoma (10.5%).Of the 6 patients with RCC, 4 had bilateral tumours, 2 requiredkidney transplants and 1 developed metastatic disease. Routinesurveillance was being done for the CNS in 62.5% of patients,retina in 47.4%, abdomen in 43.8% and urine catecholaminesin only 10.5%. Only 1 of the 6 patients who developed RCCwas undergoing routine abdominal imaging. Surveillance investigationswere ordered by a number of different specialists.Conclusion: Patients with VHL disease in NS have a number of manifestationsassociated with their disease, including RCC, in a similarfrequency to that reported in the literature. The surveillanceof these patients is suboptimal in frequency and coordination.von Hippel–Lindau disease is a complex condition that requiresa coordinated approach to care to ensure proper surveillance andtreatment. Our study highlights current deficiencies and offersan enormous opportunity for improvement.Généralités : La maladie de von Hippel-Lindau (VHL) est une maladieà transmission autosomique dominante caractérisée par la formationde tumeurs bénignes et malignes, dont l’hypernéphrome.Le dépistage précoce de l’hypernéphrome par des examens régulierspeut amener une réduction de la morbidité et de la mortalité. Onne sait pas combien de personnes sont atteintes de VHL enNouvelle-Écosse, quelles sont les manifestations de la maladie chezces patients et quels tests de dépistage sont effectués et à quellefréquence. Le projet décrit ici visait à obtenir ces renseignements.Méthodologie : Le nombre et la méthode de prise en charge despatients atteints de VHL ont été établis à l’aide de plusieurs sources :la Clinique de génétique médicale des Maritimes, des dossiers depatients, des rapports de pathologie et de radiologie et des analysesde laboratoire. Les méthodes de surveillance mises en placeont été comparées aux méthodes recommandées dans la littératuremédicale.Résultats : Vingt et un patients de 11 familles de Nouvelle-Écosseont été cernés. Les manifestations incluaient : hypernéphrome(31,6 %), hémangioblastomes siégeant au niveau du SNC (73,7 %),hémangiomes rétiniens (47,4 %), kystes rénaux (47,4 %) etphéochromocytomes (10,5 %). Sur les six patients porteurs d’unhypernéphrome, 4 avaient des tumeurs bilatérales, 2 ont eu besoind’une transplantation rénale et un patient a présenté des métastases.De tous les patients atteints de VHL, 62,5 % ont subi destests réguliers de dépistage au niveau du SNC, 47,4 %, au niveaude la rétine, 43,8 %, au niveau de l’abdomen, et seulement 10,5 %des patients ont subi des tests réguliers de dépistage des catécholaminesurinaires. Sur les 6 cas d’hypernéphrome, un seulementsubissait des épreuves régulières d’imagerie au niveau del’abdomen. Les tests de dépistage avaient été prescrits par différentsspécialistes.Conclusion : Les cas de VHL en Nouvelle-Écosse présentent un certainnombre de manifestations liées à cette maladie, dont l’hypernéphrome,à une fréquence proche de celle mentionnée dansla littérature. La fréquence et la coordination des épreuves dedépistage sont sous-optimales. La maladie de VHL est une affectioncomplexe nécessitant une bonne coordination des soinsafin d’assurer une surveillance et un traitement adéquats. Cetteétude montre les lacunes actuelles et pointe vers des améliorationssubstantielles.
APA, Harvard, Vancouver, ISO, and other styles
10

BOLET, G., and L. BODIN. "Les objectifs et les critères de sélection : Sélection de la fécondité dans les espèces domestiques." INRAE Productions Animales 5, HS (December 2, 1992): 129–34. http://dx.doi.org/10.20870/productions-animales.1992.5.hs.4276.

Full text
Abstract:
Pour toutes les espèces et pratiquement quel que soit leur type de production, l’amélioration de la reproduction fait partie des objectifs de sélection. Fertilité et prolificité (composantes de la fécondité), mais aussi rythme de mise-bas et durée de carrière sont les principaux caractères qui se combinent, de manière spécifique à chaque espèce du fait d’interactions entre rythmes biologiques et facteurs de milieu, pour former la carrière reproductive de la femelle, évaluée par la productivité numérique. Une sélection basée sur une mesure de la taille de portée est la méthode la plus classique, dans les élevages expérimentaux ou à partir d’un programme de contrôle de performances en ferme, pour l’amélioration génétique de la fécondité. Mais la faible héritabilité de la taille de portée et la faible intensité de sélection praticable ont le plus souvent limité son efficacité, qui peut être améliorée par l’ouverture de la population fermée à une base de sélection la plus large possible, grâce au contrôle de performances en élevage, et à l’utilisation de modèles statistiques permettant de prendre en compte toute l’information disponible dans la population. Des méthodes de sélection alternatives sont en cours d’expérimentation : sélection sur un critère "global", prenant en compte à la fois la fertilité et la prolificité, sélection sur les composantes de la taille de portée, soit en combinant le taux d’ovulation et de survie embryonnaire en un index additif "optimum", soit en sélectionnant sur une des composantes de la taille de portée, sélection sur d’autres critères indirects liés plus ou moins directement à la fécondité de la femelle, recherches de gènes majeurs. En ce qui concerne les travaux expérimentaux en cours, on notera que l’utilisation du contrôle de performances en ferme pour détecter des génotypes extrêmes et constituer des noyaux de sélection est une démarche assez générale. Dans les différentes espèces considérées, à des degrés divers, des programmes de contrôle de performances, en ferme et / ou en station, permettent d’enregistrer des données de productivité numérique avec différentes applications, allant d’un simple appui technique aux éleveurs à un programme collectif d’amélioration génétique.
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Dépistage génétique – Méthodes statistiques"

1

Ogloblinsky, Marie-Sophie. "Statistical strategies leveraging population data to help with the diagnosis of rare diseases." Electronic Thesis or Diss., Brest, 2024. http://www.theses.fr/2024BRES0039.

Full text
Abstract:
La forte hétérogénéité génétique et les modes de transmission complexes des maladies rares posent le défi d'identifier le variant causal si un seul patient le porte, en utilisant des données de séquençage et des méthodes d'analyse standard. Pour aborder ce problème, la méthode PSAP utilise des distributions nulles par gène de scores de pathogénicité CADD pour évaluer la probabilité d'observer un génotype donné dans la population générale. L'objectif de ce travail était de répondre au manque de diagnostic des maladies rares grâce à des méthodes statistiques. Nous proposons PSAP-genomic-regions, une extension de la méthode PSAP au génome non codant, en utilisant comme unités de test des régions prédéfinies reflétant la contrainte fonctionnelle à l'échelle du génome entier. Nous avons implémenté PSAP-genomic regions et sa version initiale PSAP-genes dans Easy-PSAP, un workflow Snakemake intuitif et adaptable, accessible aussi bien aux chercheurs qu'aux cliniciens. Appliqué à des familles touchées par de l'infertilité masculine, Easy-PSAP a permis la priorisation de variants candidats pertinents dans des gènes connus et nouveaux. Nous nous sommes ensuite concentrés sur le digénisme, le mode le plus simple de transmission complexe, qui implique l'altération simultanée de deux gènes pour développer une maladie. Nous avons décrit et évalué les méthodes actuelles publiées dans la littérature pour détecter le digénisme et proposé de nouvelles stratégies pour améliorer le diagnostic de ce mode de transmission complexe
High genetic heterogeneity and complex modes of inheritance in rare diseases pose the challenge of identifying an n-of-one sequencing data and standard analysis methods. To tackle this issue, the PSAP method uses gene-specific null distributions of CADD pathogenicity scores to assess the probability of observing a given genotype in a healthy population. The goal of this work was to address rare disease lack of diagnosis through statistical strategies. We propose PSAP-genomic-regions an extension of the PSAP method to the non-coding genome, using as testing units predefined regions reflecting functional constraint at the scale of the whole genome.We implemented PSAP-genomic-regions and the initial PSAP-genes in Easy-PSAP a user-friendly and versatile Snakemake workflow, accessible to both researchers and clinicians. When applied to families affected by male infertility, Easy-PSAP allowed the prioritization of relevant candidate variants in known and novel genes. We then focused on digenism, the most simple mode of complex inheritance, which implicates the simultaneous alteration of two genes to develop a disease. We reviewed and benchmarked current methods in the literature to detect digenism and put forward new strategies to improve the diagnostic of this complex mode of inheritance
APA, Harvard, Vancouver, ISO, and other styles
2

Boulez, Florence. "Étiologies moléculaires des insuffisances surrénales primaires congénitales : développements statistiques pour la validation du séquençage parallèle massif." Thesis, Lyon, 2018. http://www.theses.fr/2018LYSE1057.

Full text
Abstract:
L'insuffisance surrénale primaire (ISP) se caractérise par un déficit en hormones stéroïdiennes lié à un trouble du cortex surrénal qui expose au risque d'insuffisance aiguë et de menace vitale. Actuellement, 80% des formes pédiatriques d'ISP sont d'origine génétique et 5% restent sans étiologie génétique identifiée. Les récentes découvertes de mutations de gènes du stress oxydant ouvrent le champ des recherches d'anomalies génétiques non spécifiques de la glande surrénale. Le séquençage parallèle massif (MPS) autorise aujourd'hui la réalisation de millions de séquences et l'étude simultanée de plusieurs gènes de plusieurs patients ce qui permet d'accélérer le diagnostic. C'est aussi la technique de choix pour la recherche de nouveaux gènes. Cependant, parmi les défis de cette nouvelle technologie, il est possible de citer la gestion de la très grande quantité de données qu'elle génère et le besoin d'une validation rigoureuse préalable à son utilisation à des fins diagnostiques.Le premier objectif du présent travail était d'établir un diagnostic génétique dans une cohorte de patients atteints d'ISP et de rechercher de nouveaux gènes. L'étude des génotypes et des phénotypes permet de comprendre les mécanismes physiopathologiques pour les engager dans le traitement et le conseil génétique.Le second objectif était le développement de méthodes bio-informatiques et d'inférence statistique pour faciliter le transfert du séquençage classique (Sanger) vers la technique MPS. Ce développement comprend l'analyse graphique de la qualité du séquençage, l'ajustement de modèles log-linéaires pour comparer les propriétés de différents « pipelines », et l'ajustement de modèles additifs généralisés pour estimer les contributions des sources d'erreurs de séquençage. Les analyses statistiques ont considéré chaque paire de bases comme unité statistique et chaque patient comme étude indépendante, ce qui confère à l'analyse simultanée de tous les patients le caractère d'une méta-analyse
Primary adrenal insufficiency (PAI) is characterized by an impaired production of steroid hormones due to an adrenal cortex defect. This condition exposes to the risk of acute insufficiency which may be life-threatening. Today, 80% of pediatric forms of PAI have a genetic origin but 5% have no clear genetic support. Recently discovered mutations in genes relative to the oxidative stress have opened the way to research works on genes unrelated to the adrenal gland. Massive Parallel Sequencing (MPS) is now able to perform millions of sequences and study simultaneously several genes in several patients, which accelerates the diagnosis. Above all, MPS is the preferred technique for new gene discoveries. However, among the challenges of this new technology one may cite the management of the huge amount of data MPS generates and the need for a strict validation process before the use of MPS for diagnosis purposes.The first objective of the present work was to establish a genetic diagnosis in a cohort of patients with PAI and search for new genes. Study the genotypes and phenotypes allows a better understanding of the physiopathological mechanisms of PAI and offering appropriate care for the patients and counseling for families. The second objective was the development of bioinformatic and statistical inference methods to help shifting from the classical Sanger sequencing to MPS. This shift involves a graphical analysis of the quality of sequencing, an adjustment of log-linear models to allow comparing the properties of different pipelines, an adjustment of the generalized additive models to allow estimating the contributions of various sources of sequencing errors. The statistical methods have considered each DNA base-pair as a statistical unit and each patient as a separate study which confers the simultaneous study of all patients the status of a meta-analysis
APA, Harvard, Vancouver, ISO, and other styles
3

Meyer, Nicolas. "Méthodes statistiques d'analyse des données d'allélotypage en présence d'homozygotes." Université Louis Pasteur (Strasbourg) (1971-2008), 2007. https://publication-theses.unistra.fr/public/theses_doctorat/2007/MEYER_Nicolas_2007.pdf.

Full text
Abstract:
Les donnéees d'allélotypage contiennent des mesures réealisées par Polymerase Chain Reaction sur une série de microsatellites de l'ADN a¯n de déterminer l'existence d'un déséquilibre allélique pour ces microsatellites. D'un point de vue statistique, ces données sont caractérisées par un nombre important de données manquantes (en cas d'homozygotie du microsatellite), par des matrices carrées ou comportant plus de variables que de sujets, des variables biniomiales, des effectifs parfois faibles et éventuellement de la colinéarité. Les méthodes statistiques fréquentistes ont un nombre important de limites qui font choisir un cadre bayésien pour analyser ces données. En analyse univariée, l'intérêt du facteur de Bayes est exploré et différentes variantes selon l'absence ou la présence de données manquantes sont comparées. Différents types d'imputations multiples sont ensuite étudiés. Des modµeles de type méta-analyses sont également évalués. En analyse multivariéee, un modµele de type Partial Least Square est développé. Le modµele est appliqué sous une forme de modµele linéaire généralisé (régression logistique) et combiné avec l'algorithme Non Iterative Partial Least Squares, ce qui permet de gérer simultanément toutes les limites propres aux données d'alléotypage. Les propriétés de ce modµele sont explorées. Il est ensuite appliqué µa des données d'allélotypage portant sur 33 microsatellites de 104 patients porteurs d'un cancer du colon pour prédire le stade Astler-Coller de la tumeur. Un modµele avec toutes les interactions possibles entre couples de microsatellites est également réaliseé
Allelotyping data contain measures done using Polymerase Chain Reaction on a batch of DNA microsatellites in order to ascertain the presence or not of an allelic imbalance for this microsatellites. From a statistical point of view, those data are characterised by a high number of missing data (in case of homozygous microsatellite), square or °at matrices, binomial data, sample sizes which may be small with respect to the number of variables and possibly some colinearity. Frequentist statistical methods have a number of shortcomings who led us to choose a bayesian framework to analyse these data. For univariate analyses, the Bayes factor is explored and several variants according to the presence or absence of missing data are compared. Di®erent multiple imputations types are then studied. Meta-analysis models are also assessed. For multivariate analyses, a Partial Least Square model is developed. The model is applied under a generalised linear model (logistic regression) and combined with a Non Iterative Partial Least Squares algorithm which 3 makes it possible to manage simultaneously all the limits of allelotyping data. Properties of this model are explored. It is then applied on allelotyping data on 33 microsatellites of 104 patients who have colon cancer to predict the tumor Astler-Coller stage. A model with all possible microsatellites pairs interactions is also run
APA, Harvard, Vancouver, ISO, and other styles
4

Accrachi, El Hadji Ousseynou. "Nouveau cadre statistique pour la cartographie-fine." Master's thesis, Université Laval, 2021. http://hdl.handle.net/20.500.11794/67891.

Full text
Abstract:
Des études d’association à l’échelle du génome (GWAS) ont permis l’identification de milliers de régions du génome comportant des variants génétiques associés à des traits et qui peuvent être à l’origine de certaines maladies complexes. Cependant faire des tests biologiques pour tous les variants génétiques découverts à l’aide de GWAS est pratiquement impossible. Ainsi, les études de cartographie-fine visent à déterminer un ensemble cible de variants génétiques susceptibles d’être associés à un trait d’intérêt. Les principales difficultés pour les méthodes statistiques pour la cartographie-fine sont la présence de milliers de variants génétiques pour seulement une centaine d’individus et la présence d’une forte structure de corrélation, ou déséquilibre de liaison (LD) entre les variants génétiques. Il existe de nombreuses contributions dans les études de cartographie-fine notamment CAVIAR [19], CAVIAR-Gene [30], PAINTOR [28], fastPAINTOR [27] etc. Ces études se basent sur des méthodes statistiques de sélection d’un ensemble crédible de variants génétiques pour aider à prioriser les variants et à discerner les conséquences fonctionnelles du risque de maladies des variants sélectionnés. Dans ce mémoire, nous proposons un nouveau cadre statistique avec une procédure de sélection de variants génétiques (SNPs). Nous utilisons une méthode conditionnelle ou bayésienne pour identifier les SNPs susceptibles d’être causaux. Ainsi la statistique d’association d’un SNP est réécrite et sa loi asymptotique est déterminée. Notre procédure de sélection est itérative et grâce à une loi a priori, elle calcule les probabilités a posteriori pour qu’un SNP soit significatif pour le trait d’intérêt. À chaque étape les statistiques d’association des SNPs sont calculées et le SNP avec la plus forte probabilité a posteriori est choisi. Dans nos simulations, nous montrons que la correction sur la loi asymptotique de la statistique d’association apporte une amélioration significative dans la sélection des SNPs qui ont un lien avec le trait d’intérêt
APA, Harvard, Vancouver, ISO, and other styles
5

Leclerc, Martin. "Tests d'association génétique pour des durées de vie en grappes." Doctoral thesis, Université Laval, 2016. http://hdl.handle.net/20.500.11794/26667.

Full text
Abstract:
Tableau d’honneur de la Faculté des études supérieures et postdoctorales, 2015-2016
Les outils statistiques développés dans cette thèse par articles visent à détecter de nouvelles associations entre des variants génétiques et des données de survie en grappes. Le développement méthodologique en analyse des durées de vie est aujourd'hui ininterrompu avec la prolifération des tests d'association génétique et, de façon ultime, de la médecine personnalisée qui est centrée sur la prévention de la maladie et la prolongation de la vie. Dans le premier article, le problème suivant est traité : tester l'égalité de fonctions de survie en présence d'un biais de sélection et de corrélation intra-grappe lorsque l'hypothèse des risques proportionnels n'est pas valide. Le nouveau test est basé sur une statistique de type Cramérvon Mises. La valeur de p est estimée en utilisant une procédure novatrice de bootstrap semiparamétrique qui implique de générer des observations corrélées selon un devis non-aléatoire. Pour des scénarios de simulations présentant un écart vis-à-vis l'hypothèse nulle avec courbes de survie qui se croisent, la statistique de Cramer-von Mises offre de meilleurs résultats que la statistique de Wald du modèle de Cox à risques proportionnels pondéré. Le nouveau test a été utilisé pour analyser l'association entre un polymorphisme nucléotidique (SNP) candidat et le risque de cancer du sein chez des femmes porteuses d'une mutation sur le gène suppresseur de tumeur BRCA2. Un test d'association sequence kernel (SKAT) pour détecter l'association entre un ensemble de SNPs et des durées de vie en grappes provenant d'études familiales a été développé dans le deuxième article. La statistique de test proposée utilise la matrice de parenté de l'échantillon pour modéliser la corrélation intra-famille résiduelle entre les durées de vie via une copule gaussienne. La procédure de test fait appel à l'imputation multiple pour estimer la contribution des variables réponses de survie censurées à la statistique du score, laquelle est un mélange de distributions du khi-carré. Les résultats de simulations indiquent que le nouveau test du score de type noyau ajusté pour la parenté contrôle de façon adéquate le risque d'erreur de type I. Le nouveau test a été appliqué à un ensemble de SNPs du locus TERT. Le troisième article vise à présenter le progiciel R gyriq, lequel implante une version bonifiée du test d'association génétique développé dans le deuxième article. La matrice noyau identical-by-state (IBS) pondérée a été ajoutée, les tests d'association génétique actuellement disponibles pour des variables réponses d'âge d'apparition ont été brièvement revus de pair avec les logiciels les accompagnant, l'implantation du progiciel a été décrite et illustrée par des exemples.
The statistical tools developed in this manuscript-based thesis aim at detecting new associations between genetic variants and clustered survival data. Methodological development in lifetime data analysis is today ongoing with the proliferation of genetic association testing and, ultimately, personalized medicine which focuses on preventing disease and prolonging life. In the first paper, the following problem is considered: testing the equality of survival functions in the presence of selection bias and intracluster correlation when the assumption of proportional hazards does not hold. The new proposed test is based on a Cramér-von Mises type statistic. The p-value is approximated using an innovative semiparametric bootstrap procedure which implies generating correlated observations according to a non-random design. For simulation scenarios of departures from the null hypothesis with crossing survival curves, the Cramer-von Mises statistic clearly outperformed the Wald statistic from the weighted Cox proportional hazards model. The new test was used to analyse the association between a candidate single nucleotide polymorphism (SNP) and breast cancer risk in women carrying a mutation in the BRCA2 tumor suppressor gene. A sequence kernel association test (SKAT) to detect the association between a set of genetic variants and clustered survival outcomes from family studies is developed in the second manuscript. The proposed statistic uses the kinship matrix of the sample to model the residual intra-family correlation between survival outcomes via a Gaussian copula. The test procedure relies on multiple imputation to estimate the contribution of the censored survival outcomes to the score statistic which is a mixture of chi-square distributions. Simulation results show that the new kinship-adjusted kernel score test controls adequately for the type I error rate. The new test was applied to a set of SNPs from the TERT locus. The third manuscript aims at presenting the R package gyriq which implements an enhanced version of the genetic association test developed in the second manuscript. The weighted identical-by-state (IBS) kernel matrix is added, genetic association tests and accompanying software currently available for age-at-onset outcomes are briefly reviewed, the implementation of the package is described, and illustrated through examples.
APA, Harvard, Vancouver, ISO, and other styles
6

Guedj, Mickaël. "Méthodes Statistiques pour l’analyse de données génétiques d’association à grande échelle." Evry-Val d'Essonne, 2007. http://www.biblio.univ-evry.fr/theses/2007/2007EVRY0015.pdf.

Full text
Abstract:
Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse. Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux test d’association, les approches multi-marqueurs avec le développement d’une méthode fondée sur la statistique du Score Local, et enfin le problème du test-multiple avec l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien
The increasing availability of dense Single Nucleotide Polymorphisms (SNPs) maps due to rapid improvements in Molecular Biology and genotyping technologies have recently led geneticists towards genome-wide association studies with hopes of encouraging results concerning our understanding of the genetic basis of complex diseases. The analysis of such high-throughput data implies today new statistical and computational problematic to face, which constitute the main topic of this thesis. After a brief description of the main questions raised by genome-wide association studies, we deal with single-marker approaches by a power study of the main association tests. We consider then the use of multi-markers approaches by focusing on the method we developed which relies on the Local Score. Finally, this thesis also deals with the multiple-testing problem: our Local Score-based approach circumvents this problem by reducing the number of tests; in parallel, we present an estimation of the Local False Discovery Rate by a simple Gaussian mixed model
APA, Harvard, Vancouver, ISO, and other styles
7

Di, Giacomo Daniela. "Développement de méthodes moléculaires pour la détection et l'interprétation de mutations : applications aux cancers du colon et aux prédispositions génétiques aux cancers du sein et de l'ovaire." Rouen, 2013. http://www.theses.fr/2013ROUENR02.

Full text
Abstract:
The first part of this thesis work is focused on the sensitive detection of KRAS and BRAF mutations in primary tumors of patients affected by metastatic colon cancer. The first line treatment of these patients in the department of Oncology of the S. Salvatore hospital in L'Aquila is based on a triple chemotherapy combined with an anti-angiogenic treatment (anti-VGFR; Bebacizumab). In order to determine the KRAS and BRAF status of these tumors we used a protocol based on the SnaPshot method. In a series of 59 patients, 3I tumors (53%) were found wild-type and 28 (47%) had mutations in codons 12 or 13 of KRAS. No mutation was found in BRAF. We found no significant clinical difference, using this therapeutic protocol, between the KRAS wild-type group and the mutant group. However, the KRAS mutation c. 35G>A (Glyl2Asp), found in 15 patients (25%), was found significantly associated with a worse prognosis of overall survival. The second part of this thesis is centered on the interpretation of variants of unknown significance (VUS), found in families with genetic predisposition to breast and ovarian tumors. We focused our work on the effect of VUS on mRNA splicing, by using a functional splicing assay based on the transient transfection of splicing reporter minigenes. BRCA2 exon 7 was selected as a model of exonic regulation of splicing. We tested a total of 32 sequence variants or mutations in this exon and found that 11 increased at various levels the exclusion of this exon, whereas 22 were neutral or induced slight increases of inclusion. By using a minigene that detects splicing enhancer activity, we showed, for most of the 11 variants, an alteration of exonic splicing regulatory elements. Moreover, we used this large series of sequence changes with experimentally demonstrated effects on splicing to validate a method recently proposed by Ke et al. , 2011 (L. Chasin group) for the prediction of the effects of mutations on exonic splicing regulation
La prima parte di questo lavoro di tesi riguarda la ricerca sensibile di mutazioni nei geni KRAS e BRAF in tumori primari di pazienti affetti da cancro del colon metastatico. Il trattamento in prima linea di questi pazienti, seguiti nel reparto di Oncologia dell'Ospedale S. Salvatore di L'Aquila, è basato su una triplice chemioterapia combinata con un trattamento anti-angiogenico (anti-VGFR; Bevacizumab). Per il genotipaggio del DNA tumorale abbiamo utilizzato la metodica SNaPshot, seguendo il protocollo messo a punto a Rouen, nei laboratori di Genetica somatica dei tumori. Questa metodica, infatti, permette di rilevare mutazioni anche in campioni contenenti una bassa percentuale di cellule tumorali. Su una serie di 59 pazienti, 31 (53%) sono risultati wild-type e 28 (47%) mutati KRAS (codoni 12 e 13). In questa serie di pazienti non sono state rilevate mutazioni nel gene BRAF. Per quanto riguarda l'evoluzione clinica, nel corso del protocollo terapeutico utilizzato, non è stata trovata nessuna differenza significativa tra il gruppo KRAS wild-type e KRAS mutato. Tuttavia, per questi pazienti trattati con triplice chemioterapia più Bevacizumab, la mutazione c. 35G>A (Gly12Asp), sul gene KRAS, trovata in 15 pazienti (25%), è stata associata significativamente ad una prognosi sfavorevole di sopravvivenza globale. La seconda parte di questa tesi è incentrata sull'interpretazione di varianti di sequenza di significato sconosciuto (VUS), trovate in famiglie con predisposizione genetica al tumore del seno e dell'ovaio, con un interesse particolare sull'effetto che queste varianti di sequenza hanno sullo splicing dell'RNA messaggero. Questo lavoro è stato realizzato in gran parte nell'Unità INSERM U1079, della facoltà di Medicina e Farmacia dell'Università di Rouen, utilizzando sistematicamente un test funzionale di splicing basato sulla trasfezione transitoria di minigeni che portano il cambio di sequenza. In una prima fase, il test, che si avvale di routine dell'utilizzo del minigene pCAS-2 messo a punto nell'Unità INSERM U1079, è stato utilizzato per studiare delle serie importanti di VUS trovate nella rete dei laboratori di diagnostica molecolare francesi o nei laboratori di diagnostica molecolare di L'Aquila e di Roma. Il progetto è stato focalizzato successivamente su un esone particolare del gene BRCA2, l'esone 7, selezionato come modello di regolazione esonica di splicing. Il lavoro descritto in questa tesi si incentra su un totale di 32 varianti di sequenza di questo esone analizzate nel minigene pCAS-2, nonché una gran parte anche nel minigene pcDNA-Dup, sviluppato nei laboratori INSERM U1079, che permette di individuare le variazioni di attività "enhancer di splicing" associate con i cambi di sequenza. Queste 32 varianti sono state anche classificate in due gruppi, in base al loro effetto sulla regolazione esonica di splicing: 11 aumentano, con livelli differenti, l'esclusione dell'esone 7 di BRCA2; 22 non aumentano l'esclusione. Questa importante serie di varianti di sequenza con effetti accertati sulla regolazione dello splicing ci ha permesso di validare un nuovo metodo per prevedere mutazioni esoniche di splicing (Ke et al. , 2011). Gli autori di questo metodo hanno condotto un'analisi sperimentale high-throughput sugli effetti di tutti i possibili 4096 esameri, inseriti in esoni modello, in diverse posizioni e assegnando a ciascun esamero uno "score" di inclusione/esclusione dell'esone. Noi abbiamo utilizzato questi scores per sviluppare una strategia di predizione dell'effetto delle varianti di sequenza studiate sperimentalmente nell'esone 7 di BRCA2. E' da notare come le predizioni del nuovo metodo basato sugli scores di esameri definiti da Ke et al. , 2011, sono risultate perfettamente concordanti con i risultati ottenuti, fatta eccezione per due VUS situate nella stessa posizione nucleotidica, per le quali non è stato osservato l'effetto previsto sullo splicing. I contributi maggiori di questa sezione della tesi sono stati la cartografia dettagliata degli elementi di regolazione esonici di splicing nell'esone 7 di BRCA2 e la validazione di una metodica di predizione dell'effetto che varianti di sequenza hanno su questa regolazione. Abbiamo dimostrato che questa nuova metodica di predizione è più affidabile dei metodi precedenti e proponiamo che questa possa essere incorporata attraverso programmi informatici adeguati nell'analisi di routine delle numerose varianti di sequenza osservate nelle attività di sequenziamento di nuova generazione. Questo lavoro contribuisce all'interpretazione delle VUS trovate in geni predisponenti al cancro in quanto dimostra che le variazioni di sequenza dell'esone, spesso hanno un impatto sulla maturazione dell'RNA messaggero, non solo per le modificazioni dei siti di splicing, ma anche per l'alterazione degli elementi esonici di regolazione. Gli effetti di queste alterazioni sono molto spesso parziali, il che rende difficile definire la loro eventuale patogenicità. Si propone di rafforzare studi multicentrici in modo da poter combinare i dati provenienti da diverse fonti, tra cui la struttura familiare, la segregazione di VUS, i dati clinici e le caratteristiche del tumore per definire un consenso per l'interpretazione di questi difetti parziali splicing
La première partie de ce travail de thèse porte sur la détection sensible des mutations des gènes KRAS et BRAF dans les tumeurs primaires de patients atteints de cancer du colon métastasique. Le traitement de première ligne de ces patients, suivis dans le service d'Oncologie de l'Hôpital universitaire San Salvatore de L'Aquila, est basé sur une triple chimiothérapie combinée avec un traitement anti-angiogénique (anti-VGFR ; Bevacizumab). Nous avons utilisé pour le génotypage de l'ADN tumoral la méthode SNaPshot, d'après le protocole mis au point à Rouen, dans le laboratoire de Génétique Somatique des Tumeurs, car cette méthode permet de détecter des mutations même dans des échantillons contenant une faible proportion de cellules tumorales. Sur une série de 59 patients, 31 (53%) ont été trouvés sauvages et 28 (47%) ont été trouvés mutés dans KRAS (codons 12 et 13). Aucune mutation BRAF n'a été trouvée dans cette série. Aucune différence significative parmi les groupes KRAS sauvage et KRAS muté n'a été trouvée dans l'évolution clinique, au cours du protocole thérapeutique utilisé. Cependant, pour ces patients traités par triple chimiothérapie plus Bevacizumab, la mutation c. 35G>A (Glyl2Asp), trouvée dans 15 patients (25%), était associée significativement à un mauvais pronostic de survie globale. La deuxième partie de cette thèse a porté sur l'interprétation des variations de séquence de signification inconnue (VSI), trouvées dans des familles avec prédisposition génétique aux cancers du sein et de l'ovaire, avec un intérêt particulier pour l'effet de ces variations de séquence sur l'épissage de l'ARN messager. Ce travail a été réalisé en grande partie dans l'Unité Inserm U1079, à la Faculté de Médecine et Pharmacie de l'Université de Rouen, en utilisant systématiquement les tests fonctionnels crépissage basés sur la transfection transitoire de minigènes, portant les changements de séquence. Dans une première phase, le test de routine basé sur le minigène pCAS-2, développé dans l'Unité Inserm U1079, a été utilisé pour étudier des séries importantes de VSI trouvés dans les laboratoires de diagnostic moléculaire du réseau BRCA français ou dans les laboratoires de diagnostic moléculaire de L'Aquila et de Rome. Le projet a été ensuite focalisé sur un exon particulier du gène BRCA2, l'exon 7, choisi comme modèle de régulation exonique de l'épissage. Les travaux décrits dans cette thèse portent sur un total de 32 changements de séquence de cet exon, testés dans le minigène pCAS-2 et en grande partie également dans le minigène pcDNA-Dup, développé dans le laboratoire Inserm U1079, qui permet de détecter les variations d'activité « enhancer d'épissage » associées avec les changements de séquence. Ces 32 changements ont été ainsi classés en deux groupes, selon leur effet sur la régulation exonique de l'épissage : 11 augmentent, avec des degrés différents, l'exclusion de l'exon 7 de BRCA2, et 22 n'augmentent pas l'exclusion. Cette série importante de variations de séquence avec effets établis sur la régulation de l'épissage nous a permis de valider une nouvelle méthode pour la prédiction des mutations exoniques d'épissage (Ke et al. , 2011). Ces auteurs ont réalisé une analyse expérimentale à haut débit de l'effet de tous les 4096 hexamères possibles, insérés dans des exons modèles, à plusieurs positions et ont attribué à chaque hexamère un « score » d'inclusion/exclusion d'exon. Nous avons utilisé ces scores pour développer une stratégie prédictive de l'effet des variations de séquence étudiées expérimentalement dans l'exon 7 de BRCA2. De façon remarquable, le prédictions de la nouvelle méthode basée sur les scores d'hexamères définis par Ke et al. , 2011 ont été parfaitement concordantes avec les résultats obtenus, à l'exception de deux VSI, situés à la même position nucléotidique, pour lesquels un effet prévu sur l'épissage n'a pas été observé. Les contributions majeures de cette partie du travail de thèse sont la cartographie détaillée des éléments de régulation exonique de l'épissage dans l'exon 7 de BRCA2 et la validation d'une méthode de prédiction de l'effet de changements de séquence sur cette régulation. Nous avons montré que cette nouvelle méthode de prédiction est plus fiable que les méthodes précédentes et nous proposons qu'elle soit intégrée, sous la forme de programmes informatiques appropriés, dans l'analyse de routine des nombreuses variations de séquence observées dans les activités de séquençage de nouvelle génération. Ce travail contribue à l'interprétation des VSI trouvés dans les gènes de prédisposition aux cancers, car il montre que les variations exoniques de séquence ont souvent un impact sur la maturation de l'ARN messager, non seulement par la modification des sites d'épissage, mais aussi par l'altération d'éléments de régulation exonique. Les effets de ces altérations sont le plus souvent partiels, ce qui complique la définition de leur pathogénicité éventuelle. Nous proposons le renforcement d'études multicentriques permettant de combiner les données provenant de plusieurs sources, notamment la structure familiale, la ségrégation du VSI, les données cliniques et les caractéristiques tumorales, afin de définir un consensus pour l'interprétation de ces défauts partiels de l'épissage
APA, Harvard, Vancouver, ISO, and other styles
8

Roldan, Dana Leticia. "Détection de QTL : interaction entre dispositif expérimental et méthodes statistiques." Toulouse 3, 2011. http://thesesups.ups-tlse.fr/1395/.

Full text
Abstract:
Les régions du génome portant des polymorphismes associés à la variation des caractères quantitatifs sont nommées en anglais " quantitatif trait loci " (QTL). Jusqu'à récemment la cartographie des QTL était principalement basée sur des marqueurs microsatellites. La densité de cartes de microsatellites est telle que la détection des associations entre les marqueurs et les QTLs ne peut être basée que sur l'analyse de liaison (LA), où la structure familiale est importante. Une fois qu'une région chromosomique a été identifiée comme porteuse d'un QTL putatif, plus de marqueurs doivent être développés pour obtenir une densité plus élevée dans cette région. Cette cartographie fine doit réduire suffisamment l'incertitude sur la position du QTL pour que l'identification des mutations de(s) gène(s) devienne faisable. Les nouveaux marqueurs SNP rendent possible cet objectif et permettent la cartographie fine du QTL sur la base du déséquilibre de liaison (LD) entre certains allèles marqueurs et le QTL. Le choix de la structure génétique de la population expérimentale pour cette cartographie fine par l'analyse conjointe des transmissions intrafamille et du déséquilibre de liaison dans la population générale (approche dites LDLA) se pose après une étape de primo localisation par analyse de liaison, ou directement quand la primo détection et la localisation fine sont confondues dans une seule étape de cartographie. Cette question est abordée dans ce travail. La démarche de cette thèse a été construite en trois étapes : (i) Validation d'une nouvelle méthode LDLA de type régression linéaire (Legarra et Fernando, 2009) et comparaison numérique par simulations de cette méthode avec la méthode de composantes de variance basée sur l'estimation des probabilités IBD (identical by descendant) de Meuwissen et al. , (2002). La méthode par régression est généralement aussi précise et toujours beaucoup plus rapide que la méthode de Meuwissen et al. (2002). (ii) Optimisation, sur la base de la méthode de régression, des protocoles expérimentaux définis par le nombre de descendants par père et le type de structure (demi-frères et un mélange de pleins-et demi-frères). Nous trouvons que le QTL est localisé plus précisément en utilisant les méthodes LDLA que LA et que la structure du dispositif expérimental et la taille des haplotypes ont un impact considérable sur la précision de la localisation d'un QTL. Un équilibre entre le nombre et la taille des familles est à déterminer selon les caractéristiques de l'application pratique (longueur du segment exploré, densité en marqueurs, taille de la population totale etc. . . ). (iii) Application des méthodes de cartographie au cas de la production de laine chez le mouton, un exemple possible parmi d'autres caractères. Dans un premier temps, nous avons appliqué l'analyse de liaison à une population de Merinos Argentins sur laquelle ont été mesurés des caractères de production de laine. Cette population comprenait 617 individus répartis en 10 familles de demi-frères de père. 48 microsatellites ont été utilisés pour marquer 280,7 cM dans des régions du génome à priori intéressantes. Des QTL ont été trouvés, notamment un QTL affectant le caractère coefficient de variation du diamètre de fibres à 67,6 cM sur le chromosome 11. Dans une seconde étape, nous avons évalué, pour les caractéristiques particulières de cette population, les recommandations de la partie (ii) pour l'organisation d'un protocole LDLA de cartographie fine dans cette population réelle. Plusieurs situations ont été envisagées en changeant le nombre de descendants par famille et la densité des marqueurs. Ce travail nous a permis de faire des recommandations pratiques pour affiner la localisation des QTL de laine
Genomic regions carrying polymorphisms associated with variation in quantitative traits are termed quantitative trait loci (QTL). Until recently, mapping QTL was mainly based on microsatellite markers. The density of these markers is such that detection of associations between markers and QTL can only be based on linkage analysis (LA), and a family structured design is needed. Once a chromosomal region has been identified to carry a putative QTL, more markers should be developed at a higher density within that region. Tightly linked markers are needed for sufficiently narrowing down the putative QTL position such that finding actual gene mutations becomes feasible. The new SNP markers make this objective realistic, allowing fine mapping based on linkage disequilibrium (LD) of these markers and QTL across families. Designing experiments aiming at fine mapping QTL combining LD and LA (LDLA) is a question raised after a primo localisation obtained from classical family LA, or directly where primo and fine localisation steps are confounded. Questions related to this designing problem were addressed in this thesis: how should one balance family size and number in LDLA design? What is the best LDLA protocol to fine map QTL that were previously roughly localised in a classical LA analysis?. Three steps were followed: (i) Evaluation of a new LDLA method based on regression (Legarra and Fernando, 2009) and numerical comparison of this method with a variance component IBD (identical by descendant) based method (Meuwissen et al. , 2002). The regression approach appeared to be generally as precise as the Meuwissen et al. (2002) method and always much faster. (ii) Design optimization, using this LDLA regression technique, in terms of number of progenies by sire, and type of families (half-sib to mixture full- and half-sib). We found that QTL is more exactly localised with LDLA rather than LA and that experimental structure as well as haplotypes sizes have a big impact on this localisation. A balance between family number and size must be found depending on the case characteristics (explored segment length, marker density, total population size, etc. . . ). (iii) Application of the mapping method to the wool production traits, an example among other of quantitative traits. In the first stage familial linkage analysis was applied to real half-sibs Merino sheep population measured for wool traits. This population consisted in 617 individuals belonging to 10 sire half-sibs. Forty eight microsatellites were used, covering 280. 70 cM in candidate areas. QTLs were found, in particular affecting the fibre diameter coefficient of variation at position 67. 60 cM on OAR11. In a second stage, we evaluated, considering the specificity of our ovine population, the recommendations established after the step (ii) concerning the organisation of a LDLA design. This work allowed as to make practical conclusions for a fine mapping of wool trait QTL in our population
APA, Harvard, Vancouver, ISO, and other styles
9

Privé, Florian. "Genetic risk score based on statistical learning Efficient analysis of large-scale genome-wide data with two R packages: bigstatsr and bigsnpr Efficient implementation of penalized regression for genetic risk prediction Making the most of Clumping and Thresholding for polygenic scores." Thesis, Université Grenoble Alpes (ComUE), 2019. http://www.theses.fr/2019GREAS024.

Full text
Abstract:
Le génotypage devient de moins en moins cher, rendant les données de génotypes disponibles pour des millions d’individus. Par ailleurs, l’imputation permet d’obtenir l’information génotypique pour des millions de positions de l’ADN, capturant l’essentiel de la variation génétique du génome humain. Compte tenu de la richesse des données et du fait que de nombreux traits et maladies sont héréditaires (par exemple, la génétique peut expliquer 80% de la variation de la taille dans la population), il est envisagé d’utiliser des modèles prédictifs basés sur l’information génétique dans le cadre d’une médecine personnalisée.Au cours de ma thèse, je me suis concentré sur l’amélioration de la capacité prédictive des modèles polygéniques. Les modèles prédictifs faisant partie d’une analyse statistique plus large des jeux de données, j’ai développé des outils permettant l’analyse exploratoire de grands jeux de données, constitués de deux packages R/C++ décrits dans la première partie de ma thèse. Ensuite, j’ai développé une implémentation efficace de larégression pénalisée pour construire des modèles polygéniques basés sur des centaines de milliers d’individus génotypés. Enfin, j’ai amélioré la méthode appelée “clumpingand thresholding”, qui est la méthode polygénique la plus largement utilisée et qui estbasée sur des statistiques résumées plus largement accessibles par rapport aux données individuelles.Dans l’ensemble, j’ai appliqué de nombreux concepts d’apprentissage statistique aux données génétiques. J’ai utilisé du “extreme gradient boosting” pour imputer des variants génotypés, du “feature engineering” pour capturer des effets récessifs et dominants dans une régression pénalisée, et du “parameter tuning” et des “stacked regres-sions” pour améliorer les modèles polygéniques prédictifs. L’apprentissage statistique n’est pour l’instant pas très utilisé en génétique humaine et ma thèse est une tentative pour changer cela
Genotyping is becoming cheaper, making genotype data available for millions of indi-viduals. Moreover, imputation enables to get genotype information at millions of locicapturing most of the genetic variation in the human genome. Given such large data andthe fact that many traits and diseases are heritable (e.g. 80% of the variation of heightin the population can be explained by genetics), it is envisioned that predictive modelsbased on genetic information will be part of a personalized medicine.In my thesis work, I focused on improving predictive ability of polygenic models.Because prediction modeling is part of a larger statistical analysis of datasets, I de-veloped tools to allow flexible exploratory analyses of large datasets, which consist intwo R/C++ packages described in the first part of my thesis. Then, I developed someefficient implementation of penalized regression to build polygenic models based onhundreds of thousands of genotyped individuals. Finally, I improved the “clumping andthresholding” method, which is the most widely used polygenic method and is based onsummary statistics that are widely available as compared to individual-level data.Overall, I applied many concepts of statistical learning to genetic data. I used ex-treme gradient boosting for imputing genotyped variants, feature engineering to cap-ture recessive and dominant effects in penalized regression, and parameter tuning andstacked regressions to improve polygenic prediction. Statistical learning is not widelyused in human genetics and my thesis is an attempt to change that
APA, Harvard, Vancouver, ISO, and other styles
10

Guedj, Mickael. "Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle." Phd thesis, Université d'Evry-Val d'Essonne, 2007. http://tel.archives-ouvertes.fr/tel-00169411.

Full text
Abstract:
Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse.
Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux tests d'association, ainsi que de leur combinaisons. Nous considérons ensuite l'utilisation d'approches multi-marqueurs avec le développement d'une méthode d'analyse fondée à partir de la statistique du Score Local. Celle-ci permet d'identifier des associations statistiques à partir de régions génomiques complètes, et non plus des marqueurs pris individuellement. Il s'agit d'une méthode simple, rapide et flexible pour laquelle nous évaluons les performances sur des données d'association à grande échelle simulées et réelles. Enfin ce travail traite également du problème du test-multiple, lié aux nombre de tests à réaliser lors de l'analyse de données génétiques ou génomiques haut-débit. La méthode que nous proposons à partir du Score Local prend en compte ce problème. Nous évoquons par ailleurs l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien.
L'ensemble des méthodes décrites dans ce manuscrit ont été implémentées à travers trois logiciels disponibles sur le site du laboratoire Statistique et Génome : fueatest, LHiSA et kerfdr.
APA, Harvard, Vancouver, ISO, and other styles

Books on the topic "Dépistage génétique – Méthodes statistiques"

1

Christie, B. R. The diallel cross: Its analysis and interpretation. Guelph, Ont: University of Guelph, 1988.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
2

1960-, Guerra Rudy, and Goldstein Darlene Renee, eds. Meta-analysis and combining information in genetics and genomics. Boca Raton: Chapman & Hall/CRC, 2009.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
3

author, Thompson Simon G., ed. Mendelian randomization: Methods for using genetic variants in causal estimation. Boca Raton: CRC Press, Taylor & Francis Group, 2015.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
4

S, Kang Manjit, ed. GGE biplot analysis: A graphical tool for breeders, geneticists, and agronomists. Boca Raton, Fla: CRC Press, 2003.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
5

Introduction to statistical methods in modern genetics. Amsterdam, Netherlands: Gordon & Breach Science Publishers, 2000.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
6

Introduction to Computational Biology. 1995.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
7

Waterman, Michael S. Introduction to Computational Biology: Maps, Sequences and Genomes. Taylor & Francis Group, 2018.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
8

Waterman, Michael S. Introduction to Computational Biology: Maps, Sequences and Genomes. Taylor & Francis Group, 2018.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
9

Introduction to Computational Biology: Maps, Sequences and Genomes, Second Edition. CRC Press LLC, 2012.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
10

Introduction to computational biology: Maps, sequences, and genomes : interdisciplinary statistics. Boca Raton, Fla: Chapman & Hall/CRC, 1995.

Find full text
APA, Harvard, Vancouver, ISO, and other styles

Book chapters on the topic "Dépistage génétique – Méthodes statistiques"

1

VOET, Inessa, and Violaine NICOLAS. "Phylogéographie." In La biogéographie, 71–93. ISTE Group, 2022. http://dx.doi.org/10.51926/iste.9060.ch3.

Full text
Abstract:
La phylogéographie s'efforce de comprendre les processus qui sous-tendent la répartition géographique de la variation génétique au sein d'espèces étroitement apparentées et entre elles. Ce chapitre explique ce qu'est la phylogéographie et présente les développements méthodologiques et conceptuels dans ce domaine. Au cours des premières décennies de la phylogéographie, la plupart des études ont porté sur des analyses d'ADNmt exclusivement animal. La large utilisation de ce génome cytoplasmique dans les études phylogéographiques s'explique par le fait qu'il possède plusieurs propriétés phylogénétiques favorables. Les méthodes statistiques phylogéographiques se répartissent généralement en deux catégories : celles qui adoptent une approche statistique sommaire et les analyses de vraisemblance ou bayésiennes. Les études phylogéographiques comparatives peuvent révéler les façons dont des communautés ou des assemblages entiers sont structurés par des réponses partagées à un passé commun et à un événement historique unique propre à une espèce. Depuis ses débuts, la phylogéographie comparative utilise la concordance des modèles de variation génétique comme critère d'évaluation des hypothèses.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography