Dissertations / Theses on the topic 'EXOME SEQUENCING DATA'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 15 dissertations / theses for your research on the topic 'EXOME SEQUENCING DATA.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Sigurgeirsson, Benjamín. "Analysis of RNA and DNA sequencing data : Improved bioinformatics applications." Doctoral thesis, KTH, Genteknologi, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-184158.
Full textQC 20160329
Zhang, Lu, and 张璐. "Identification and prioritization of single nucleotide variation for Mendelian disorders from whole exome sequencing data." Thesis, The University of Hong Kong (Pokfulam, Hong Kong), 2012. http://hub.hku.hk/bib/B48521905.
Full textpublished_or_final_version
Paediatrics and Adolescent Medicine
Master
Master of Philosophy
Carraro, Marco. "Development of bioinformatics tools to predict disease predisposition from Next Generation Sequencing (NGS) data." Doctoral thesis, Università degli studi di Padova, 2018. http://hdl.handle.net/11577/3426807.
Full textIl completamento del progetto genoma umano ha aperto numerosi nuovi orizzonti di ricerca. Tra questi, la possibilità di conoscere le basi genetiche che rendono ogni individuo suscettibile alle diverse malattie ha aperto la strada ad una nuova rivoluzione: l’avvento della medicina personalizzata. Le tecnologie di sequenziamento del DNA hanno subito una notevole evoluzione, ed oggi il prezzo per sequenziare un genoma è ormai prossimo alla soglia psicologica dei $ 1 000. La promessa di identificare varianti genetiche che influenzano il nostro stile di vita e che ci rendono suscettibili alle malattie sta quindi diventando realtà. Tuttavia, molto lavoro è ancora necessario perché questo nuovo tipo di medicina possa trasformarsi in realtà. In particolare la sfida oggi non è più data dalla generazione dei dati di sequenziamento, ma è rappresentata invece dalla loro interpretazione. L'obiettivo del mio progetto di dottorato è lo sviluppo di metodi bioinformatici per predire la predisposizione a patologie, a partire da dati di sequenziamento. Molti di questi metodi sono stati testati nel contesto del Critical Assessment of Genome Interpretation (CAGI), una competizione internazionale focalizzata nel definire lo stato dell’arte per l’interpretazione del genoma, ottenendo sempre buoni risultati. Durante il mio progetto di dottorato ho avuto l'opportunità di affrontare l’intero spettro delle sfide che devono essere gestite per tradurre le nuove capacità di sequenziamento del genoma in pratica clinica. Uno dei problemi principali che si devono gestire quando si ha a che fare con dati di sequenziamento è l'interpretazione della patogenicità delle mutazioni. Decine di predittori sono stati creati per separare varianti neutrali dalle mutazioni che possono essere causa di un fenotipo patologico. In questo contesto il problema del benchmarking è fondamentale, in quanto le prestazioni di questi tool sono di solito testate su diversi dataset di varianti, rendendo impossibile un confronto di performance. Per affrontare questo problema, una comparazione dell’accuratezza di questi predittori è stata effettuata su un set di mutazioni con fenotipo ignoto nel contesto del CAGI, realizzando la valutazione per predittori di patogenicità più completa tra tutte le edizioni di questo esperimento collaborativo. La previsione di fenotipi a partire da dati di sequenziamento è un'altra sfida che deve essere affrontata per realizzare le promesse della medicina personalizzata. Durante il mio dottorato ho avuto l'opportunità di sviluppare diversi predittori per fenotipi complessi utilizzando dati provenienti da pannelli genici ed esomi. In questo contesto sono stati affrontati problemi come errori di interpretazione o la sovra interpretazione della patogenicità della varianti, come nel caso della sfida focalizzata sulla predizione di fenotipi a partire dall’Hopkins Clinical Panel. Sono inoltre emersi altri problemi complementari alla previsione di fenotipo, come per esempio la possibile presenza di risultati accidentali. Specifiche strategie di predizione sono state definite lavorando con diversi tipi di dati di sequenziamento. Un esempio è dato dal morbo di Crohn. Tre edizioni del CAGI hanno proposto la sfida di identificare individui sani o affetti da questa patologia infiammatoria utilizzando unicamente dati di sequenziamento dell’esoma. L'analisi dei dataset ha rivelato come la presenza di struttura di popolazione e problemi nella preparazione e sequenziamento degli esomi abbiano compromesso le predizioni per questo fenotipo, generando una sovrastima delle performance di predizione. Tenendo in considerazione questo dato è stata definita una strategia di predizione completamente nuova per questo fenotipo, testata in occasione dell'ultima edizione del CAGI. Dati provenienti da studi di associazione GWAS e l’analisi delle reti di interazione proteica sono stati utilizzati per definire liste di geni coinvolti nell’insorgenza della malattia. Buone performance di predizione sono state ottenute in particolare per gli individui a cui era stata assegnata una elevata probabilità di essere affetti. In ultima istanza, il mio lavoro è stato focalizzato sulla predizione di gruppi sanguigni, sempre a partire da dati di sequenziamento. L'accuratezza dei test sierologici, infatti, è ridotta in caso di gruppi di sangue minori o fenotipi deboli. Incompatibilità per tali gruppi sanguigni possono essere critiche per alcune classi di individui, come nel caso dei pazienti oncoematologici. La nostra strategia di predizione ha sfruttato i dati genotipici per geni che codificano per gruppi sanguigni, presenti in database dedicati, e il principio di nearest neighbour per effettuare le predizioni. L’accuratezza del nostro metodo è stata testata sui sistemi ABO e RhD ottenendo buone performance di predizione. Inoltre le nostre analisi hanno aperto la strada ad un ulteriore aumento delle prestazioni per questo tool.
Fewings, Eleanor Rose. "The use of whole exome sequencing data to identify candidate genes involved in cancer and benign tumour predisposition." Thesis, University of Cambridge, 2019. https://www.repository.cam.ac.uk/handle/1810/285963.
Full textChennen, Kirsley. "Maladies rares et "Big Data" : solutions bioinformatiques vers une analyse guidée par les connaissances : applications aux ciliopathies." Thesis, Strasbourg, 2016. http://www.theses.fr/2016STRAJ076/document.
Full textOver the last decade, biomedical research and medical practice have been revolutionized by the post-genomic era and the emergence of Big Data in biology. The field of rare diseases, are characterized by scarcity from the patient to the domain knowledge. Nevertheless, rare diseases represent a real interest as the fundamental knowledge accumulated as well as the developed therapeutic solutions can also benefit to common underlying disorders. This thesis focuses on the development of new bioinformatics solutions, integrating Big Data and Big Data associated approaches to improve the study of rare diseases. In particular, my work resulted in (i) the creation of PubAthena, a tool for the recommendation of relevant literature updates, (ii) the development of a tool for the analysis of exome datasets, VarScrut, which combines multi-level knowledge to improve the resolution rate
Chakrabortty, Sharmistha. "SNPs and Indels Analysis in Human Genome using Computer Simulation and Sequencing Data." University of Toledo Health Science Campus / OhioLINK, 2017. http://rave.ohiolink.edu/etdc/view?acc_num=mco1501726874739045.
Full textBertoldi, Loris. "Bioinformatics for personal genomics: development and application of bioinformatic procedures for the analysis of genomic data." Doctoral thesis, Università degli studi di Padova, 2018. http://hdl.handle.net/11577/3421950.
Full textNell’ultimo decennio, l’enorme diminuzione del costo del sequenziamento dovuto allo sviluppo di tecnologie ad alto rendimento ha completamente rivoluzionato il modo di approcciare i problemi genetici. In particolare, il sequenziamento dell’intero esoma e dell’intero genoma stanno contribuendo ad un progresso straordinario nello studio delle varianti genetiche umane, aprendo nuove prospettive nella medicina personalizzata. Essendo un campo relativamente nuovo e in rapido sviluppo, strumenti appropriati e conoscenze specializzate sono richieste per un’efficiente produzione e analisi dei dati. Per rimanere al passo con i tempi, nel 2014, l’Università degli Studi di Padova ha finanziato il progetto strategico BioInfoGen con l’obiettivo di sviluppare tecnologie e competenze nella bioinformatica e nella biologia molecolare applicate alla genomica personalizzata. Lo scopo del mio dottorato è stato quello di contribuire a questa sfida, implementando una serie di strumenti innovativi, al fine di applicarli per investigare e possibilmente risolvere i casi studio inclusi all’interno del progetto. Inizialmente ho sviluppato una pipeline per analizzare i dati Illumina, capace di eseguire in sequenza tutti i processi necessari per passare dai dati grezzi alla scoperta delle varianti sia germinali che somatiche. Le prestazioni del sistema sono state testate mediante controlli interni e tramite la sua applicazione su un gruppo di pazienti affetti da tumore gastrico, ottenendo risultati interessanti. Dopo essere state chiamate, le varianti devono essere annotate al fine di definire alcune loro proprietà come la posizione a livello del trascritto e della proteina, l’impatto sulla sequenza proteica, la patogenicità, ecc. Poiché la maggior parte degli annotatori disponibili presentavano errori sistematici che causavano una bassa coerenza nell’annotazione finale, ho implementato VarPred, un nuovo strumento per l’annotazione delle varianti, che garantisce la migliore accuratezza (>99%) comparato con lo stato dell’arte, mostrando allo stesso tempo buoni tempi di esecuzione. Per facilitare l’utilizzo di VarPred, ho sviluppato un’interfaccia web molto intuitiva, che permette non solo la visualizzazione grafica dei risultati, ma anche una semplice strategia di filtraggio. Inoltre, per un’efficace prioritizzazione mediata dall’utente delle varianti umane, ho sviluppato QueryOR, una piattaforma web adatta alla ricerca all’interno dei geni causativi, ma utile anche per trovare nuove associazioni gene-malattia. QueryOR combina svariate caratteristiche innovative che lo rendono comprensivo, flessibile e facile da usare. La prioritizzazione è raggiunta tramite un processo di selezione positiva che fa emergere le varianti maggiormente significative, piuttosto che filtrare quelle che non soddisfano i criteri imposti. QueryOR è stato usato per analizzare i due casi studio inclusi all’interno del progetto BioInfoGen. In particolare, ha permesso di scoprire le varianti causative dei pazienti affetti da malattie da accumulo lisosomiale, evidenziando inoltre l’efficacia del pannello di sequenziamento sviluppato. Dall’altro lato invece QueryOR ha semplificato l’individuazione del gene LRP2 come possibile candidato per spiegare i soggetti con un fenotipo simile alla malattia di Dent, ma senza alcuna mutazione nei due geni precedentemente descritti come causativi, CLCN5 e OCRL. Come corollario finale, è stata effettuata un’analisi estensiva su varianti esomiche ricorrenti, mostrando come la loro origine possa essere principalmente spiegata da imprecisioni nel genoma di riferimento, tra cui regioni mal assemblate e basi non corrette, piuttosto che da errori piattaforma-specifici.
Hsieh, PingHsun. "Model-Based Population Genetics in Indigenous Humans: Inferences of Demographic History, Adaptive Selection, and African Archaic Admixture using Whole-Genome/Exome Sequencing Data." Diss., The University of Arizona, 2016. http://hdl.handle.net/10150/612540.
Full textNambot, Sophie. "Exploration pangénomique des anomalies du développement de causes rares." Thesis, Bourgogne Franche-Comté, 2019. http://www.theses.fr/2019UBFCI012.
Full textTitle : Genome-wide exploration of congenital anomalies of rare causesKey words : congenital anomalies, exome sequencing, data-sharing, reverse phenotypingCongenital anomalies are a group of diseases that are both clinically and molecularly heterogeneous. They include more than 3,000 monogenic diseases, but only a third of them have a known molecular cause. Although advances in sequencing techniques have identified hundreds of new genes in recent years, many patients remain undiagnosed. The vast genetic heterogeneity of these conditions challenges the conventional diagnostic approach that typically includes clinical expertise, a pan-genomic microarray study and/or targeted analysis of known genes and, recently, exome sequencing targeting the genes already associated with human disease. Until genome sequencing becomes more affordable and the interpretation of its data for diagnostic use is better perceived, we have chosen to explore new strategies to optimize the identification of new molecular bases through exome sequencing.The first article aimed to demonstrate the feasibility and effectiveness of annual reanalysis of negative exome sequencing data in a diagnostic setting. Patients eligible for the study had developmental anomalies, but no molecular cause was established after a standard diagnostic procedure including DNA chromosome analysis and diagnostic exome analysis. This first study yielded a significant number of additional diagnoses, but also identified candidate variants for which we used international data-sharing and reverse phenotyping to establish cohorts of genotypic and/or phenotypic replication and genotype-phenotype correlations. These strategies allowed us to meet the ACMG criteria necessary to establish the pathogenicity of these variants.With this experience, and because we wished to go further in identifying new molecular bases for our patients, we continued the reanalysis project within a research framework. This was the focus of the second article of this thesis. The reanalysis project led to the identification of 17 new genes associated with congenital anomalies. Data-sharing has led to the development of numerous international collaborations and functional studies carried out by specialized teams.The third article illustrated the application of these tools in a syndromic form of ultra-rare intellectual disability. Following a considerable collaborative effort, we were able to accurately describe the phenotype of 25 unreported patients in the literature with pathogenic variants in the TBR1 gene, a candidate gene in autism spectrum disorders associated to intellectual disability.These various studies demonstrate how innovative strategies can be effective for identifying new molecular bases in patients with congenital anomalies. These strategies include exome data reanalysis, reverse phenotyping, and international data-sharing. For patients and their families, knowing the molecular basis of the disease makes it possible to understand the origin of the condition and to put an end to diagnostic wandering. In addition, they are able to learn more about the prognosis and developmental progression, and they can obtain appropriate care management. This information is also essential for reliable genetic counseling, and may offer the possibility of prenatal or even pre-implantation diagnosis. These new diagnoses also give geneticists a chance to understand new physiopathological processes, to develop new diagnostic tests and even to discover new therapeutic targets
GIOVANNETTI, AGNESE. "Analysis of non-coding DNA from whole exome sequencing data." Doctoral thesis, 2019. http://hdl.handle.net/11573/1234470.
Full textGaronzi, Marianna. "ANALYSIS AND INTERPRETATION OF WHOLE EXOME SEQUENCING DATA OF LEUKEMIA PATIENTS." Doctoral thesis, 2017. http://hdl.handle.net/11562/960651.
Full textLee, Cheng-Yang, and 李正揚. "Evaluation and integration of somatic copy number detection tools for whole-exome sequencing data." Thesis, 2016. http://ndltd.ncl.edu.tw/handle/v3rnqf.
Full text臺北醫學大學
醫學資訊研究所
104
Copy Number Variations (CNVs) are a form of structural variation that manifest as amplifications, deletions, translocations, and insertions in the genome with segment size larger than 50 bp. Previous studies have reported that CNVs are associated with biological functions of nervous system, cellular development and metabolism in healthy people while also have relationships with diseases such as autism, schizophrenia and obesity. Recent related studies have also uncovered additional important role of CNVs in cancers. With the decreasing costs and high accuracy of next-generation sequencing, whole-exome sequencing ( WES ) has become a dominant method for identifying CNVs in both research and clinical settings. Since the accurate identification of CNVs may affect successful clinical diagnosis and prognosis, substantial efforts have been devoted to develop tools for detecting CNVs for WES, but these tools have their own limitation. However, no single method can achieve the complete detection of all kinds of CNV events. Accordingly, we tried to evaluate as many detection tools as possible by using WES data obtained from TCGA (The Cancer Genome Atlas) GChub, to achieve a fully consideration and evaluation of existing somatic copy number variations ( somatic CNVs, SCNVs ) detection tools. Furthermore, we also constructed and integrated platform for CNVs detection in VM. After evaluation, the study found that ExomeCNV and VEGAWES could have higher accuracy for detecting CNVs; EXCAVATOR could have preference for large CNVs; VarScan2 could need more time to execute CNVs detecting. The study also made a table to summarize all result of evaluation and the table will be convenient for users to find tools which could be fitted their own experimental design. Finally, users can use a simple command line to execute analysis pipeline made by the study to detect CNVs.
CHAHAL, ASHISH. "ANALYSIS AND ANNOTATION OF EXOME SEQUENCING DATA TO IDENTIFY AND PRIORITIZE GENES RESPONSIBLE FOR PROSTATE ADENOCARCINOMA." Thesis, 2015. http://dspace.dtu.ac.in:8080/jspui/handle/repository/15573.
Full textChou, Kai-Ming, and 周楷茗. "A method to screen gene variations that are associated with familial cancers based on the next generation exome sequencing data." Thesis, 2013. http://ndltd.ncl.edu.tw/handle/24640394375292814085.
Full text國立陽明大學
生物醫學資訊研究所
101
In this study, I took advantage of exome sequencing technology to determine genetic variants that would cause hereditary cancers. The methods used in this study have three parts: preprocessing (mapping and quality assessment), filtering and consequence prediction. For preprocessing, we used Burrows-Wheeler Aligner (BWA) and Samtools to align reads and to pick up variants. A quality assessment was then undertaken on the basis of exome probe coverage. The results from preprocessing step and the candidate variants found in common population were marked as background. Such variants were unlikely to cause hereditary disease. Ensembl perl APIs were used to annotate consequences of each candidate variants. We also used PolyPhen, SIFT and Condel to predict the severity of each candidate variants. This method has been applied to investigate cases of rare hereditary disease discovered in Taiwan population. These candidate SNVs in other families that have the same hereditary cancer should be validated by experimental appraoches. My method could point out candidate variants which might cause hereditary cancer. In principle, this method could also be applied to other diseases using exome sequencing data.
Abaji, Rachid. "Using whole-exome sequencing data in an exome-wide association study approach to identify genetic risk factors influencing acute lymphoblastic leukemia response : a focus on asparaginase complications & vincristine-induced peripheral neuropathy." Thesis, 2018. http://hdl.handle.net/1866/24602.
Full textTreatment of childhood acute lymphoblastic leukemia (ALL), a malignant disorder of lymphoid progenitor cells has improved significantly over the past decades and treatment success rates have surpassed 90% in favorable settings. However, treatment-related toxicities can be life-threatening and cause treatment interruption or cessation. Allergy, pancreatitis and thrombosis are common complications of ALL treatment associated with the use of asparaginase (ASNase), while vincristine-induced peripheral neuropathy (VIPN) is a frequent toxicity of vincristine (VCR). It is a sensitive process and a constant struggle to adjust the dosing regimen to ensure maximum efficacy and minimum toxicity. Pharmacogenetics studies show alterations in the genetic component between individuals can influence the observed variability in treatment response. A better understanding of the molecular basis of this variability in drug effect could significantly improve treatment outcome by allowing the personalization of ALL treatment based on the genetic profile of the patient. Emerging reports suggest the benefit of applying exome analysis to uncover variants associated with complex human traits as well as drug response phenotypes. Our objective in this work was to use available whole-exome sequencing data to perform exome-wide association studies followed by stepwise filtering and validation processes to identify novel variants with a potential to modulate the risk of developing ASNase complications and VIPN. Twelve SNPs were associated with ASNase complications in the discovery cohort including 3 associated with allergy, 3 with pancreatitis and 6 with thrombosis. Of those, rs3809849 in MYBBP1A, rs11556218 in IL16 and rs34708521 in SPEF2 genes were associated with multiple complications and their association with pancreatitis was replicated in an independent validation cohort. As for VCR, three variants were associated with modulating the risk of VIPN: rs2781377 in SYNE2, rs10513762 in MRPL47 and rs3803357 in BAHD1. We also demonstrate a strong combined effect of harbouring multiple risk variants for each of the studied toxicities, and provide internally-validated risk-prediction models based on the weighted genetic risk score method for pancreatitis and VIPN. Furthermore, given the association of the polymorphism in MYBBP1A gene with multiple treatment outcomes, we aimed at understanding how this genetic alteration translates into differences in ASNase treatment response through cell-based functional analysis. Using CRISPR-CAS9 technology we produced gene knockout of PANC1 (pancreatic) cancer cell-lines and tested the difference in viability between the knockouts and wild-type cells following gene deletion and ASNase treatment. Our results suggest a functional role of this gene in modulating the viability, proliferation capacity and the morphology of the knockout cells as well as their sensitivity to ASNase and further advocates the implication of the gene in influencing the outcome of ALL treatment with ASNase. The present work demonstrates that using whole-exome sequencing data in the context of exome-wide association study is a successful “hypothesis-free” strategy for identifying novel genetic markers modulating the effect of childhood ALL treatment and highlights the importance of the synergistic effect of combining risk loci.