Dissertations / Theses on the topic 'Absence of training data'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Absence of training data.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Boxwell, Stephen Arthur. "A CCG-Based Method for Training a Semantic Role Labeler in the Absence of Explicit Syntactic Training Data." The Ohio State University, 2011. http://rave.ohiolink.edu/etdc/view?acc_num=osu1322594816.
Full textWhaley, Steven R. J. "Bayesian analysis of sickness absence data." Thesis, University of Aberdeen, 2003. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.274884.
Full textYousefi, Sepehr. "Credit Risk Management in Absence of Financial and Market Data." Thesis, KTH, Matematisk statistik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-188800.
Full textKreditriskhantering är den enskilt viktigaste delen i banker och finansiella instituts säkerhetsåtgärder mot nedsidor i deras investeringar. En påtaglig svårighet inom ämnet är modelleringen av simultana konkurser. Globalisering ökar antalet parametrar som påverkar samhällsekonomin, vilket i sin tur försvårar etablering av tillförlitliga matematiska modeller. Den prekära situationen förvärras av det faktum att analytiker genomgående saknar tillräcklig data. Konkurskorrelation är allt som oftast kalibrerad med hjälp av information från årsrapporter eller marknaden. Dessvärre existerar det omständigheter där sådana typer av data är otillgängliga eller otillförlitliga. Samma problematik skapar även svårigheter i skattningen av sannolikheten till konkurs. Uppgifter såsom frekvensen av insolventa företag eller förändringar i kreditbetyg uppdateras i regel årligen, och historisk data täcker i bästa fall 20-25 år. Syftet med detta examensarbete är att ge ett övergripande ramverk för kreditriskhantering i avsaknad av finansiell information och marknadsdata. Detta innefattar att estimera vilken påverkan fluktueringar i makroekonomin har på sannolikheten för konkurs, modellera korrelerade konkurser samt sammanfatta ett ramverk för beräkning av osäkerheten i den estimerade förlustdistributionen. Den första delen av examensarbetet specificerar den så kallade entropy modellen. Denna skattar påverkan av makroekonomin på sannolikheterna för konkurs och ämnar att överträffa statistiska standardmodeller vid små datamängder. Den andra delen specificerar CIMDO, ett ramverk för beräkning av konkurskorrelation när marknads- och företagsdata saknas. Den sista delen framlägger ett ramverk för riskanalys av förlustdistributionen. Det visas att entropy modellen reducerar variansen i regressionskoefficienter men till kostnad av att försämra dess bias. Vidare är det en signifikant skillnad mellan student’s t CIMDO och t-Copula. Det förefaller som om den förstnämnda reducerar osäkerheten i beräkningarna, men inte till den grad att uppenbara slutsatser kan dras.
Nilsson, Maria. "Differences and similarities in work absence behavior : - empirical evidence from micro data." Doctoral thesis, Växjö universitet, Ekonomihögskolan, EHV, 2005. http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-626.
Full textJohnston, Cristin D. "Observation training evaluating a procedure for generating self-rules in the absence of reinforcement /." abstract and full text PDF (UNR users only), 2008. http://0-gateway.proquest.com.innopac.library.unr.edu/openurl?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:dissertation&res_dat=xri:pqdiss&rft_dat=xri:pqdiss:3316373.
Full textMuhammad, Azhar Ranjha, and Adnan Ghalib Ahmad. "Data Analysis and Graph Presentation of Team Training Data." Thesis, Linköpings universitet, Institutionen för datavetenskap, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-66998.
Full textC3Fire
Powers, Richard. "Track-loss detection in the absence of truth data for target tracking in clutter." Connect to online resource, 2007. http://gateway.proquest.com/openurl?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:dissertation&res_dat=xri:pqdiss&rft_dat=xri:pqdiss:3273736.
Full textGoulette, Dana E. "Training assessment and modeling subjective data encapsulation for the National Training Center." Monterey, California. Naval Postgraduate School, 1997. http://hdl.handle.net/10945/9084.
Full textThe National Training Center (NTC) located at Fort Irwin, California performs the critical Army mission of preparing battalion task forces and brigade staffs for combat. The NTC provides a unique opportunity to assess training proficiency. To assist in the training assessment of rotating units, the Army has spent millions of dollars on a state of the art instrumentation system that transmits objective data from all player vehicles and stores the information in a database. Currently, no subjective observer-controller (O/C) observations of training are stored in the database. The primary emphasis of this research is to develop a training assessment system and model subjective data encapsulation to enhance training performance analysis. The assessment system is designed to be incorporated into a relational database that will allow analysis of various measures of performance that provide input for platoon through brigade level After Action Reviews (AAR). Additionally, the database will support methods for simple data manipulation for the purpose of conducting post-rotation analysis and the identification of trends
Chang, Eric I.-Chao. "Improving wordspotting performance with limited training data." Thesis, Massachusetts Institute of Technology, 1995. http://hdl.handle.net/1721.1/38056.
Full textIncludes bibliographical references (leaves 149-155).
by Eric I-Chao Chang.
Ph.D.
Georgsson, Adam, and Olof Christensson. "Visualization of training data reportedby football players." Thesis, Blekinge Tekniska Högskola, Institutionen för datalogi och datorsystemteknik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:bth-16694.
Full textAlves, André Ribeiro. "Curricular training report in clinical data management." Master's thesis, Universidade de Aveiro, 2013. http://hdl.handle.net/10773/10875.
Full textEste relatório descreve as actividades desenvolvidas no contexto do estágio de 9 meses realizado na Unidade de Gestão de dados da Eurotrials com inicio em Setembro de 2011 e fim em Maio de 2012. A Eurotrials é uma empresa de consultoria científica que presta serviços à indústria farmacêutica e biotecnologia, nomeadamente na condução de ensaios clínicos. No processo do desenvolvimento de um novo medicamento os ensaios clínicos são a ferramenta mais importante de forma a verificar a segurança e eficácia da substância. A gestão de dados cínicos tem um papel muito importante na condução de ensaios clínicos e tem como objectivo gerar dados de grande qualidade e robustos para que possam ser analisados. A equipa de gestão de dados participa em actividades que vão desde o planeamento do estudo até à sua conclusão. As principais actividades exercidas no âmbito da gestão de dados foram o desenho do caderno de recolha de dados, bem como a criação da base de dados, gestão de discrepâncias e padronização de dados.
This report describes the activities undertaken in the context of a Curricular training with a duration of 9 months in the Data Management Unit at Eurotrials starting in September 2011 and end in May 2012. Eurotrials is a contract research organization that provides services to the pharmaceutical and biotechnology industries, namely clinical trial conduction. In the drug development process, clinical trials are the most important tool to verify if the drug is secure and effective. The field of clinical data management has a very important role in clinical trials conduction and aims to generate high-quality and reliable data so that it can be analyzed. The data management team is engaged in activities ranging from the design of the study until their completion. The main activates performed regarding clinical data management were the design of the case report form, database design, discrepancies management and data standardization.
Nicholson, Alexander Abu-Mostafa Yaser S. "Generalization error estimates and training data valuation /." Diss., Pasadena, Calif. : California Institute of Technology, 2002. http://resolver.caltech.edu/CaltechETD:etd-09062005-083717.
Full textFraser, D., T. Marder, Pamela J. Mims, and Bree Jimenez. "Training Teachers in Data-Based Decision Making." Digital Commons @ East Tennessee State University, 2015. https://dc.etsu.edu/etsu-works/188.
Full textZama, Ramirez Pierluigi <1992>. "Deep Scene Understanding with Limited Training Data." Doctoral thesis, Alma Mater Studiorum - Università di Bologna, 2021. http://amsdottorato.unibo.it/9815/1/zamaramirez_pierluigi_tesi.pdf.
Full textVan, Eenoo Edward Charles Jr. "Theoretically Valid Aggregates in the Absence of Homothetic Preferences, Separable Utility, and Complete Price Data." Thesis, Virginia Tech, 1998. http://hdl.handle.net/10919/9782.
Full textMaster of Science
McLaughlin, N. R. "Robust multimodal person identification given limited training data." Thesis, Queen's University Belfast, 2013. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.579747.
Full textAnastasiadis, Aristoklis. "Neural networks training and applications using biological data." Thesis, Birkbeck (University of London), 2006. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.428055.
Full textDiffner, Fredrik, and Hovig Manjikian. "Training a Neural Network using Synthetically Generated Data." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-280334.
Full textVid utvecklandet av maskininlärningsmodeller kan avsaknaden av ett tillräckligt stort dataset för träning utgöra ett problem. En vanlig lösning är att använda syntetiskt genererad data för att antingen utöka eller helt ersätta ett dataset med verklig data. Denna uppsats undersöker prestationen av en maskininlärningsmodell tränad på syntetisk data jämfört med samma modell tränad på verklig data. Detta applicerades på problemet att använda ett konvolutionärt neuralt nätverk för att tyda tecken i bilder från ”naturliga” miljöer. Ett syntetiskt dataset bestående av 1’240’000 samt två stycken dataset med tecken från bilder, Char74K och ICDAR2003, användes. Resultatet visar att en modell tränad på det syntetiska datasetet presterade ca 50% bättre än samma modell tränad på Char74K.
Curry, William. "Interpolation with prediction-error filters and training data /." May be available electronically:, 2008. http://proquest.umi.com/login?COPT=REJTPTU1MTUmSU5UPTAmVkVSPTI=&clientId=12498.
Full textLi, Jiawei. "Person re-identification with limited labeled training data." HKBU Institutional Repository, 2018. https://repository.hkbu.edu.hk/etd_oa/541.
Full textRawls, Allen Worthington. "A systematic approach for improving predicted arrival time using historical data in absence of schedule reliability." View electronic thesis, 2008. http://dl.uncw.edu/etd/2008-1/r1/rawlsa/allenrawls.pdf.
Full textGuo, Zhenyu. "Data famine in big data era : machine learning algorithms for visual object recognition with limited training data." Thesis, University of British Columbia, 2014. http://hdl.handle.net/2429/46412.
Full textGranlund, David. "Economic policy in health care : Sickness absence and pharmaceutical costs." Doctoral thesis, Umeå : Department of Economics, Umeå University, 2007. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-1137.
Full textBailey, Roy Douglas. "Autogenic regulation training (ART), sickness absence, personal problems, time and the emotional-physical stress of student nurses in general training : a report of a longitudinal field investigation." Thesis, University of Hull, 1985. http://hydra.hull.ac.uk/resources/hull:5040.
Full textLavelle, Stephen J. "Fabricating synthetic data in support of training for domestic terrorist activity data mining research." Thesis, Monterey, California. Naval Postgraduate School, 2010. http://hdl.handle.net/10945/5196.
Full textData mining is a mature technology, widespread in both government and industry. The proliferation of data storage in public and private sectors has provided more information than can be expediently processed. Data mining provides a means to extract meaningful conclusions from this growing store of data. In the interests of countering criminal and terrorist activity, data mining has become a focus of law enforcement and government agencies. The use of databases containing information on persons may conflict with privacy rights and laws. Gathering public awareness of government data mining programs and databases has been accompanied with concern and investigation of these programs. Following a review of data mining and privacy issues, in 2008 the National Research Council (NRC) recommended any training in development of data mining programs involving personal data be conducted using synthesized data. This thesis seeks to present an underlying discussion of these issues, to include data mining use, a simple data synthesis model for analysis to support the validity of the NRC recommendation, and the associated difficulties encountered in the process. Included is an analysis of the inherent difficulty in creating realistic and useful data.
Cornell, Axel. "Probabilistic Fault Isolation in Embedded Systems Using Training Data." Thesis, KTH, Reglerteknik, 2008. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-105874.
Full textEricson, Anton. "Object Recognition Using Digitally Generated Images as Training Data." Thesis, Uppsala universitet, Bildanalys och människa-datorinteraktion, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-200158.
Full textDubey, Rohini. "PERFORMANCE EVALUATION of MILITARY TRAINING EXERCISES USING DATA MINING." Thesis, Högskolan i Skövde, Institutionen för informationsteknologi, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-13060.
Full textVarga, Tamás. "Off-line cursive handwriting recognition using synthetic training data." Berlin Aka, 2006. http://deposit.d-nb.de/cgi-bin/dokserv?id=2838183&prov=M&dok_var=1&dok_ext=htm.
Full textOkuma, Kenji. "Active exploration of training data for improved object detection." Thesis, University of British Columbia, 2012. http://hdl.handle.net/2429/40520.
Full textMcClintick, Kyle W. "Training Data Generation Framework For Machine-Learning Based Classifiers." Digital WPI, 2018. https://digitalcommons.wpi.edu/etd-theses/1276.
Full textValenzuela, Michael Lawrence. "Machine Learning, Optimization, and Anti-Training with Sacrificial Data." Diss., The University of Arizona, 2016. http://hdl.handle.net/10150/605111.
Full textNahari, Ammar Jamal. "Creating a Data Acquisition Platform for Robot Skill Training." Case Western Reserve University School of Graduate Studies / OhioLINK, 2019. http://rave.ohiolink.edu/etdc/view?acc_num=case153260922930446.
Full textFriesch, Pius. "Generating Training Data for Keyword Spotting given Few Samples." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-254960.
Full textTaligenkänningssystem behöver generellt en stor mängd träningsdata med varierande röstoch inspelningsförhållanden för att ge robusta resultat. I det specifika fallet med nyckelordsidentifiering, där endast korta kommandon känns igen i stället för stora vokabulärer, måste resurskrävande datainsamling göras för varje sökord individuellt. Under de senaste åren har neurala metoder i talsyntes och röstkonvertering gjort stora framsteg och genererar tal som är realistiskt för det mänskliga örat. I det här arbetet undersöker vi möjligheten att använda sådana metoder för att generera träningsdata för nyckelordsidentifiering. I detalj vill vi utvärdera om det genererade träningsdatat verkligen är realistiskt eller bara låter så, och om en modell tränad på dessa genererade exempel generaliserar väl till verkligt tal. Vi utvärderade tre metoder för neural talsyntes och röstomvandlingsteknik: (1) Speaker Adaptive VoiceLoop, (2) Factorized Hierarchical Variational Autoencoder (FHVAE), (3) Vector Quantised-Variational AutoEncoder (VQVAE).Dessa tre metoder används för att antingen generera träningsdata från text (talsyntes) eller att berika ett befintligt dataset för att simulera flera olika talare med hjälp av röstkonvertering, och utvärderas i ett system för nyckelordsidentifiering. Modellernas prestanda jämförs med en baslinje baserad på traditionell signalbehandling där tonhöjd och tempo varieras i det ursprungliga träningsdatat. Experimenten visar att man med hjälp av neurala nätverksmetoder kan ge en upp till 20% relativ noggrannhetsförbättring på valideringsuppsättningen jämfört med ursprungligt träningsdata. Baslinjemetoden baserad på signalbehandling ger minst dubbelt så bra resultat. Detta tycks indikera att användningen av talsyntes eller röstkonvertering med flera talare inte ger tillräckligt varierade eller representativa träningsdata.
Bergendal, Rasmus, and Andreas Rohlén. "A comparison of training algorithms when training a Convolutional Neural Network for classifying road signs." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-254932.
Full textDetta examensarbete är en jämförelse av tre olika träningsalgoritmer vid traning av ett Convolutional Neural Network för klassifiering av vägskyltar. De algoritmer som jämfördes var Gradient Descent, Adadelta och Adam. I denna studie användes datamängden German Traffic Sign Recognition Benchmark (GTSRB), som är en vetenskapligt använd datamängd innehållande runt 50000 kommenterade bilder. En kombination av övervakad (supervised) och offline inlärning användes och varje algoritms toppresultat sparades. Adam uppnådde högst resultat, följt av Adadelta och sist Gradient Descent. Det neurala nätverket förbättrades med hjälp av fler convolutional lager och fler igenkännande filter. Detta förbättrade traffsakerheten hos nätverket som tränats med Adam med 0.76 procentenheter.
Low, Choy Samantha Jane. "Hierarchical models for 2D presence/absence data having ambiguous zeroes: With a biogeographical case study on dingo behaviour." Thesis, Queensland University of Technology, 2001. https://eprints.qut.edu.au/37098/12/Samantha%20Low%20Choy%20Thesis.pdf.
Full textMaiga, Aïssata, and Johanna Löv. "Real versus Simulated data for Image Reconstruction : A comparison between training with sparse simulated data and sparse real data." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-302028.
Full textVår studie undersöker hur träning med gles simulerad data och gles verklig data från en eventkamera, påverkar bildrekonstruktion. Vi tränade två modeller, en med simulerad data och en med verklig för att sedan jämföra dessa på ett flertal kriterier som antal event, hastighet och high dynamic range, HDR. Resultaten visar att skillnaden mellan att träna med simulerad data och verklig data inte är stor. Modellen tränad med verklig data presterade bättre i de flesta fall, men den genomsnittliga skillnaden mellan resultaten är bara 2%. Resultaten bekräftar vad tidigare studier har visat; träning med simulerad data generaliserar bra, och som denna studie visar även vid träning på glesa datamängder.
Winblad, Kjell. "The Impact of Training Data Division in Inductive Dependency Parsing." Thesis, Uppsala universitet, Institutionen för informationsteknologi, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-157139.
Full textJiang, Kailang. "Improve classification on infrequent discourse relations via training data enrichment." Thesis, University of British Columbia, 2016. http://hdl.handle.net/2429/59844.
Full textScience, Faculty of
Computer Science, Department of
Graduate
Masko, David, and Paulina Hensman. "The Impact of Imbalanced Training Data for Convolutional Neural Networks." Thesis, KTH, Skolan för datavetenskap och kommunikation (CSC), 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-166451.
Full textDetta kandidatexamensarbete utför en empirisk studie av den påverkan ojämnt fördelad träningsdata har på bildklassificeringsresultat för Convolutional Neural Networks(CNN). Bilder från datamängden CIFAR-10, bestående av 60 000 bilder fördelade mellan 10 klasser, används för att skapa träningsdatamängder med olika fördelningar mellan klasserna. Exempelvis innehåller vissa mängder oproportioneligt många bilder av en klass, medan andra innehåller väldigt få bilder av en klass. Dessa datamängder används för att träna ett CNN, och nätverkets klassificeringsresultat noteras för varje datamängd. Resultaten visar att ojämt fördelad träningsdata kan ha en markant negativ påverkan på de genomsnittliga resultaten för CNN, och att balanserad träningsdata ger bäst resultat. Oversampling används på de ojämnt fördeladade träningsdatamängderna vilket resulterar i samma resultat som för den balanserade träningsdatamängden. Detta visar att oversampling är ett gångbart sätt att motverka effekterna av ojämnt fördelad träningsdata.
Whitworth, Timothy. "Channel estimation, data detection and training design for wireless communications." Thesis, University of Leeds, 2008. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.493283.
Full textBardolet, Pettersson Susana. "Managing imbalanced training data by sequential segmentation in machine learning." Thesis, Linköpings universitet, Avdelningen för medicinsk teknik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-155091.
Full textGirerd, Daniel. "Strategic Selection of Training Data for Domain-Specific Speech Recognition." DigitalCommons@CalPoly, 2018. https://digitalcommons.calpoly.edu/theses/1847.
Full textSundin, Hannes, and Jakob Josefsson. "Evaluating synthetic training data for character recognition in natural images." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-280292.
Full textI det här kandidatexamensarbetet behandlas bokstavigenkänning i naturliga bilder. Mer specifikt jämförs syntetiska typsnittsbilder med naturliga bilder för träning av ett Convolutional Neural Network (CNN). Att träna ett CNN för att känna igen bokstäver i naturliga bilder kräver oftast mycket betecknad naturlig data. Ett alternativ till detta är att producera syntetisk träningsdata i form av typsnittsbilder. I denna studie skapades 41664 typsnittsbilder, vilket i kombination med existerande data gav oss omkring 99 tusen syntetiska träningsbilder. Därefter tränades ett CNN med typsnittsbilder i ökande mängd för att sedan testas på naturliga bilder av bokstäver. Resultatet av detta jämfördes sedan med resultatet av att träna med naturliga bilder. Dessutom experimenterades med olika förbehandlingsmetoder för att observera förbehandlingens påverkan på klassifikationsgraden. Resultaten visade att även med den förbehandlingsmetoden som gav bäst resultat och med mycket mer data, var träning med syntetiska bilder inte lika effektivt som med naturliga bilder. Dock så visades det att med en bra förbehandlingsmetod kan syntetiska bilder ersätta naturliga bilder, givet att tillgången till naturliga bilder är begränsat.
Collin, Sofie. "Synthetic Data for Training and Evaluation of Critical Traffic Scenarios." Thesis, Linköpings universitet, Medie- och Informationsteknik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-177779.
Full textExamensarbetet är utfört vid Institutionen för teknik och naturvetenskap (ITN) vid Tekniska fakulteten, Linköpings universitet
Pfaff, Lee. "The effect of training on individuals' interactions with visual data." Thesis, Boston University, 2013. https://hdl.handle.net/2144/12186.
Full textIntroduction: Traditionally, students demonstrate their learning via testing and demonstrations but little is known about how learners’ interaction with information changes during and after training. Previous studies have shown the difference between naive and expert individuals’ interactions with an image but never in the same individuals before and after the educational process. Our lab’s goal is to explore this question using gaze tracking and quantitative measures. This will be done by looking at 3 specific variables: entry time, number of visits and fraction of viewing time. Hypotheses: We test 3 main hypotheses. (1) The trained group will attend to educationally salient features more than the non-trained group, after the training. (2) The non-trained group will attend to visually salient features more than the trained group after training. (3) Training will cause the trained group to attend more to educationally salient features after then training, when compared to base, while the non-trained group will have no change. [TRUNCATED]
Gaddis, Margaret L. "Training Citizen Scientists for Data Reliability| A Multiple Case Study to Identify Themes in Current Training Initiatives." Thesis, The University of the Rockies, 2018. http://pqdtopen.proquest.com/#viewpdf?dispub=13423764.
Full textThis dissertation characterized trainings designed to prepare citizen scientists to collect ecological data in natural outdoor settings. Citizen scientists are volunteers who participate in scientific activities under the guidance of professional scientists and organizations. The work of citizen scientists greatly expands the data collection possibilities in natural resource management and increases science literacy among participants and their social communities. The general problem is that some scientists and land managers view the data collected by citizen scientists as unreliable. The specific problem is the absence of educational training measurement in citizen science program design and analysis with which to ascertain the learning gains of trained citizen scientists.
Through a sequenced methodology of data analysis, survey, and semi-structured interviews, deductive descriptors and codes guided a directed content analysis of data collected. The analysis indicated strong alignment between citizen science, andragogy, and social learning theory. The sample revealed a bimodal distribution related to the type of data collected and the subsequent training design. Little training existed when data collection involved photography only. Citizen scientists brought prior skills to the task but did not need to gain new procedural learning to complete their data collection task. When citizen scientists collected more complex measurements, classroom and field mentoring facilitated learning.
Citizen science leaders described their perception of the reliability of their citizen scientists’ data collection efforts. Computer technologies validated photo and water quality data. Therefore, quantitative data analysis supported the perception of data reliability. Terrestrial data had a range of reliability qualifications including video and paper quizzing, field observation of methods implemented, periodic data checks, and follow-up mentoring when data quality was poor. Managers of terrestrial citizen science programs were confident in the reliability of the data for the land management, policy, and research applications required.
Spreyer, Kathrin. "Does it have to be trees? : Data-driven dependency parsing with incomplete and noisy training data." Phd thesis, Universität Potsdam, 2011. http://opus.kobv.de/ubp/volltexte/2012/5749/.
Full textWir präsentieren eine neuartige Herangehensweise an das Trainieren von daten-gesteuerten Dependenzparsern auf unvollständigen Annotationen. Unsere Parser sind einfache Varianten von zwei bekannten Dependenzparsern, nämlich des transitions-basierten Malt-Parsers sowie des graph-basierten MST-Parsers. Während frühere Arbeiten zum Parsing mit unvollständigen Daten die Aufgabe meist in Frameworks für unüberwachtes oder schwach überwachtes maschinelles Lernen gebettet haben, behandeln wir sie im Wesentlichen mit überwachten Lernverfahren. Insbesondere schlagen wir "agnostische" Parser vor, die jegliche Fragmentierung der Trainingsdaten vor ihren daten-gesteuerten Lernkomponenten verbergen. Wir stellen Versuchsergebnisse mit Trainingsdaten vor, die mithilfe von Annotationsprojektion gewonnen wurden. Annotationsprojektion ist ein Verfahren, das es uns erlaubt, innerhalb eines Parallelkorpus Annotationen von einer Sprache auf eine andere zu übertragen. Bedingt durch begrenzten crosslingualen Parallelismus und fehleranfällige Wortalinierung ist die Ausgabe des Projektionsschrittes jedoch üblicherweise verrauscht und unvollständig. Gerade dies macht projizierte Annotationen zu einer angemessenen Testumgebung für unsere fragment-fähigen Parser. Unsere Ergebnisse belegen, dass (i) Dependenzparser, die auf großen Mengen von projizierten Annotationen trainiert wurden, größere Genauigkeit erzielen als die zugrundeliegenden direkten Projektionen, und dass (ii) die Genauigkeit unserer agnostischen, fragment-fähigen Parser der Genauigkeit der Originalparser (trainiert auf streng gefilterten, komplett projizierten Bäumen) annähernd gleichgestellt ist. Schließlich zeigen wir mit künstlich fragmentierten Gold-Standard-Daten, dass (iii) der Verlust an Genauigkeit selbst dann bescheiden bleibt, wenn bis zu 50% aller Kanten in den Trainingsdaten fehlen.
Säfdal, Joakim. "Data-Driven Engine Fault Classification and Severity Estimation Using Interpolated Fault Modes from Limited Training Data." Thesis, Linköpings universitet, Fordonssystem, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-173916.
Full textWang, Zhuoyu. "Bias from a missing covariate in the analysis of diagnostic test data in the absence of a gold-standard." Thesis, McGill University, 2013. http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=119705.
Full textLes covariables qui influencent la sensibilité et/ou la spécificité des différents tests de diagnostic peuvent créer des corrélations entre ces tests, conditionnellement à l'état de la maladie. Ainsi, en ignorant ces variables dans une analyse de classe latente de tests imparfaits, on en reviendrait à ignorer la dépendance conditionnelle pouvant conduire à des estimations biaisées de la prévalence de la condition sous étude ainsi qu'à la précision des tests. Dans le cas d'une covariable dichotomique affectant deux essais imparfaits, nous dérivons une expression qui montre que la covariance conditionnelle est une fonction du produit de la variation de la sensibilité du test (ou de la spécificité) dans les sous-groupes définis par la covariable. Pour une covariable continue distribuée uniformément ou normalement des résultats similaires sont obtenus numériquement. En utilisant des séries de données simulées, nous étudions si, avec l'absence de covariable, des estimations impartiales peuvent être obtenues en ajustant un modèle de classe latente permettant la dépendance conditionnelle. Nous avons constaté, en ignorant la dépendance et en utilisant un modèle d'indépendance conditionnelle, que le biais induit n'est pas grand dans la plupart des cas. Dans les cas où le biais est présent, un modèle de dépendance conditionnelle qui n'impose pas de contraintes sur la covariance entre les tests fonctionne bien en ajustant tous les trois types de variables manquantes. Nos méthodes sont appliquées aux données des tests diagnostiques pour le dépistage de la tuberculose qui varient en fonction du statut de la covariable du VIH.