Dissertations / Theses on the topic 'Time series outlier detection'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Time series outlier detection.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Sedman, Robin. "Online Outlier Detection in Financial Time Series." Thesis, KTH, Matematisk statistik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-228069.
Full textI detta examensarbete undersöks olika modeller för outlierdetektering i finansiella tidsserier. De finansiella tidsserierna är prisserier som indexpriser eller tillgångspriser. Outliers är i detta examensarbete definierade som extrema och falska punkter, men denna definition undersöks och revideras också. Två olika tidsseriemodeller undersöks: en autoregressiv (AR) och en generel au-toregressiv betingad heteroskedasticitet1 (GARCH) tidsseriemodell, samt en hypotesprövning2 baserad på GARCH-modellen. Dessutom undersöks en icke-parametrisk modell, vilken använder sig utav uppskattning av täthetsfunktionen med hjälp av kärnfunktioner3 för att detektera out-liers. Modellerna utvärderas utifrån hur väl de upptäcker outliers, hur ofta de kategoriserar icke-outliers som outliers samt modellens körtid. Det är konstaterat att alla modeller ungefär presterar lika bra, baserat på den data som används och de simuleringar som gjorts, i form av hur väl outliers är detekterade, förutom metoden baserad på hypotesprövning som fungerar sämre än de andra. Vidare är det uppenbart att definitionen av en outlier är väldigt avgörande för hur bra en modell detekterar outliers. För tillämpningen av detta examensarbete, så är körtid en viktig faktor, och med detta i åtanke är en autoregressiv modell med Students t-brusfördelning funnen att vara den bästa modellen, både med avseende på hur väl den detekterar outliers, felaktigt detekterar inliers som outliers och modellens körtid.
Wang, Dan Tong. "Outlier detection with data stream mining approach in high-dimenional time series data." Thesis, University of Macau, 2017. http://umaclib3.umac.mo/record=b3691091.
Full textBergamelli, Michele. "Structural breaks and outliers detection in time-series econometrics : methods and applications." Thesis, City University London, 2015. http://openaccess.city.ac.uk/14868/.
Full textEghbalian, Amirmohammad. "Data mining techniques for modeling the operating behaviors of smart building control valve systems." Thesis, Blekinge Tekniska Högskola, Institutionen för datavetenskap, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:bth-20102.
Full textSlávik, Ľuboš. "Dynamická faktorová analýza časových řad." Master's thesis, Vysoké učení technické v Brně. Fakulta strojního inženýrství, 2021. http://www.nusl.cz/ntk/nusl-445469.
Full textAllab, Nedjmeddine. "Détection d'anomalies et de ruptures dans les séries temporelles. Applications à la gestion de production de l'électricité." Thesis, Paris 6, 2016. http://www.theses.fr/2016PA066658.
Full textContinental is the main tool that edf uses for the long-term management of electricity. It elaborates the strategy exploitation of the electrical parc made up by power plants distributed all over europe. the tool simulates for each zone and each scenario several variables, such as the electricity demand, the generated quantity as well as the related costs. our works aim to provide methods to analyse the data of electricity production in order to ease their discovery and synthesis. we get a set of problmatics from the users of continental that we tent to solve through techniques of outliers and changepoints detection in time series
Ribeiro, Joana Patrícia Bordonhos. "Outlier identification in multivariate time series." Master's thesis, Universidade de Aveiro, 2017. http://hdl.handle.net/10773/22200.
Full textCom o desenvolvimento tecnológico, existe uma cada vez maior disponibilidade de dados. Geralmente representativos de situações do dia-a-dia, a existência de grandes quantidades de informação tem o seu interesse quando permite a extração de valor para o mercado. Além disso, surge importância em analisar não só os valores disponíveis mas também a sua associação com o tempo. A existência de valores anormais é inevitável. Geralmente denotados como outliers, a procura por estes valores é realizada comummente com o intuito de fazer a sua exclusão do estudo. No entanto, os outliers representam muitas vezes um objetivo de estudo. Por exemplo, no caso de deteção de fraudes bancárias ou no diagnóstico de doenças, o objetivo central é identificar situações anormais. Ao longo desta dissertação é apresentada uma metodologia que permite detetar outliers em séries temporais multivariadas, após aplicação de métodos de classificação. A abordagem escolhida é depois aplicada a um conjunto de dados real, representativo do funcionamento de caldeiras. O principal objetivo é identificar as suas falhas. Consequentemente, pretende-se melhorar os componentes do equipamento e portanto diminuir as suas falhas. Os algoritmos implementados permitem identificar não só as falhas do aparelho mas também o seu funcionamento normal. Pretende-se que as metodologias escolhidas sejam também aplicadas nos aparelhos futuros, permitindo melhorar a identificação em tempo real das falhas.
With the technological development, there is an increasing availability of data. Usually representative of day-to-day actions, the existence of large amounts of information has its own interest when it allows to extract value to the market. In addition, it is important to analyze not only the available values but also their association with time. The existence of abnormal values is inevitable. Usually denoted as outliers, the search for these values is commonly made in order to exclude them from the study. However, outliers often represent a goal of study. For example, in the case of bank fraud detection or disease diagnosis, the central objective is to identify the abnormal situations. Throughout this dissertation we present a methodology that allows the detection of outliers in multivariate time series, after application of classification methods. The chosen approach is then applied to a real data set, representative of boiler operation. The main goal is to identify faults. It is intended to improve boiler components and, hence, reduce the faults. The implemented algorithms allow to identify not only the boiler faults but also their normal operation cycles. We aim that the chosen methodologies will also be applied in future devices, allowing to improve real-time fault identification.
Åkerström, Emelie. "Real-time Outlier Detection using Unbounded Data Streaming and Machine Learning." Thesis, Luleå tekniska universitet, Datavetenskap, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:ltu:diva-80044.
Full textSánchez, Enríquez Heider Ysaías. "Anomaly detection in streaming multivariate time series." Tesis, Universidad de Chile, 2017. http://repositorio.uchile.cl/handle/2250/149078.
Full textEste trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde a una observación normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo eficientemente. Adicionalmente, se propone técnicas para generar modelos representativos y consisos a partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad. Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no- normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos. El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex- perimentales demuestran que aplicando la transformación de translación y representación de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien- temente la detección de anomalı́as en modo offline y online en flujos de series temporales multivariantes.
Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile
Tinawi, Ihssan. "Machine learning for time series anomaly detection." Thesis, Massachusetts Institute of Technology, 2019. https://hdl.handle.net/1721.1/123129.
Full textThesis: M. Eng., Massachusetts Institute of Technology, Department of Electrical Engineering and Computer Science, 2019
Cataloged from student-submitted PDF version of thesis.
Includes bibliographical references (page 55).
In this thesis, I explored machine learning and other statistical techniques for anomaly detection on time series data obtained from Internet-of-Things sensors. The data, obtained from satellite telemetry signals, were used to train models to forecast a signal based on its historic patterns. When the prediction passed a dynamic error threshold, then that point was flagged as anomalous. I used multiple models such as Long Short-Term Memory (LSTM), autoregression, Multi-Layer Perceptron, and Encoder-Decoder LSTM. I used the "Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding" paper as a basis for my analysis, and was able to beat their performance on anomaly detection by obtaining an F0.5 score of 76%, an improvement over their 69% score.
by Ihssan Tinawi.
M. Eng.
M.Eng. Massachusetts Institute of Technology, Department of Electrical Engineering and Computer Science
Sperl, Ryan E. "Hierarchical Anomaly Detection for Time Series Data." Wright State University / OhioLINK, 2020. http://rave.ohiolink.edu/etdc/view?acc_num=wright1590709752916657.
Full textRoth, Jennifer M. "A Time Series Approach to Removing Outlying Data Points from Bluetooth Vehicle Speed Data." University of Akron / OhioLINK, 2010. http://rave.ohiolink.edu/etdc/view?acc_num=akron1289758088.
Full textJi, Kang Hyeun. "Transient signal detection using GPS position time series." Thesis, Massachusetts Institute of Technology, 2011. http://hdl.handle.net/1721.1/69466.
Full textCataloged from PDF version of thesis.
Includes bibliographical references (p. 229-243).
Continuously operating Global Positioning System (GPS) networks record station position changes with millimeter-level accuracy and have revealed transient deformations on various spatial and temporal scales. However, the transient deformation may not be easily identified from the position time series because of low signal-to-noise ratios (SNR), correlated noise in space and time and large number of sites in a network. As a systematic detection method, we use state estimation based on Kalman filtering and principal component analysis (PCA). State estimation improves the SNR in the time domain by estimating secular and transient motions and reducing the level of both white and colored noise. PCA improves the SNR in space domain by accounting for the coherence of transient motions between nearby sites. Synthetic tests show that the method is capable of detecting transient signals embedded in noisy data but complex signals (e.g., large-scale signals in space and time, multiple and/or propagating signals) are difficult to detect and interpret. We demonstrate the detection capability with two known signals in the Los Angeles basin, California: far-field coseismic offsets associated with the 1999 Hector Mine earthquake and locally-observed hydrologic deformation due to heavy rainfall in winter 2004-2005 in San Gabriel Valley. We applied the method to the daily GPS data from the Plate Boundary Observatory (PBO) network in Alaska and in the Washington State section of the Cascadia subduction zone. We have detected a transient signal whose maximum displacement is -9 mm in the horizontal and -41 mm in the vertical at Akutan volcano, Alaska, during the first half of 2008 and two previously unrecognized small slow slip events with average surface displacements less than 2 mm, which was thought to be below current GPS resolution. The detection method improves the SNR and therefore provides higher resolution for detecting weak transient signals, and it can be used as a routine monitoring system.
by Kang Hyeun Ji.
Ph.D.
Lindroth, Henriksson Amelia. "Unsupervised Anomaly Detection on Time Series Data: An Implementation on Electricity Consumption Series." Thesis, KTH, Matematisk statistik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301731.
Full textDigitaliseringen av elbranschen, införandet av smarta nät samt ökad reglering av elmätning har resulterat i stora mängder eldata. Denna data skapar en unik möjlighet att analysera och förstå fastigheters elförbrukning för att kunna effektivisera den. Ett viktigt inledande steg i analysen av denna data är att identifiera möjliga anomalier. I denna uppsats testas fyra olika maskininlärningsmetoder för detektering av anomalier i elförbrukningsserier: densitetsbaserad spatiell klustring för applikationer med brus (DBSCAN), lokal avvikelse-faktor (LOF), isoleringsskog (iForest) och en-klass stödvektormaskin (OC-SVM). För att kunna utvärdera metoderna infördes syntetiska anomalier i elförbrukningsserierna och de fyra metoderna utvärderades därefter för de två anomalityperna punktanomali och gruppanomali. Utöver elförbrukningsdatan inkluderades även variabler som beskriver tidigare elförbrukning, utomhustemperatur och tidsegenskaper i modellerna. Resultaten tyder på att tillägget av temperaturvariabeln och lag-variablerna i allmänhet försämrade modellernas prestanda, medan införandet av tidsvariablerna förbättrade den. Av de fyra metoderna visade sig OC-SVM vara bäst på att detektera punktanomalier medan LOF var bäst på att detektera gruppanomalier. I ett försök att förbättra modellernas detekteringsförmåga utfördes samma experiment efter att elförbrukningsserierna trend- och säsongsrensats. Modellerna presterade inte bättre på de rensade serierna än på de icke-rensade.
Yacob, Andreas, and Olof Nilsson. "Non-parametric anomaly detection in sentiment time series data." Thesis, Uppsala universitet, Institutionen för teknikvetenskaper, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-251645.
Full textBarham, S. Y. "Time series analysis in the detection of breast cancer." Thesis, Bucks New University, 1987. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.384665.
Full textVendramin, Nicoló. "Unsupervised Anomaly Detection on Multi-Process Event Time Series." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-254885.
Full textAtt fastställa huruvida observerade data är avvikande eller inte är en viktig uppgift som har studerats ingående i litteraturen och problemet blir ännu mer komplext, om detta kombineras med högdimensionella representationer och flera källor som oberoende genererar de mönster som ska analyseras. Arbetet som presenteras i denna uppsats använder en data-driven pipeline för definitionen av en återkommande auto-encoderarkitektur för att analysera, på ett oövervakat sätt, högdimensionella händelsetidsserier som genereras av flera och variabla processer som interagerar med ett system. Mot bakgrund av ovanstående problem undersöker arbetet om det är möjligt eller inte att använda en enda modell för att analysera mönster som producerats av olika källor. Analys av loggfiler som registrerar händelser av interaktion mellan användare och radionätverksinfrastruktur används som en fallstudie för det angivna problemet. Undersökningen syftar till att verifiera prestandan hos en enda maskininlärningsmodell som tillämpas för inlärning av flera mönster som utvecklats över tid från olika källor. Arbetet föreslår en pipeline för att hantera den komplexa representationen hos datakällorna och definitionen och avstämningen av anomalidetektionsmodellen, som inte är baserad på domänspecifik kunskap och därför kan anpassas till olika probleminställningar. Modellen har implementerats i fyra olika varianter som har utvärderats med avseende på både normala och avvikande data, som delvis har samlats in från verkliga nätverksceller och delvis från simulering av avvikande beteenden. De empiriska resultaten visar modellens tillämplighet för detektering av avvikande sekvenser och händelser i det föreslagna ramverket, med F1-score över 80%, varierande beroende på den specifika tröskelinställningen. Dessutom ger deras djupare tolkning insikter om skillnaden mellan olika varianter av modellen och därmed deras begränsningar och styrkor.
Granlund, Oskar. "Unsupervised anomaly detection on log-based time series data." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-265534.
Full textEftersom antalet uppkopplade enheter ständigt har ökat och kravet på tillgänglighet, äkthet och integritet hos applikationer är höga så har den här uppsatsen fokuserat på oövervakad anomalidetektering i datacenter. Den utvärderar hur lämpliga öppna och moderna anomalidetekteringsmetoder är för att hitta avvikande mönster och trender på logbaserade dataströmmar. Metoderna använda i det här projektet är Principalkomponentanalys, LogCluster och Hierarkisk temporärt minne. De är utvärderade med F-score på en datamängd från en Apache-accesslogg tagen från en produktionsmiljö. Datan var utvald för att reprensentera ett normalt tillstånd där få eller inga onormala händelser förekom. 0.5% av datapunkterna transformerades till anomalier, baserat på den genomsnittliga förekomsten av varje logsekvens som matchar ett visst mönster. Principalkomponentanalys visade de bästa resultaten med ett F-score från 0.4 till 0.56. Näst bäst var LogCluster, de två metoderna baserade på hierarkiskt temporärt minne visade inte alls bra resultat. Resultaten visade att PCA kan hitta ca 50% av de injecerade anomalierna vilket kan användas för att förbättra konfidentialitet, tillgänglighet och integriteten hos applikationer.
Wolpher, Maxim. "Anomaly Detection in Unstructured Time Series Datausing an LSTM Autoencoder." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231368.
Full textEn undersökning av anomalitetsdetektering. Mycket arbete har gjorts inom ämnet anomalitetsdetektering, men det som verkar saknas är en fördjupning i anomalitetsdetektering av ostrukturerad och omärktdata. Denna avhandling syftar till att bestämma effektiviteten av att kombinera Recurrent Neural Networks med Autoencoder strukturer för sekventiell anomalitetsdetektion. Användningen av en LSTM autoencoder kommeratt beskrivas i detalj, men bakgrund till tidsoberoende anomalitetsdetektering med hjälp av Isolation Forests och Replicator Neural Networks på referens DARPA dataset kommer också att täckas. De empiriska resultaten i denna avhandling visar att Isolation Forestsoch Replicator Neural Networks (RNN) båda når en F1-score på 0,98. RNN nådde en ROC AUC-score på 0,90 medan Isolation Forest nådde en ROC-AUC på 0,99. Resultaten för LSTM Autoencoder visar att med 137 features extraherade från ostrukturerad data kan den nå en F1-score på 0,80 och en ROC AUC-score på 0,86.
Haddad, Josef, and Carl Piehl. "Unsupervised anomaly detection in time series with recurrent neural networks." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-259655.
Full textArtificiella neurala nätverk (ANN) har tillämpats på många problem. Däremot försöker inte de flesta ANN-modeller efterlikna hjärnan i detalj. Ett exempel på ett ANN som är begränsat till att efterlikna hjärnan är Hierarchical Temporal Memory (HTM). Denna studie tillämpar HTM och Long Short-Term Memory (LSTM) på avvikelsedetektionsproblem i tidsserier för att undersöka vilka styrkor och svagheter de har för detta problem. Avvikelserna i denna studie är begränsade till punktavvikelser och tidsserierna är i endast en variabel. Redan existerande implementationer som utnyttjar dessa nätverk för oövervakad avvikelsedetektionsproblem i tidsserier används i denna studie. Vi använder främst våra egna syntetiska tidsserier för att undersöka hur nätverken hanterar brus och hur de hanterar olika egenskaper som en tidsserie kan ha. Våra resultat visar att båda nätverken kan hantera brus och prestationsskillnaden rörande brusrobusthet var inte tillräckligt stor för att urskilja modellerna. LSTM presterade bättre än HTM på att upptäcka punktavvikelser i våra syntetiska tidsserier som följer en sinuskurva men en slutsats angående vilket nätverk som presterar bäst överlag är fortfarande oavgjord.
Berenji, Ardestani Sarah. "Time Series Anomaly Detection and Uncertainty Estimation using LSTM Autoencoders." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-281354.
Full textMålet med den här uppsatsen är att implentera ett verktyg för anomaliupptäckande med hjälp av LSTM autoencoders och applicera en ny metod för osäkerhetsestimering med hjälp av Bayesian Neural Networks (BNN) baserat på en artikel från Uber research group [1]. Pålitliga verktyg för att upptäcka anomalier och att göra precisa osäkerhetsestimeringar är kritiskt i många fält. På Telia kan ett sådant verktyg användas för många olika datadomäner, som i enhetsloggar för att upptäcka abnormalt beteende. Vår metod använder en autoencoder för att extrahera viktiga egenskaper och lära sig den kodade representationen av tidsserierna. Detta tillvägagångssätt hjälper till med att ta in testdatapunker som kommer in från olika grundmängder. Sedan tränas en förutsägelsemodell baserad på encoderns representation av datan. För att uppskatta modellens osäkerhet används en uppskattningsalgoritm som delar upp osäkerheten till tre olika källor. Dessa tre källor är: modellosäkerhet, felspeciferad model, och naturligt brus. För att få de första två används en Monte Carlo dropout approach som är lätt att implementera och enkel att skala. För den tredje delen används en enkel anfallsvikel som uppskattar brusnivån med hjälp av felkvadratsumman av valideringsdatan. Som ett resultat kunde vi se att vår föreslagna model kan göra bättre förutsägelser än våra benchmarks. Även om skillnaden inte är stor så visar det att att använda autoencoderrepresentation för att göra förutsägelser är mer noggrant. Resulaten för anomaliupptäckanden baserat på dessa förutsägelser visar också att vår föreslagna modell har bättre prestanda än benchmarken. Det betyder att användning av autoencoders kan förbättra både förutsägelser och anomaliupptäckande. Utöver det kan vi dra slutsatsen att användning av djupa neurala nätverk skulle visa en större förbättring om datan hade mer komplexitet.
Thorén, Sofia, and Richard Sörberg. "Anomaly Detection in Signaling Data Streams : A Time-Series Approach." Thesis, Umeå universitet, Institutionen för matematik och matematisk statistik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-139773.
Full textDu, Yang. "Comparison of change-point detection algorithms for vector time series." Thesis, Linköpings universitet, Statistik, 2010. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-59925.
Full textSantos, Rui Pedro Silvestre dos. "Time series morphological analysis applied to biomedical signals events detection." Master's thesis, Faculdade de Ciências e Tecnologia, 2011. http://hdl.handle.net/10362/10227.
Full textAutomated techniques for biosignal data acquisition and analysis have become increasingly powerful, particularly at the Biomedical Engineering research field. Nevertheless, it is verified the need to improve tools for signal pattern recognition and classification systems, in which the detection of specific events and the automatic signal segmentation are preliminary processing steps. The present dissertation introduces a signal-independent algorithm, which detects significant events in a biosignal. From a time series morphological analysis, the algorithm computes the instants when the most significant standard deviation discontinuities occur, segmenting the signal. An iterative optimization step is then applied. This assures that a minimal error is achieved when modeling these segments with polynomial regressions. The adjustment of a scale factor gives different detail levels of events detection. An accurate and objective algorithm performance evaluation procedure was designed. When applied on a set of synthetic signals, with known and quantitatively predefined events, an overall mean error of 20 samples between the detected and the actual events showed the high accuracy of the proposed algorithm. Its ability to perform the detection of signal activation onsets and transient waveshapes was also assessed, resulting in higher reliability than signal-specific standard methods. Some case studies, with signal processing requirements for which the developed algorithm can be suitably applied, were approached. The algorithm implementation in real-time, as part of an application developed during this research work, is also reported. The proposed algorithm detects significant signal events with accuracy and significant noise immunity. Its versatile design allows the application in different signals without previous knowledge on their statistical properties or specific preprocessing steps. It also brings added objectivity when compared with the exhaustive and time-consuming examiner analysis. The tool introduced in this dissertation represents a relevant contribution in events detection, a particularly important issue within the wide digital biosignal processing research field.
Mian, Ammar. "Contributions to SAR Image Time Series Analysis." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLC074/document.
Full textRemote sensing data from Synthetic Aperture Radar (SAR) sensors offer a unique opportunity to record, to analyze, and to predict the evolution of the Earth. In the last decade, numerous satellite remote sensing missions have been launched (Sentinel-1, UAVSAR, TerraSAR X, etc.). This resulted in a dramatic improvement in the Earth image acquisition capability and accessibility. The growing number of observation systems allows now to build high temporal/spatial-resolution Earth surface images data-sets. This new scenario significantly raises the interest in time-series processing to monitor changes occurring over large areas. However, developing new algorithms to process such a huge volume of data represents a current challenge. In this context, the present thesis aims at developing methodologies for change detection in high-resolution SAR image time series.These series raise two notable challenges that have to be overcome:On the one hand, standard statistical methods rely on multivariate data to infer a result which is often superior to a monovariate approach. Such multivariate data is however not always available when it concerns SAR images. To tackle this issue, new methodologies based on wavelet decomposition theory have been developed to fetch information based on the physical behavior of the scatterers present in the scene.On the other hand, the improvement in resolution obtained from the latest generation of sensors comes with an increased heterogeneity of the data obtained. For this setup, the standard Gaussian assumption used to develop classic change detection methodologies is no longer valid. As a consequence, new robust methodologies have been developed considering the family of elliptical distributions which have been shown to better fit the observed data.The association of both aspects has shown promising results in change detection applications
Taillade, Thibault. "A new strategy for change detection in SAR time-series : application to target detection." Thesis, université Paris-Saclay, 2020. http://www.theses.fr/2020UPAST050.
Full textThe detection of targets such as ships or vehicles in SAR (Synthetic Aperture Radar) images is an essential challenge for surveillance and security purpose. In some environments such as urban areas, harbor areas or forest observed at low radar frequencies, detecting these objects becomes difficult due to the high backscattering properties of the surrounding background. To overcome this issue, change detection (CD) between SAR images enables to cancel the background and highlight successfully targets present within the scene. However, in several environments, a temporal overlapping of targets may occur and generates possible misinterpretation because the outcome relies on the relative change between objects of different sizes or properties. This is a critical issue when the purpose is to visualize and obtain the number of targets at a specific day in high attendance areas such as harbors or urban environments. Ideally, this change detection should occur between a target-free image and onewith possible objects of interest. With the current accessibility to SAR time-series, we propose to compute a frozen background reference (FBR) image that will consists only in the temporally static background. Performing change detection from this FBR image and any SAR image aim to highlight the presence of ephemeral targets. This strategy has been implemented for ship detection in harbor environment and in the context of vehicles hidden under foliage
Stafford, William B. "Sequential pattern detection and time series models for predicting IED attacks." Thesis, Monterey, Calif. : Naval Postgraduate School, 2009. http://edocs.nps.edu/npspubs/scholarly/theses/2009/Mar/09Mar%5FStafford.pdf.
Full textThesis Advisor(s): Kamel, Magdi. "March 2009." Description based on title screen as viewed on April 24, 2009. Author(s) subject terms: Sequential Pattern Detection, Time Series, Predicting IED Attacks, Data Mining. Includes bibliographical references (p. 77). Also available in print.
Liu, R. Q., and Ch Jacobi. "Piecewise linear trend detection in mesosphere/lower thermosphere wind time series." Universität Leipzig, 2010. https://ul.qucosa.de/id/qucosa%3A16361.
Full textNovacic, Jelena, and Kablai Tokhi. "Implementation of Anomaly Detection on a Time-series Temperature Data set." Thesis, Malmö universitet, Fakulteten för teknik och samhälle (TS), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20375.
Full textToday's society has become more aware of its surroundings and the focus has shifted towards green technology. The need for better environmental impact in all areas is rapidly growing and energy consumption is one of them. A simple solution for automatically controlling the energy consumption of smart homes is through software. With today's IoT technology and machine learning models the movement towards software based ecoliving is growing. In order to control the energy consumption of a household, sudden abnormal behavior must be detected and adjusted to avoid unnecessary consumption. This thesis uses a time-series data set of temperature data for implementation of anomaly detection. Four models were implemented and tested; a Linear Regression model, Pandas EWM function, an exponentially weighted moving average (EWMA) model and finally a probabilistic exponentially weighted moving average (PEWMA) model. Each model was tested using data sets from nine different apartments, from the same time period. Then an evaluation of each model was conducted in terms of Precision, Recall and F-measure, as well as an additional evaluation for Linear Regression, using R^2 score. The results of this thesis show that in terms of accuracy, PEWMA outperformed the other models. The EWMA model was slightly better than the Linear Regression model, followed by the Pandas EWM model.
Aboode, Adam. "Anomaly Detection in Time Series Data Based on Holt-Winters Method." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-226344.
Full textI dagens värld ökar mängden insamlade data för varje dag som går, detta är en trend som sannolikt kommer att fortsätta. Samtidigt ökar även det potentiella värdet av denna data tack vare ständig utveckling och förbättring utav både hårdvara och mjukvara. För att utnyttja de stora mängder insamlade data till att skapa insikter, ta beslut eller träna noggranna maskininlärningsmodeller vill vi försäkra oss om att vår data är av god kvalité. Det finns många definitioner utav datakvalité, i denna rapport fokuserar vi på noggrannhetsaspekten. En metod som kan användas för att säkerställa att data är av god kvalité är att övervaka inkommande data och larma när anomalier påträffas. Vi föreslår därför i denna rapport en metod som, baserat på historiska data, kan detektera anomalier i tidsserier när nya värden anländer. Den föreslagna metoden består utav två delar, dels att förutsäga nästa värde i tidsserien genom Holt-Winters metod samt att jämföra residualen med en estimerad normalfördelning. Vi utvärderar den föreslagna metoden i två steg. Först utvärderas noggrannheten av de, utav Holt-Winters metod, förutsagda punkterna för olika storlekar på indata. I det andra steget utvärderas prestandan av anomalidetektorn när olika metoder för att estimera variansen av residualernas distribution används. Resultaten indikerar att den föreslagna metoden i de flesta fall fungerar bra för detektering utav punktanomalier i tidsserier med en trend- och säsongskomponent. I rapporten diskuteras även möjliga åtgärder vilka sannolikt skulle förbättra prestandan hos den föreslagna metoden.
Ferreira, Leonardo Nascimento. "Time series data mining using complex networks." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-01022018-144118/.
Full textSéries temporais são conjuntos de dados ordenados no tempo. Devido à ubiquidade desses dados, seu estudo é interessante para muitos campos da ciência. A mineração de dados temporais é uma área de pesquisa que tem como objetivo extrair informações desses dados relacionados no tempo. Para isso, modelos são usados para descrever as séries e buscar por padrões. Uma forma de modelar séries temporais é por meio de redes complexas. Nessa modelagem, um mapeamento é feito do espaço temporal para o espaço topológico, o que permite avaliar dados temporais usando técnicas de redes. Nesta tese, apresentamos soluções para tarefas de mineração de dados de séries temporais usando redes complexas. O objetivo principal foi avaliar os benefícios do uso da teoria de redes para extrair informações de dados temporais. Concentramo-nos em três tarefas de mineração. (1) Na tarefa de agrupamento, cada série temporal é representada por um vértice e as arestas são criadas entre as séries de acordo com sua similaridade. Os algoritmos de detecção de comunidades podem ser usados para agrupar séries semelhantes. Os resultados mostram que esta abordagem apresenta melhores resultados do que os resultados de agrupamento tradicional. (2) Na tarefa de classificação, cada série temporal rotulada em um banco de dados é mapeada para um gráfico de visibilidade. A classificação é realizada transformando uma série temporal não marcada em um gráfico de visibilidade e comparando-a com os gráficos rotulados usando uma função de distância. O novo rótulo é dado pelo rótulo mais frequente nos k grafos mais próximos. (3) Na tarefa de detecção de periodicidade, uma série temporal é primeiramente transformada em um gráfico de visibilidade. Máximos locais em uma série temporal geralmente são mapeados para vértices altamente conectados que ligam duas comunidades. O método proposto utiliza a estrutura de comunidades para realizar a detecção de períodos em séries temporais. Este método é robusto para dados ruidosos e não requer parâmetros. Com os métodos e resultados apresentados nesta tese, concluímos que a teoria da redes complexas é benéfica para a mineração de dados em séries temporais. Além disso, esta abordagem pode proporcionar melhores resultados do que os métodos tradicionais e é uma nova forma de extrair informações de séries temporais que pode ser facilmente estendida para outras tarefas.
Chen, Tiankai M. Eng Massachusetts Institute of Technology. "Anomaly detection in semiconductor manufacturing through time series forecasting using neural networks." Thesis, Massachusetts Institute of Technology, 2018. http://hdl.handle.net/1721.1/120245.
Full textCataloged from PDF version of thesis.
Includes bibliographical references (pages 92-94).
Semiconductor manufacturing provides unique challenges to the anomaly detection problem. With multiple recipes and multivariate data, it is difficult for engineers to reliably detect anomalies in the manufacturing process. An experimental study into anomaly detection through time series forecasting is carried out with application to a plasma etch case study. The study is performed on three predictive models with increasing complexity for comparison. The three models are namely: Autoregressive Integrated Moving Average (ARIMA), Multi-Layer Perceptron (MLP) and Long Short Term Memory (LSTM). ARIMA is a statistical model while MLP and LSTM are neural network models. The results from the control experiment, under supervised training, shows the validity of MLP and LSTM in detecting anomalies through time series forecasting with a recall accuracy of 92% for the best model. Conversely, the ARIMA model has a relatively poor performance due to the inability to model the data correctly. Experimental results also display the ability of neural network models to adapt to training sets of multiple recipes. Furthermore, downsampling is explored to reduce training times and has been found to have minor effects on the accuracy of the model. Moreover, an unsupervised approach towards anomaly detection is found to have little success in detecting anomalous points in the data.
by Tiankai Chen.
M. Eng. in Advanced Manufacturing and Design
Farahani, Marzieh. "Anomaly Detection on Gas Turbine Time-series’ Data Using Deep LSTM-Autoencoder." Thesis, Umeå universitet, Institutionen för datavetenskap, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-179863.
Full textChambon, Stanislas. "Learning from electrophysiology time series during sleep : from scoring to event detection." Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLT014.
Full textSleep is a complex and not fully understood biological phenomenon. The traditional process to monitor sleep relies on the polysomnography exam (PSG). It records, in a non invasive fashion at the level of the skin, electrophysiological modifications of the brain activity (electroencephalography, EEG), ocular (electro-oculography, EOG) and muscular (electro-myography, EMG). The recorded signals are then analyzed by a sleep expert who manually annotates the events of interest such as the sleep stages or some micro-events. However, manual labeling is time-consuming and prone to the expert subjectivity. Furthermore, the development of sleep monitoring consumer wearable devices which record and process automatically electrophysiological signals, such as Dreem headband, requires to automate some labeling tasks.Machine learning (ML) has received much attention as a way to teach a computer to perform some decision tasks automatically from a set of learning examples. Furthermore, the rise of deep learning (DL) algorithms in several fields have opened new perspectives for sleep sciences. On the other hand, this is also raising new concerns related to the scarcity of labeled data that may prevent their training processes and the variability of data that may hurt their performances. Indeed, sleep data is scarce due to the labeling burden and exhibits also some intra and inter-subject variability (due to sleep disorders, aging...).This thesis has investigated and proposed ML algorithms to automate the detection of sleep related events from raw PSG time series. Through the prism of DL, it addressed two main tasks: sleep stage classification and micro-event detection. A particular attention was brought (a) to the quantity of labeled data required to train such algorithms and (b) to the generalization performances of these algorithms to new (variable) data. Specific strategies, based on transfer learning, were designed to cope with the issues related to the scarcity of labeled data and the variability of data
Piyadi, Gamage Ramadha D. "Empirical Likelihood For Change Point Detection And Estimation In Time Series Models." Bowling Green State University / OhioLINK, 2017. http://rave.ohiolink.edu/etdc/view?acc_num=bgsu1495457528719879.
Full textJorge, Ana Maria Nabais. "Sobre a Definição de Outlier no Domínio Específico dos Modelos Lineares e Séries Temporais." Master's thesis, Instituto Superior de Economia e Gestão, 1999. http://hdl.handle.net/10400.5/4017.
Full text0 que são outliers e o que é o problema outlier? O principal objectivo desta dissertação é fazer o ponto da situação sobre o conceito outlier e como este é tratado no domínio específico dos modelos lineares e das séries temporais, para além de tentar saber como é que os mais modernos pacotes estatísticos tratam o tema. Assim, o nosso trabalho encontra-se dividido em seis capítulos. No primeiro capítulo, são enunciados os objectivos da presente dissertação e as suas motivações. No segundo capítulo, faz-se um apanhado de como o conceito outlier é definido pelos principais autores da especialidade assim como uma breve resenha histórica à evolução do tratamento dado a estas observações, desde Bernoulli até aos dias de hoje. O terceiro capítulo é dedicado à teoria geral de outliers, destacando-se os principais modelos e testes de discordância assim como alguns métodos de acomodação. O quarto capítulo é dedicado à análise do conceito outlier no âmbito dos modelos lineares. São referidos métodos de detecção, assim como alternativas robustas à estimação de mínimos quadrados. São ainda analisados vários pacotes estatísticos. O objectivo do quinto capítulo consiste no estudo de outliers em séries temporais. Serão classificados vários tipos de outliers. Será descrito e exem¬plificado um procedimento iterativo de detecção e estimação dos parâmetros da série proposto por Chang, Tiao e Chen (1988). Finalmente, no sexto capítulo extraem-se algumas conclusões sobre o tema.
What is an outlier and what's the outlier problem? The main purpose of this dissertation is to make the state of art about outlier's definition and how this subject is taking care in specific domain of linear models and time series besides trying to find out how statistical software treat the subject. So this dissertation is divided in six chapters. In the first chapter there is an explanation about the objectives of this dissertation, as well the motivations and importance of the subject. In the second chapter, there a review of how the major authors define the outlier concept as well as a brief historical reference to evolution of the treatment given to this observations since Bernoulli until now. The third chapter focus some aspects of the general theory of outliers, specially discordancy models and tests as well some accomodation proce¬dures. The fourth chapter regards the analysis of outlier's concept in the domain of linear models. It will be referenced some outlier's detection methods and some alternatives to least squares. They will be analysed several statistical packages. The objective of the fifth chapter is to study outliers in time series. Several types of outliers will be classified. It will be explain and illustrad a iterative procedure for outlier detection and parameter estimation develop by Chang, Tiao and Chen (1988). Finally, in the sixth chapter, some conclusions are draw.
Ravirala, Narayana. "Device signal detection methods and time frequency analysis." Diss., Rolla, Mo. : University of Missouri-Rolla, 2007. http://scholarsmine.umr.edu/thesis/pdf/Ravirala_09007dcc803fea67.pdf.
Full textVita. The entire thesis text is included in file. Title from title screen of thesis/dissertation PDF file (viewed March 18, 2008) Includes bibliographical references (p. 89-90).
Alklid, Jonathan. "Time to Strike: Intelligent Detection of Receptive Clients : Predicting a Contractual Expiration using Time Series Forecasting." Thesis, Linnéuniversitetet, Institutionen för datavetenskap och medieteknik (DM), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-106217.
Full textTheissler, Andreas. "Detecting anomalies in multivariate time series from automotive systems." Thesis, Brunel University, 2013. http://bura.brunel.ac.uk/handle/2438/7902.
Full textEriksson, Tilda. "Change Detection in Telecommunication Data using Time Series Analysis and Statistical Hypothesis Testing." Thesis, Linköpings universitet, Matematiska institutionen, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-94530.
Full textKwong, Siu-shing. "Detection of determinism of nonlinear time series with application to epileptic electroencephalogram analysis." View the Table of Contents & Abstract, 2005. http://sunzi.lib.hku.hk/hkuto/record/B35512222.
Full textOliveira, Adriano Lorena Inácio de. "Neural networks forecasting and classification-based techniques for novelty detection in time series." Universidade Federal de Pernambuco, 2011. https://repositorio.ufpe.br/handle/123456789/1825.
Full textO problema da detecção de novidades pode ser definido como a identificação de dados novos ou desconhecidos aos quais um sistema de aprendizagem de máquina não teve acesso durante o treinamento. Os algoritmos para detecção de novidades são projetados para classificar um dado padrão de entrada como normal ou novidade. Esses algoritmos são usados em diversas areas, como visão computacional, detecçãao de falhas em máquinas, segurança de redes de computadores e detecção de fraudes. Um grande número de sistemas pode ter seu comportamento modelado por séries temporais. Recentemente o pro oblema de detecção de novidades em séries temporais tem recebido considerável atenção. Várias técnicas foram propostas, incluindo téecnicas baseadas em previsão de séries temporais com redes neurais artificiais e em classificação de janelas das s´eries temporais. As t´ecnicas de detec¸c ao de novidades em s´eries temporais atrav´es de previs ao t em sido criticadas devido a seu desempenho considerado insatisfat´orio. Em muitos problemas pr´aticos, a quantidade de dados dispon´ıveis nas s´eries ´e bastante pequena tornando a previs ao um problema ainda mais complexo. Este ´e o caso de alguns problemas importantes de auditoria, como auditoria cont´abil e auditoria de folhas de pagamento. Como alternativa aos m´etodos baseados em previs ao, alguns m´etodos baseados em classificação foram recentemente propostos para detecção de novidades em séries temporais, incluindo m´etodos baseados em sistemas imunol´ogicos artificiais, wavelets e m´aquinas de vetor de suporte com uma ´unica classe. Esta tese prop oe um conjunto de m´etodos baseados em redes neurais artificiais para detecção de novidades em séries temporais. Os métodos propostos foram projetados especificamente para detec¸c ao de fraudes decorrentes de desvios relativamente pequenos, que s ao bastante importantes em aplica¸c oes de detec¸c ao de fraudes em sistemas financeiros. O primeiro m´etodo foi proposto para melhorar o desempenho de detec¸c ao de novidades baseada em previs ao. Este m´etodo ´e baseado em intervalos de confian¸ca robustos, que s ao usados para definir valores adequados para os limiares a serem usados para detec¸c ao de novidades. O m´etodo proposto foi aplicado a diversas s´eries temporais financeiras e obteve resultados bem melhores que m´etodos anteriores baseados em previs ao. Esta tese tamb´em prop oe dois diferentes m´etodos baseados em classifica¸c ao para detec ¸c ao de novidades em s´eries temporais. O primeiro m´etodo ´e baseado em amostras negativas, enquanto que o segundo m´etodo ´e baseado em redes neurais artificiais RBFDDA e n ao usa amostras negativas na fase de treinamento. Resultados de simula¸c ao usando diversas s´eries temporais extra´ıdas de aplica¸c oes reais mostraram que o segundo m´etodo obt´em melhor desempenho que o primeiro. Al´em disso, o desempenho do segundo m´etodo n ao depende do tamanho do conjunto de teste, ao contr´ario do que acontece com o primeiro m´etodo. Al´em dos m´etodos para detec¸c ao de novidades em s´eries temporais, esta tese prop oe e investiga quatro diferentes m´etodos para melhorar o desempenho de redes neurais RBF-DDA. Os m´etodos propostos foram avaliados usando seis conjuntos de dados do reposit´orio UCI e os resultados mostraram que eles melhoram consideravelmente o desempenho de redes RBF-DDA e tamb´em que eles obt em melhor desempenho que redes MLP e que o m´etodo AdaBoost. Al´em disso, mostramos que os m´etodos propostos obt em resultados similares a k-NN. Os m´etodos propostos para melhorar RBF-DDA foram tamb´em usados em conjunto com o m´etodo proposto nesta tese para detec¸c ao de novidades em s´eries temporais baseado em amostras negativas. Os resultados de diversos experimentos mostraram que esses m´etodos tamb´em melhoram bastante o desempenho da detec¸c ao de fraudes em s´eries temporais, que ´e o foco principal desta tese.
Grobler, Trienko Lups. "Sequential and non-sequential hypertemporal classification and change detection of Modis time-series." Thesis, University of Pretoria, 2012. http://hdl.handle.net/2263/25427.
Full textThesis (PhD(Eng))--University of Pretoria, 2012.
Electrical, Electronic and Computer Engineering
unrestricted
Biswas, Debashis. "An Algorithm for Mining Adverse-Event Datasets for Detection of Post Safety Concern of a Drug." Scholarly Repository, 2010. http://scholarlyrepository.miami.edu/oa_theses/17.
Full textMohr, Maria [Verfasser], and Natalie [Akademischer Betreuer] Neumeyer. "Changepoint detection in a nonparametric time series regression model / Maria Mohr ; Betreuer: Natalie Neumeyer." Hamburg : Staats- und Universitätsbibliothek Hamburg, 2018. http://d-nb.info/1171988303/34.
Full textBracci, Lorenzo, and Amirhossein Namazi. "EVALUATION OF UNSUPERVISED MACHINE LEARNING MODELS FOR ANOMALY DETECTION IN TIME SERIES SENSOR DATA." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299734.
Full textMed utvecklingen av Sakernas internet och digitaliseringen av samhället kan man registrera tidsseriedata på allt fler platser, bland annat igenom närhetssensorer på bilar, temperatursensorer i tillverkningsanläggningar och rörelsesensorer i smarta hem. Detta ständigt ökande beroende i samhället av dessa enheter leder till ett behov av att upptäcka ovanligt beteende som kan orsakas av funktionsstörning i sensorn eller genom upptäckt av en ovanlig händelse. Det ovanliga beteendet som nämns kallas ofta för en anomali. För att upptäcka avvikande beteenden används avancerad teknik som kombinerar matematik och datavetenskap, som ofta kallas maskininlärning. För att hjälpa maskiner att lära sig värdefulla mönster behövs ofta mänsklig tillsyn, vilket i detta fall skulle motsvara användningsinspelningar som en person redan har klassificerat som avvikelser eller normala punkter. Tyvärr är det tidskrävande att märka data, särskilt de stora datamängder som skapas från sensorinspelningar. Därför utvärderas tekniker som inte kräver någon handledning i denna avhandling för att utföra anomalidetektering. Flera olika maskininlärningsmodeller utbildas på olika datamängder för att få en bättre förståelse för vilka tekniker som fungerar bättre när olika krav är viktiga, t.ex. närvaro av en mindre dataset eller strängare krav på inferens tid. Av de utvärderade modellerna resulterade OCSVM i bästa totala prestanda, uppnådde en noggrannhet på 85% och K- means var den snabbaste modellen eftersom det hade en inferens tid av 0,04 millisekunder. Dessutom visade LSTM- baserade modeller de bästa möjliga förbättringarna med större datamängder.
Tian, Runfeng. "An Enhanced Approach using Time Series Segmentation for Fault Detection of Semiconductor Manufacturing Process." University of Cincinnati / OhioLINK, 2019. http://rave.ohiolink.edu/etdc/view?acc_num=ucin1562923441016763.
Full textDou, Baojun. "Three essays on time series : spatio-temporal modelling, dimension reduction and change-point detection." Thesis, London School of Economics and Political Science (University of London), 2015. http://etheses.lse.ac.uk/3242/.
Full textMohr, Maria Verfasser], and Natalie [Akademischer Betreuer] [Neumeyer. "Changepoint detection in a nonparametric time series regression model / Maria Mohr ; Betreuer: Natalie Neumeyer." Hamburg : Staats- und Universitätsbibliothek Hamburg, 2018. http://nbn-resolving.de/urn:nbn:de:gbv:18-94167.
Full textKayastha, Nilam. "Application on Lidar and Time Series Landsat Data for Mapping and Monitoring Wetlands." Diss., Virginia Tech, 2014. http://hdl.handle.net/10919/54011.
Full textPh. D.