Rozprawy doktorskie na temat „Kolmogorov-Smirnov test”
Utwórz poprawne odniesienie w stylach APA, MLA, Chicago, Harvard i wielu innych
Sprawdź 31 najlepszych rozpraw doktorskich naukowych na temat „Kolmogorov-Smirnov test”.
Przycisk „Dodaj do bibliografii” jest dostępny obok każdej pracy w bibliografii. Użyj go – a my automatycznie utworzymy odniesienie bibliograficzne do wybranej pracy w stylu cytowania, którego potrzebujesz: APA, MLA, Harvard, Chicago, Vancouver itp.
Możesz również pobrać pełny tekst publikacji naukowej w formacie „.pdf” i przeczytać adnotację do pracy online, jeśli odpowiednie parametry są dostępne w metadanych.
Przeglądaj rozprawy doktorskie z różnych dziedzin i twórz odpowiednie bibliografie.
Böhm, Walter, i Kurt Hornik. "A Kolmogorov-Smirnov Test for r Samples". WU Vienna University of Economics and Business, 2010. http://epub.wu.ac.at/2960/1/Report105.pdf.
Pełny tekst źródłaSeries: Research Report Series / Department of Statistics and Mathematics
Andrade, Francisco Arruda Raposo. "New techniques for vibration condition monitoring : Volterra kernel and Kolmogorov-Smirnov". Thesis, Brunel University, 1999. http://bura.brunel.ac.uk/handle/2438/7871.
Pełny tekst źródłaSteele, Michael C., i n/a. "The Power of Categorical Goodness-Of-Fit Statistics". Griffith University. Australian School of Environmental Studies, 2003. http://www4.gu.edu.au:8080/adt-root/public/adt-QGU20031006.143823.
Pełny tekst źródłaSteele, Michael C. "The Power of Categorical Goodness-Of-Fit Statistics". Thesis, Griffith University, 2003. http://hdl.handle.net/10072/366717.
Pełny tekst źródłaThesis (PhD Doctorate)
Doctor of Philosophy (PhD)
Australian School of Environmental Studies
Full Text
Larson, Lincoln Gary. "Investigating Statistical vs. Practical Significance of the Kolmogorov-Smirnov Two-Sample Test Using Power Simulations and Resampling Procedures". Thesis, North Dakota State University, 2018. https://hdl.handle.net/10365/28770.
Pełny tekst źródłaLi, Rong. "A Tree-based Framework for Difference Summarization". Kent State University / OhioLINK, 2012. http://rave.ohiolink.edu/etdc/view?acc_num=kent1334277940.
Pełny tekst źródłaMao, Qian. "Clusters Identification: Asymmetrical Case". Thesis, Uppsala universitet, Informationssystem, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-208328.
Pełny tekst źródłaCarrier, Denis Joseph Gaston. "Automatic measurement of particles from holograms taken in the combustion chamber of a rocket motor". Thesis, Monterey, California. Naval Postgraduate School, 1988. http://hdl.handle.net/10945/22924.
Pełny tekst źródłaThis thesis describes the procedure used for the automatic measurement of particles from hologram taken in the combustion chamber of a rocket motor while firing. It describes the investigation done on two averaging techniques used to reduce speckle noise, capturing the image focused on a spinning mylar disk and software averaging of several image frames. The spinning disk technique proved superior for this application. The Kolmogorov-Smirnov two-sample test is applied to different particle samples in order to find an estimate of the number of particles required to obtain a stable distribution function. The number of particles is calculated and given. The last part of this study shows real particle distributions in the form of frequency histograms.
http://archive.org/details/automaticmeasure00carr
Major, Canadian Armed Forces
Lekomtcev, Demian. "Snímání spektra pro kognitivní rádiové sítě - vliv vlastností reálného komunikačního řetězce". Doctoral thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2016. http://www.nusl.cz/ntk/nusl-255288.
Pełny tekst źródłaBagdonavičius, Vilijandas B., Ruta Levuliene, Mikhail S. Nikulin i Olga Zdorova-Cheminade. "Tests for homogeneity of survival distributions against non-location alternatives and analysis of the gastric cancer data". Universität Potsdam, 2004. http://opus.kobv.de/ubp/volltexte/2011/5152/.
Pełny tekst źródłaZhang, Yan. "The impact of midbrain cauterize size on auditory and visual responses' distribution". unrestricted, 2009. http://etd.gsu.edu/theses/available/etd-04202009-145923/.
Pełny tekst źródłaTitle from file title page. Yu-Sheng Hsu, committee chair; Xu Zhang, Sarah. L. Pallas, committee members. Description based on contents viewed June 12, 2009. Includes bibliographical references (p. 37). Appendix A: SAS code: p. 38-53.
Novotná, Lenka. "Statistické metody pro popis provozu restaurace". Master's thesis, Vysoké učení technické v Brně. Fakulta podnikatelská, 2010. http://www.nusl.cz/ntk/nusl-222784.
Pełny tekst źródłaWärn, Caroline. "Deviating time-to-onset in predictive models : detecting new adverse effects from medicines". Thesis, Uppsala universitet, Institutionen för biologisk grundutbildning, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-257100.
Pełny tekst źródłaHaluzová, Dana. "Uplatnění statistických metod pro zkoumání vlastností nejprodávanějších přípravků na ochranu rostlin a vztahů mezi nimi". Master's thesis, Vysoké učení technické v Brně. Fakulta podnikatelská, 2018. http://www.nusl.cz/ntk/nusl-377387.
Pełny tekst źródłaApeltauer, Jiří. "Statistické vlastnosti mikrostruktury dopravního proudu". Doctoral thesis, Vysoké učení technické v Brně. Fakulta stavební, 2018. http://www.nusl.cz/ntk/nusl-390266.
Pełny tekst źródłaAu, Manix. "Automatic State Construction using Decision Trees for Reinforcement Learning Agents". Thesis, Queensland University of Technology, 2005. https://eprints.qut.edu.au/15965/1/Manix_Au_Thesis.pdf.
Pełny tekst źródłaAu, Manix. "Automatic State Construction using Decision Trees for Reinforcement Learning Agents". Queensland University of Technology, 2005. http://eprints.qut.edu.au/15965/.
Pełny tekst źródłaJečmínková, Michaela. "Využití regulačních diagramů pro kontrolu jakosti". Master's thesis, Vysoké učení technické v Brně. Fakulta podnikatelská, 2014. http://www.nusl.cz/ntk/nusl-224704.
Pełny tekst źródłaAguiar, Marcelo Figueiredo Massulo. "Redução no tamanho da amostra de pesquisas de entrevistas domiciliares para planejamento de transportes: uma verificação preliminar". Universidade de São Paulo, 2005. http://www.teses.usp.br/teses/disponiveis/18/18137/tde-28032014-193530/.
Pełny tekst źródłaThe main aim of this work is to verify, the possibility of reducing the sample size in home-interview surveys, without being detrimental to the quality and representation. The sub aim of this work is to analyze the influence of spatial characteristics and land use of an urban area. For both aims, the main analyses tool used was Data Miner called the Decision and Classification Tree which is in the software S-Plus 6.1. The Data Miner finds relations between trip chaining patterns and individual socioeconomic characteristics, spatial characteristics and land use patterns. The trip chaining patterns were coded in terms of chronological sequence of trip purpose, travel mode, travel time and the period of day in which travel occurs. The analyses were based on home-interview surveys carried out in the Belém Metropolitan Area in 2000, by Japan International Cooperation Agency and Pará State Government. In order to achieve the sub aim of this work, the method consisted of analyzing, using the Decision and Classification Tree, the influence of the categorical variable \"Macrozona\", which represents spatial characteristics and urban land use patterns, in trip chaining patterns carried by the individuals. Concerning the main aim, the method consisted of choosing sub-samples randomly containing 25% of the final sample of individuals and verifying (using Decision and Classification Tree and Kolmogorov-Smirnov statistical test) whether the models obtained from the reduced samples can describe the frequency of the occurrence of the individuals trip chaining patterns in the final sample well. The first conclusion is that spatial characteristics and land use of the urban area have influenced the trip chaining patterns, and therefore they were also included as independent variables in the models obtained from the sub-samples. The main conclusion was the non-rejection of the hypothesis that it is possible to reduce the sample size in home-interview surveys used for trip-chaining research. Nevertheless, several other verifications are necessary before accepting this conclusion.
Belkhira, Moussaad. "Tests de kolmogorov-smirnov dans le cas ou des parametres sont estimes". Paris 6, 1988. http://www.theses.fr/1988PA066056.
Pełny tekst źródłaBelkhira, Moussaad. "Tests de Kolmogorov-Smirnov dans le cas ou des paramètres sont estimés". Grenoble 2 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb376117075.
Pełny tekst źródłaPovalač, Karel. "Sledování spektra a optimalizace systémů s více nosnými pro kognitivní rádio". Doctoral thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2012. http://www.nusl.cz/ntk/nusl-233577.
Pełny tekst źródłaBezerra, Thiago Junqueira de Castro. "Estudo da sensibilidade do detector de neutrinos do Projeto ANGRA aos efeitos da queima do combustível nuclear". [s.n.], 2009. http://repositorio.unicamp.br/jspui/handle/REPOSIP/277698.
Pełny tekst źródłaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Fisica Gleb Wataghin
Made available in DSpace on 2018-08-14T15:51:55Z (GMT). No. of bitstreams: 1 Bezerra_ThiagoJunqueiradeCastro_M.pdf: 3958606 bytes, checksum: 2103ee29e4d2b1cf0f81e8738d681d27 (MD5) Previous issue date: 2009
Resumo: Reatores nucleares constituem uma profusa fonte de antineutrinos, cujo espectro é determinado pelos decaimentos beta dos isótopos radioativos presentes no combustível nuclear. À medida que o combustível é consumido, sua composição isotópica é alterada, com reflexos diretos no espectro de antineutrinos. Desta forma, investigamos neste trabalho a viabilidade de um detector de neutrinos monitorar o reator de uma usina nuclear, sabendo seu estado de atividade. Também investigamos a evolução temporal da resposta do detector à queima gradual do combustível nuclear. Assim, determinamos o tempo necessário de coleta de dados para identificarmos que o combustível nuclear evoluiu para outra composição, para vários níveis de confiança, com relação ao início de operação da usina. Estes resultados fazem da detecção de antineutrinos de reatores nucleares uma ferramenta adicional para a verificação de salvaguardas nucleares
Abstract: Nuclear reactors are a profuse neutrino source, which spectrum is determined by the beta decay of the fissile isotopes in the nuclear fuel. While the fuel is consumed, the isotopic composition changes, resulting in trends on the neutrino spectrum. So, we investigated in this work the viability of monitoring a reactor of a nuclear power plant with a neutrino detector, knowing its state of activity. We also investigated the temporal evolution of the response time of the detector in function of the gradual burn of the fuel. Therefore, with some confidence levels, we determined the needed time of data taking to identify fuel changes, in a PWR power plant, related to the beginning of operation. Consequently, these results make the detection of antineutrinos of nuclear reactors an additional method to nuclear safeguards
Mestrado
Física das Particulas Elementares e Campos
Mestre em Física
Falk, Matthew Gregory. "Incorporating uncertainty in environmental models informed by imagery". Thesis, Queensland University of Technology, 2010. https://eprints.qut.edu.au/33235/1/Matthew_Falk_Thesis.pdf.
Pełny tekst źródłaMessias, Cassiano Gustavo 1987. "Mapeamento das áreas suscetíveis à fragilidade ambiental na alta bacia do Rio São Francisco, Parque Nacional da Serra da Canastra - MG". [s.n.], 2014. http://repositorio.unicamp.br/jspui/handle/REPOSIP/286612.
Pełny tekst źródłaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Geociências
Made available in DSpace on 2018-08-25T23:24:24Z (GMT). No. of bitstreams: 1 Messias_CassianoGustavo_M.pdf: 23638977 bytes, checksum: e704bfa68254415de27c9956b5cdab14 (MD5) Previous issue date: 2014
Resumo: As paisagens rurais vêm sendo transformadas continuamente pela ocupação humana, principalmente em razão de adaptações técnicas requeridas para o desenvolvimento da agricultura. De maneira geral, estas alterações antrópicas estão diretamente ligadas à utilização dos recursos naturais como insumos da produção agrícola. Os recursos mais impactados por este modo de produção são a vegetação e o solo. Dentre as formas de avaliação do grau de comprometimento da paisagem em razão da exploração agrícola do território é o mapeamento da fragilidade ambiental. Esta pesquisa teve como principal objetivo avaliar os graus de fragilidade ambiental de diferentes áreas do Parque Nacional da Serra da Canastra, situado no sudoeste de Minas Gerais. Criado em 1972, o parque tem como meta principal preservar ecossistemas naturais ainda existentes no bioma do cerrado brasileiro. A metodologia de mapeamento da fragilidade ambiental utilizada neste trabalho baseia-se em cinco variáveis geográficas: índice de vegetação, probabilidade de ocorrência de chuvas intensas, declividades, densidade de estradas e densidade de lineamentos estruturais. Estas variáveis foram processadas em sistemas de informação geográfica, por meio de técnicas de análise espacial, utilizadas para a transformação destas, mapeadas segundo a lógica booleana, em variáveis probabilísticas fuzzy. Os mapas fuzzy foram combinados por meio de algoritmo baseado em soma ponderada, gerando-se um mapa de fragilidade ambiental do Parque Nacional. Este mapa final foi comparado a mapas de processos erosivos e de movimento de massa, checados em campo, com o objetivo de se atribuir pesos às variáveis ambientais por meio do teste de Kolmogorov-Smirnov. A metodologia se mostrou eficiente para a identificação e mapeamento de áreas com maior grau de fragilidade no parque, considerando-se a evidência dos processos erosivos e dos movimentos de massa
Abstract: Rural landscapes have been continually transformed by human occupation, mainly due to technical adjustments required for the development of agriculture. In general, these anthropogenic changes are directly linked to the use of natural resources as inputs into agricultural production. The resources most impacted by this mode of production are the vegetation and soil. Among the manners of assessing the degree of landscape vulnerability is the environmental fragility mapping. This research aimed to assess the degree of environmental vulnerability of different areas located within the Serra da Canastra National Park, located in southwestern Minas Gerais. Created in 1972, the park has as main goal to preserve remaining natural ecosystems of the Brazilian Cerrado biome. The methodology for environmental fragility mapping, used in this work, is based on five geographic variables: vegetation index, probability of intense rainfall, slope terrain, roads and structural lineaments densities. These variables, mapped according to the Boolean logic, were processed in a geographic information system through spatial analysis techniques and transformed in fuzzy probabilistic variables. The fuzzy maps were combined by means of algorithm based on a weighted sum, generating the environmental fragility map of the National Park. The estimative of weights values of the five environmental variables was carried out comparing erosion-mass movement maps and the fragility map, using the D-value of Kolmogorov-Smirnov test. Considering the evidence of erosion and mass movements, we concluded that the methodology is efficient for the identification and mapping of areas with the high degree of fragility in the park
Mestrado
Análise Ambiental e Dinâmica Territorial
Mestre em Geografia
Lindahl, Fred. "Detection of Sparse and Weak Effects in High-Dimensional Supervised Learning Problems, Applied to Human Microbiome Data". Thesis, KTH, Matematisk statistik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288503.
Pełny tekst źródłaDetta projekt studerar signaldetekterings- och identifieringsproblemet i högdimensionell brusig data och möjligheten att använda det på mikrobiomdata från människor. En omfattande simuleringsstudie utfördes på genererad data samt ett mikrobiomdataset som samlats in på patienter med Parkinsons sjukdom, med hjälp av ett antal goodness-of-fit-metoder: Donoho och Jins Higher criticis , Jager och Wellners phi-divergenser och Stepanova och Pavelenkos CsCsHM. Vi presenterar några nya tillvägagångssätt baserade på vedertagen teori som visar sig fungera bättre än befintliga metoder och visar att det är möjligt att använda signalidentifiering för att upptäcka olika funktioner i mikrobiomdata. Även om de nya metoderna ger goda resultat saknar de betydande matematiska grunder och bör undvikas om teoretisk formalism är nödvändigt. Vi drar också slutsatsen att medan vi har funnit att det är möjligt att använda signalidentifieringsmetoder för att hitta information i mikrobiomdata, är ytterligare experiment nödvändiga innan de kan användas på ett korrekt sätt i forskning.
Petit, Frédéric. "Modélisation et simulation d'une chambre réverbérante à brassage de modes à l'aide de la méthode des différences finies dans le domaine temporel". Phd thesis, Université de Marne la Vallée, 2002. http://tel.archives-ouvertes.fr/tel-00003238.
Pełny tekst źródłaélectromagnétiques connaît une croissance sans précédent depuis quelques années, grâce
notamment au développement de la téléphonie mobile. La chambre réverbérante est un
moyen d'essais qui permet d'étudier l'influence de ces ondes électromagnétiques sur un
appareil électronique particulier. Cependant, le fonctionnement d'une chambre
réverbérante étant complexe, il est primordial de procéder à des simulations afin de
déterminer quels sont les paramètres cruciaux entrant en jeu.
Le travail de cette thèse consiste à modéliser et à simuler le fonctionnement d'une
chambre réverbérante à l'aide de la méthode des différences finies dans le domaine
temporel. Après une brève étude portant sur quelques résultats de mesures de champ et
de puissances effectuées dans une chambre réverbérante, le chapitre~2 aborde les
différents problèmes liés à la modélisation de la chambre. La notion de pertes étant
déterminante pour évaluer le fonctionnement d'une chambre réverbérante, deux méthodes
implémentant ces pertes sont aussi exposées dans ce chapitre. L'étude menée dans le
chapitre~3 consiste à analyser l'influence du brasseur sur les premiers modes propres
de la chambre, ceux-ci pouvant être décalés de plusieurs MHz. Le chapitre~4 présente
des résultats de simulations en hautes fréquences comparés à des résultats
statistiques théoriques. Le cas de la présence d'un objet au sein de la chambre
pouvant perturber le champ est aussi abordé. Enfin, le chapitre~5 montre une
comparaison des résultats statistiques dans le cas où l'on considère plusieurs formes
de brasseurs.
Tsai, Wen-Chi, i 蔡文綺. "A Kolmogorov-Smirnov Type Goodness-of-Fit Test of Multinomial Logistic Regression Model in Case-Control Studies". Thesis, 2016. http://ndltd.ncl.edu.tw/handle/xyrjap.
Pełny tekst źródła淡江大學
統計學系碩士班
104
The multinomial logistic regression model is used popularly for inferring the relationship of risk factors and disease with multiple categories. This thesis bases on the discrepancy between the nonparametric maximum likelihood estimator and semiparametric maximum likelihood estimator of the cumulative distribution function to propose a Kolmogorov-Smirnov type test statistic to assess adequacy of the multinomial logistic regression model for case-control data. A bootstrap procedure is presented to calculate the p-value of the proposed test statistic. Empirical type I error rates and powers of the test are evaluated by simulation studies. Some examples will be illustrated the implementation of the test.
Witzgall, Laila Chahrazad. "Nonparametric segmentation of nonstationary time series". Master's thesis, 2016. http://hdl.handle.net/10451/24924.
Pełny tekst źródłaA análise de séries temporais trata do estudo de dados colectados durante determinado período de tempo. Uma série temporal consiste numa série de dados listados por ordem temporal, e é constituído por uma sequência de dados medida sucessivamente em intervalos de tempo equidistantes, ou não. O estudo de séries temporais é um campo vasto da estatística que se ramifica a várias áreas da ciência. A análise de séries temporais consiste em métodos de análise de dados com o objectivo de extrair elementos estatísticos e outras características relevantes e ocorre frequentemente no contexto da estatística, econometria, geofísica, meteorologia e outras áreas onde uma das principais motivações para o estudo destas séries temporais é a previsão. Uma grande parte dos sistemas complexos encontrados na vida real têm associados séries temporais empíricas que exibem graus variáveis de não-estacionariedade, como por exemplo medições da velocidade do vento, séries temporais financeiras, entre outros. Um processo estocástico estacionário tem como propriedade que a estrutura da média, variância e autocorrelação não se altera no tempo. Um dos focos desta área de estudo é o tratamento de séries temporais não-estacionárias através de algoritmos de segmentação. A segmentação de séries temporais consiste em dividir a série em fragmentos, baseando a decisão de segmentação num critério pré-determinado no algoritmo. Neste trabalho explora-se um algoritmo de segmentação automática recursiva não-paramétrica baseado no teste estatístico de Kolmogorov-Smirnov para séries temporais não-estacionárias provenientes de processos complexos. A segmentação permite dividir a série temporal em fragmentos onde a estatística é idêntica, criando assim janelas de estacionariedade dentro de uma série não-estacionária. O teste de Kolmogorov-Smirnov é um teste totalmente não-paramétrico que avalia a igualdade de distribuições de probabilidade contínuas que pode ser utilizado para comparar uma amostra de dados com uma distribuição de probabilidade de referência, Teste de Kolmogorov-Smirnov para uma amostra, ou pode ser utilizado para comparar duas amostras de dados e neste caso designa-se por Teste de Kolmogorov-Smirnov para duas amostras. Este teste possibilita-nos testar se duas amostras pertencem a uma mesma distribuição sem necessidade de especificar qual, isto resulta da análise da diferença entre duas funções de distribuição cumulativas e observar em que ponto esta diferença absoluta é máxima. Esta diferença designa-se por distância de Kolmogorov-Smirnov. Neste trabalho utiliza-se o conceito de teste de hipóteses que consiste numa categoria de inferência estatística fazendo parte de teoria da decisão. Um teste de hipóteses inicia com a proposta de uma hipótese nula, em como um modelo probabilístico descreve as observações de determinada experiência. A questão abordada no teste tem como consequência dois possíveis resultados: aceitar ou rejeitar a hipótese nula. Neste caso estamos interessados em testar a existência de uma distribuição comum entre duas amostras de séries temporais. Dada a hipótese nula de que as duas amostras pertencem à mesma distribuição, podemos testar esta relativamente à hipótese alternativa de que as distribuições têm funções de distribuição cumulativas diferentes. Para cada amostra calcula-se a função de distribuição cumulativa e a diferença entre elas ponto a ponto. Comparamos esta distância e extraímos a distância máxima que constitui a estatística do teste, a distância de Kolmogorov-Smirnov entre as duas funções. O algoritmo de segmentação para séries temporais aqui desenvolvido baseia-se nesta distância entre funções de distribuição cumulativas e funciona, em suma, da seguinte forma: dada uma série temporal e um ponteiro que se move sequencialmente em toda a série, a cada posição do ponteiro é feito um corte na amostra e são comparados os dois fragmentos resultantes. É calculada a estatística de Kolmogorov-Smirnov e quando o algoritmo percorre toda a série temporal é extraído o valor máximo desta estatística. Por sua vez, é nesta posição, onde o valor máximo é encontrado que o algoritmo propõe uma posição de corte da série temporal e compara este com a significância de uma possível posição de segmentação. Este processo é então aplicado iterativamente até não existirem mais propostas de posições de corte ou o fragmento testado tem tamanho inferior a um tamanho pré-determinado. O objectivo principal do trabalho consistiu em caracterizar o algoritmo de segmentação testando séries temporais artificiais compostas por números aleatórios de distribuições diferentes, Gaussiana, log-normal e Cauchy. A escolha das distribuições de log-normal e de Cauchy foi motivada por estas serem classificadas como classes de distribuições com heavy tails, i.e., a cauda da distribuição é mais acentuada e decai como uma power-law. Muitas séries temporais de sistemas reais apresentam heavy tails e por esta razão é importante explorar o algoritmo e optimizá-lo para este tipo de distribuições. Explora-se também a função de probabilidade do teste de Kolmogorov-Smirnov e o critério de significância para amostras de tamanho muito grande. Este critério não se mostra adequado para o algoritmo aqui desenvolvido porque assume que as amostras comparadas pelo algoritmo são independentes o que não é o caso. O algoritmo tem como entrada uma série temporal que é dividida recursivamente em pares de fragmentos que são posteriormente comparados entre si o que torna os dados interdependentes e por este motivo utiliza-se um critério de significância adequado sugerido na literatura. Numa fase seguinte realizam-se testes numéricos extensivos para avaliar a precisão e eficiência do algoritmo para diferentes distribuições, nomeadamente, Gaussiana, log-normal e Cauchy. O algoritmo de segmentação de Kolmogorov-Smirnov mostra comportar-se bem mesmo quando testado em distribuições com heavy tails, caso em que o teste de Kolmogorov-Smirnov é, em teoria, menos sensível. Motivados por isto e procurando optimizar o desempenho do algoritmo para distribuições com heavy-tails introduzimos uma mudança ao algoritmo onde substituímos o teste de Kolmogorov-Smirnov pelo teste de Anderson-Darling que consiste em adicionar um termo com uma função de peso. Esta função de peso permite uma maior flexibilidade no sentido que mediante a escolha certa dá mais peso a determinada zona da distribuição, no nosso caso, a cauda. Com esta alteração ao algoritmo de segmentação analisou-se o comportamento do critério de significância que se mostrou continuar adequado. O algoritmo de segmentação com o teste de Anderson-Darling foi então aplicado a séries temporais construídas a partir de números aleatórios gerados a partir da distribuição de Cauchy e comparado à versão do algoritmo com o teste de Kolmogorov-Smirnov. Em seguida analisa-se o desempenho do algoritmo de segmentação no espaço de parâmetros das distribuições para as duas versões do algoritmo, com o teste de Kolmogorov-Smirnov e com a introdução da modificação de Anderson-Darling. Com esta análise é possível fazer uma análise quantitativa do desempenho do algoritmo e deste modo estabelecer uma comparação entre ambas as vertentes do algoritmo. Esperava-se que a implementação do teste de Anderson-Darling otimizasse significativamente o desempenho do algoritmo quando aplicado a distribuições com heavy-tails verificando-se apenas uma ligeira melhoria quando aplicado a uma série temporal de Cauchy. Trabalho futuro poderia consistir em melhorar desempenho do algoritmo de segmentação em séries temporais com heavy tails, aumentando a sua sensibilidade nas caudas da distribuição. Será interessante aplicar o algoritmo a medições empíricas de sistemas complexos reais tais como sistemas geofísicos ou sistemas socio-económicos situações onde distribuições com heavy tails têm um papel crucial. Será igualmente interessante analisar como é que o algoritmo de segmentação modificado, com a implementação do teste de Anderson-Darling ao invés do de Kolmogorov-Smirnov, aqui apresentado poderá auxiliar na distinção de diferentes regimes de parâmetros em séries temporais complexas de sistemas físicos reais, como por exemplo dados de mercados financeiros onde ocorrem tipicamente oscilações entre diferentes estados de mercado acompanhados de alterações nas distribuições de retorno, estruturas de correlação, expoentes de Hurst entre outros. Possivelmente em combinação com outras ferramentas estatísticas sensíveis a alterações nas quantidades previamente mencionadas, uma rotina de segmentação automatizada poderá ser útil, eficiente e uma assistência facilmente programável em decision-making.
Many empirical time series that arise in real-world complex systems are found to exhibit varying degrees of nonstationarity, such as atmosferic wind fields and financial time series. A nonparametric segmentation method for nonstationary time series has been implemented based on an existing algorithm using the statistical Kolmogorov-Smirnov test for equality of cumulative distribution functions. Starting from an automated segmentation algorithm based on the Kolmogorov-Smirnov distance for Gaussian, log-normal and Cauchy distributed random time series, we have attempted to characterize and improve the segmentation performance for heavy tailed time series. A time series can be understood to be composed of a series of reasonably long segments, for each of which its properties are stationary. The nonparametric segmentation algorithm presented here divides the time series recursively into segments and for each pair of resulting segments congruence of the respective empirical probability distribution function is asserted by the Kolmogorov-Smirnov test. The Kolmogorov-Smirnov test is weakly sensitive in the tails of the tested sample, when often these tail events are most interesting. For this reason we introduce a modification to the segmentation algorithm, replacing the Kolmogorov-Smirnov test with the Anderson-Darling test, incorporating a weight function to allow more flexibility in the test and account for the tails. In a primary phase we make a complete characterization of the segmentation algorithm and look to make improvements for heavy tailed distributions. We explore the Kolmogorov-Smirnov probability function for large sample sizes and the significance criterion for the classic Kolmogorov-Smirnov test and examine a proposed significance criterion suited for data that is not independent, which is our case because we start from an integral time series that is recursively divided into fragments and compared. In a final phase we investigate the efficiency and performance range of the segmentation algorithm with the Kolmogorov-Smirnov test for Gaussian, log-normal and Cauchy distributed time series. We implement the Anderson-Darling test and establish a comparison with the Kolmogorov-Smirnov based segmentation algorithm for heavy tailed distributed time series.
Greenberg, Simon L. "Bivariate goodness-of-fit tests based on Kolmogorov-Smirnov type statistics". Thesis, 2008. http://hdl.handle.net/10210/437.
Pełny tekst źródłaNeto, Miguel Ângelo Silva. "Traffic classification based on statistical tests for matching empirical distributions of lengths of IP packets". Master's thesis, 2013. http://hdl.handle.net/10400.6/3885.
Pełny tekst źródła