Dissertations / Theses on the topic 'MFCC'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'MFCC.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Mukherjee, Rishiraj. "Speaker Recognition Using Shifted MFCC." Scholar Commons, 2012. http://scholarcommons.usf.edu/etd/4136.
Full textTolunay, Atahan. "Text-Dependent Speaker Verification Implemented in Matlab Using MFCC and DTW." Thesis, Linköpings universitet, Informationskodning, 2010. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-60992.
Full textKrotký, Jan. "Dekodér pro systém detekce klíčových slov." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2009. http://www.nusl.cz/ntk/nusl-218176.
Full textMubarak, Omer Mohsin Electrical Engineering & Telecommunications Faculty of Engineering UNSW. "Speech and music discrimination using short-time features." Awarded by:University of New South Wales. Electrical Engineering & Telecommunications, 2006. http://handle.unsw.edu.au/1959.4/31954.
Full textPan, Linlin. "Research and simulation on speech recognition by Matlab." Thesis, Högskolan i Gävle, Avdelningen för elektronik, matematik och naturvetenskap, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:hig:diva-16950.
Full textSIQUEIRA, JAN KRUEGER. "CONTINUOUS SPEECH RECOGNITION WITH MFCC, SSCH AND PNCC FEATURES, WAVELET DENOISING AND NEURAL NETWORKS." PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO, 2011. http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=19143@1.
Full textUm dos maiores desafios na área de reconhecimento de voz contínua é desenvolver sistemas robustos ao ruído aditivo. Para isso, este trabalho analisa e testa três técnicas. A primeira delas é a extração de atributos do sinal de voz usando os métodos MFCC, SSCH e PNCC. A segunda é a remoção de ruído do sinal de voz via wavelet denoising. A terceira e última é uma proposta original batizada de feature denoising, que busca melhorar os atributos extraídos usando um conjunto de redes neurais. Embora algumas dessas técnicas já sejam conhecidas na literatura, a combinação entre elas trouxe vários resultados interessantes e inéditos. Inclusive, nota-se que o melhor desempenho vem da união de PNCC com feature denoising.
One of the biggest challenges on the continuous speech recognition field is to develop systems that are robust to additive noise. To do so, this work analyses and tests three techniques. The first one extracts features from the voice signal using the MFCC, SSCH and PNCC methods. The second one removes noise from the voice signal through wavelet denoising. The third one is an original one, called feature denoising, that seeks to improve the extracted features using a set of neural networks. Although some of these techniques are already known in the literature, the combination of them brings many interesting and new results. In fact, it is noticed that the best performance comes from the union of PNCC and feature denoising.
Dobrovolskis, Martynas. "Šnekos atpažinimas." Master's thesis, Lithuanian Academic Libraries Network (LABT), 2005. http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2005~D_20050614_154005-58155.
Full textJulien, Eric. "Alignement du chant par rapport à une référence audio en temps réel." Mémoire, Université de Sherbrooke, 2013. http://hdl.handle.net/11143/6184.
Full textMartins, Ana Caroline Vasconcelos. "GluA2 - Glutamatergic Receptor Study: A Molecular Approach." reponame:Repositório Institucional da UFC, 2017. http://www.repositorio.ufc.br/handle/riufc/28258.
Full textRejected by Weslayne Nunes de Sales (weslaynesales@ufc.br), reason: A aluna optou por publicar apenas os elementos pré-textuais. on 2017-12-01T12:36:51Z (GMT)
Submitted by José Orlando Soares de Oliveira (orlando.soares@bol.com.br) on 2017-12-01T13:50:35Z No. of bitstreams: 1 Tese corrigida - elementos pretextuais.pdf: 159585 bytes, checksum: 9531b29bc8c5a46f5ed5753442df383f (MD5)
Approved for entry into archive by Weslayne Nunes de Sales (weslaynesales@ufc.br) on 2017-12-01T13:57:30Z (GMT) No. of bitstreams: 1 Tese corrigida - elementos pretextuais.pdf: 159585 bytes, checksum: 9531b29bc8c5a46f5ed5753442df383f (MD5)
Made available in DSpace on 2017-12-01T13:57:30Z (GMT). No. of bitstreams: 1 Tese corrigida - elementos pretextuais.pdf: 159585 bytes, checksum: 9531b29bc8c5a46f5ed5753442df383f (MD5) Previous issue date: 2017-11-17
Glutamate receptors are the mediators of most excitatory neurotransmission processes in the central nervous system, acting as prominent targets for the treatment of several neurological disorders such as Epilepsy, Amyotrophic Lateral Sclerosis, Parkinson’s disease and Alzheimer’s disease. Hence an improved understanding of how glutamate and other ligands interact with the binding domain, of these receptors, can bring relevant insights to the development of new ligands. Therefore, this work aims to study the GluA2–ligand interaction using the structure of GluA2 co-crystallized with the ligands glutamate, AMPA, kainate and DNQX applying a method based on the Density Functional Theory combined with the molecular fractionation with conjugate caps scheme. To address that the dielectric constant of the GluA2 receptor is not homogeneous, a novel molecular approach was proposed and it was applied to study the interaction between the GluA2 and the ligands glutamate, AMPA, kainate and DNQX. The results obtained, considering the inhomogeneous model, were compared with those obtained using an uniform dielectric function for the GluA2 receptor and with data published in the literature establishing a more detailed description of the relevant amino acid residues for the protein-ligand binding interaction. Molecular dynamics studies and protein DFT calculations usually consider a fixed value for the protein dielectric function. In this work when ε = 1 is considered, many amino acid residues seem important, but when the dielectric constant shield was considered, they lost their relevance. The results for the GluA2-ligand total interaction energy and the D1-ligand and D2-ligand total interaction energy also shed some light on the differentiation between full and partial agonists, and between agonists and antagonists. Additionally, the results allow a hypothesis on the correlation between the Glu705-ligand interaction energy and the ligand action, paving the way for the use of the inhomogeneous dielectric function to study glutamate receptors and other protein-ligand systems. Finally, the results also suggests that for different ligands, different homogeneous dielectric constant will be able to well represent the system GluA2-ligand, making it necessary the previous analyses with the inhomogeneous dielectric constant approach.
Os receptores de glutamato são os mediadores da maioria dos processos de neurotransmissão excitatória no sistema nervoso central, atuando como alvos proeminentes para o tratamento de vários distúrbios neurológicos, como Epilepsia, Esclerose Lateral Amiotrófica, Doença de Parkinson e Doença de Alzheimer. Assim, uma compreensão aprimorada de como o glutamato e outros ligantes interagem com o domínio de interação, desses receptores, pode trazer informações relevantes para o desenvolvimento de novos ligantes. Portanto, este trabalho teve por objetivo estudar a interação GluA2-ligante utilizando a estrutura de GluA2 co-cristalizada com os ligantes Glutamato, AMPA, Cainato e DNQX utilizando método baseado na Teoria do Funcional da Densidade combinado com o esquema de fracionamento molecular com capas conjugadas. Para abordar que a constante dielétrica do receptor GluA2 não é homogênea, foi proposta uma nova abordagem molecular, que foi aplicada para estudar a interação entre a GluA2 e os ligantes Glutamato, AMPA, Cainato e DNQX. Os resultados obtidos, considerando o modelo não-homogêneo, foram comparados com aqueles obtidos usando uma função dielétrica uniforme para o receptor GluA2 e com dados publicados na literatura, estabelecendo uma descrição mais detalhada dos resíduos de aminoácido mais relevantes para a interação proteína-ligante. Estudos de dinâmica molecular e cálculos DFT de sistemas proteicos normalmente consideram um valor fixo para a função dielétrica proteica. Nesse trabalho quando ε = 1 é considerado, muitos resíduos de aminoácido parecem relevantes, mas quando a blindagem da constante dielétrica foi considerada, eles perderam sua relevância. Os resultados apresentados para a energia de interação total GluA2-ligante e a energia de interação total D1-ligante e D2-ligante contribuiu com a diferenciação entre agonistas totais e agonistas parciais e entre agonistas e antagonistas. Além disso, os resultados permitem que seja feita hipótese sobre a correlação entre a energia de interação Glu705-ligante e a ação do ligante, abrindo caminho para o uso da função dielétrica não-homogênea para estudar receptores de glutamato e outros sistemas proteína-ligante. Por fim, os resultados também sugerem que para diferentes ligantes, diferentes constantes dielétricas homogêneas serão capazes de representar bem o sistema GluA2-ligante, tornando necessária a análise prévia com a abordagem da constante dielétrica não-homogênea.
SILVA, HARRY ARNOLD ANACLETO. "INDEPENDENT TEXT ROBUST SPEAKER RECOGNITION IN THE PRESENCE OF NOISE USING PAC-MFCC AND SUB BAND CLASSIFIERS." PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO, 2011. http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=18212@1.
Full textO presente trabalho é proposto o atributo PAC-MFCC operando com Classificadores em Sub-Bandas para a tarefa de identificação de locutor independente do texto em ruído. O sistema proposto é comparado com os atributos MFCC (Coeficientes Cepestrais de Frequência Mel), PAC- MFCC (Fase Autocorrelação-MFCC ) sem uso de classificadores em sub-bandas, SSCH(Histogramas de Centróides de Sub-Bandas Espectrais) e TECC (Coeficientes Cepestrais da Energia Teager). Nesta tarefa de reconhecimento, utilizou-se a base TIMIT a qual é composta de 630 locutores onde cada um deles falam 10 frases de aproximadamente 3 segundos cada frase, das quais 8 frases foram utilizadas para treinamento e 2 para teste, obtendo-se um total de 1260 locuções para o reconhecimento. Investigou-se o desempenho dos diversos sistemas utilizando diferentes tipos de ruídos da base Noisex 92 com diferentes relação sinal ruído. Verificou-se que a taxa de acerto da técnica PAC-MFCC com classificador em Sub-Bandas apresenta o melhor desempenho em comparação com as outras técnicas quando se tem uma relação sinal ruído menor que 10dB.
In this work is proposed the use of the PAC-MFCC feature with Sub-band Classifiers for the task of text-independent speaker identification in noise. The proposed scheme is compared with the features MFCC (Mel-Frequency Cepstral Coefficients ), PAC-MFCC (Phase Autocorrelation MFCC) without subband classifiers, SSCH (Subband Spectral Centroid Histograms) and TECC (Teager Energy Cepstrum Coefficients). In this recognition task, we used the TIMIT database which consists of 630 speakers, where every one of them speak 10 utterances of 3 seconds each one approximately, of which eight utterance were used for training and two for testing, thus obtaining a total of 1260 test utterance for the recognition. We investigated the performance of these techniques using differents types of noise from the base Noisex 92 with different signal to noise ratios. It was found that the accuracy rate of the PAC-MFCC feature with Sub-band Classifiers performs better in comparison with other techniques at a lower signal noise(less than 10dB).
Anifowose, Olakunle. "DESIGN OF A KEYWORD SPOTTING SYSTEM USING MODIFIED CROSS-CORRELATION IN THE TIME AND THE MFCC DOMAIN." Master's thesis, Temple University Libraries, 2012. http://cdm16002.contentdm.oclc.org/cdm/ref/collection/p245801coll10/id/205117.
Full textM.S.E.E.
Abstract A Keyword Spotting System (KWS) is a system that recognizes predefined keywords in spoken utterances or written documents. The objective is to obtain the highest possible keyword detection rate without increasing the number of false detections in a system. The common approach to keyword spotting is the use of a Hidden Markov Model (HMM). These are usually complex systems which require training speech data. The Typical HMM approach uses garbage templates or HMM models to match non-keyword speech and non-speech sounds. The purpose of this research is to design a simple Keyword Spotting System. The system will be designed to spot English words and should be easily adaptable to other languages There are many challenges in designing a keyword spotting system such as variations in speech like pitch, loudness, timbre that make recognition difficult. There can be wide variations in utterances even from the same speaker. In this research, the use of cross-correlation, as an alternative means for detecting keywords in an utterance, was investigated. This research also involves the modeling of a global keyword using a quantized dynamic time warping algorithm, which can function effectively with multi-speakers. The global keyword is an aggregation of the features from several occurrences of the same keyword. This research also investigates the effect of pitch normalization on keyword detection. The use of cross-correlation as a method for keyword spotting was investigated in both the time and MFCC domain. In the time domain the global keyword was cross-correlated with a pitch-normalized utterance. A zero lag ratio (the ratio of the power around the zero lag obtained from a cross correlation to the power in the rest of the signal is computed) was computed for each speech frame, a threshold was then used to determine if the keyword is present. For the MFCC domain the MFCC features of each keyword were computed, normalized and cross-correlated with the normalized MFCC features of portions of the utterance of the same size as the keyword. Cross-correlation of MFCC features of the keyword with that of each portion of the utterance yields a single value between 0-1. The portion with the highest value is usually the location of the keyword. Results in the time domain varied from keyword to keyword, some words showed a 60% hit rate while the average obtained from various keywords from the Call Home database had an average of 41%. Cross-correlation of the keywords and utterance in the MFCC domain yielded a 66% hit rate in test conducted on all different keywords in the Call Home and Switchboard corpus. The system accuracy is keyword dependent with some keywords having an 85% hit rate
Temple University--Theses
Vrba, Václav. "Robustní detekce klíčových slov v řečovém signálu." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2014. http://www.nusl.cz/ntk/nusl-220670.
Full textGORDILLO, CHRISTIAN DAYAN ARCOS. "CONTINUOUS SPEECH RECOGNITION BY COMBINING MFCC AND PNCC ATTRIBUTES WITH SS, WD, MAP AND FRN METHODS OF ROBUSTNESS." PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO, 2013. http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=23090@1.
Full textCOORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR
PROGRAMA DE EXCELENCIA ACADEMICA
O crescente interesse por imitar o modelo que rege o processo cotidiano de comunicação humana através de maquinas tem se convertido em uma das áreas do conhecimento mais pesquisadas e de grande importância nas ultimas décadas. Esta área da tecnologia, conhecida como reconhecimento de voz, em como principal desafio desenvolver sistemas robustos que diminuam o ruído aditivo dos ambientes de onde o sinal de voz é adquirido, antes de que se esse sinal alimente os reconhecedores de voz. Por esta razão, este trabalho apresenta quatro formas diferentes de melhorar o desempenho do reconhecimento de voz contınua na presença de ruído aditivo, a saber: Wavelet Denoising e Subtração Espectral, para realce de fala e Mapeamento de Histogramas e Filtro com Redes Neurais, para compensação de atributos. Esses métodos são aplicados isoladamente e simultaneamente, afim de minimizar os desajustes causados pela inserção de ruído no sinal de voz. Alem dos métodos de robustez propostos, e devido ao fato de que os e conhecedores de voz dependem basicamente dos atributos de voz utilizados, examinam-se dois algoritmos de extração de atributos, MFCC e PNCC, através dos quais se representa o sinal de voz como uma sequência de vetores que contêm informação espectral de curtos períodos de tempo. Os métodos considerados são avaliados através de experimentos usando os software HTK e Matlab, e as bases de dados TIMIT (de vozes) e NOISEX-92 (de ruído). Finalmente, para obter os resultados experimentais, realizam-se dois tipos de testes. No primeiro caso, é avaliado um sistema de referência baseado unicamente em atributos MFCC e PNCC, mostrando como o sinal é fortemente degradado quando as razões sinal-ruıdo são menores. No segundo caso, o sistema de referência é combinado com os métodos de robustez aqui propostos, analisando-se comparativamente os resultados dos métodos quando agem isolada e simultaneamente. Constata-se que a mistura simultânea dos métodos nem sempre é mais atraente. Porem, em geral o melhor resultado é obtido combinando-se MAP com atributos PNCC.
The increasing interest in imitating the model that controls the daily process of human communication trough machines has become one of the most researched areas of knowledge and of great importance in recent decades. This technological area known as voice recognition has as a main challenge to develop robust systems that reduce the noisy additive environment where the signal voice was acquired. For this reason, this work presents four different ways to improve the performance of continuous speech recognition in presence of additive noise, known as Wavelet Denoising and Spectral Subtraction for enhancement of voice, and Mapping of Histograms and Filter with Neural Networks to compensate for attributes. These methods are applied separately and simultaneously two by two, in order to minimize the imbalances caused by the inclusion of noise in voice signal. In addition to the proposed methods of robustness and due to the fact that voice recognizers depend mainly on the attributes voice used, two algorithms are examined for extracting attributes, MFCC, and PNCC, through which represents the voice signal as a sequence of vectors that contain spectral information for short periods of time. The considered methods are evaluated by experiments using the HTK and Matlab software, and databases of TIMIT (voice) and Noisex-92 (noise). Finally, for the experimental results, two types of tests were carried out. In the first case a reference system was assessed based on MFCC and PNCC attributes, only showing how the signal degrades strongly when signal-noise ratios are higher. In the second case, the reference system is combined with robustness methods proposed here, comparatively analyzing the results of the methods when they act alone and simultaneously. It is noted that simultaneous mix of methods is not always more attractive. However, in general, the best result is achieved by the combination of MAP with PNCC attributes.
Al-Ali, Ahmed Kamil Hasan. "Forensic speaker recognition under adverse conditions." Thesis, Queensland University of Technology, 2019. https://eprints.qut.edu.au/130783/1/Ahmed%20Kamil%20Hasan_Al-Ali_Thesis.pdf.
Full textViana, Hesdras Oliveira. "Descritor de voz invariante ao ruído." Universidade Federal de Pernambuco, 2013. https://repositorio.ufpe.br/handle/123456789/11842.
Full textApproved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-10T19:43:06Z (GMT) No. of bitstreams: 2 Dissertaçao Hesdras Viana.pdf: 2998238 bytes, checksum: de42b675472ac4632a3a3c04688a77d5 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Made available in DSpace on 2015-03-10T19:43:06Z (GMT). No. of bitstreams: 2 Dissertaçao Hesdras Viana.pdf: 2998238 bytes, checksum: de42b675472ac4632a3a3c04688a77d5 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-26
Extrair características da fala é uma etapa fundamental para os sistemas de reconhecimento de voz. É através dos descritores que extraímos a energia do sinal, a frequência fundamental (pitch) e a estrutura dos formantes que serão utilizados como identificadores para cada palavra pronunciada. Descritores como MFCC (Mel-Frequency Cepstral Coefficient), RASTA-PLP (RelAtive SpecTrAl - Perceptual Linear Predictive) e PNCC (Power Normalized Cepstral Coefficient) são muitos utilizados no estado da arte na área de reconhecimento de voz, porém, essas técnicas não conseguem apresentar bons resultados quando expostos a amostras com presença de ruído, variabilidade de locutor e fala contínua. O objetivo deste trabalho é desenvolver um descritor para a fala que seja invariante ao ruído, ambiente e locução. Para isso, fizemos um estudo dos descritores de voz mais utilizados na literatura, identificando as vantagens e desvantagens, expondo a situações variadas. Para avaliação das técnicas, utilizamos a base NOIZEUS (Noisy Speech Corpus) e dois classificadores: HMM (Hidden Markov Models) e SVM (Support Vector Machine). Essa base tem como característica a presença de ruído variando de 0dB, 5dB, 10dB e 15dB, gravada em diversos ambientes. A utilização dos classificadores serviu para validar os descritores de voz. O descritor proposto, chamado de MINERS (Model Invariant to Noise and Environment and Robust for Speech), apresentou melhores resultados entre todos os descritores avaliados (MFCC, MFCC combinado com Wavelet Denoising, RASTAPLP e PNCC). A abordagem que obteve maior sucesso foi a utilização do MINERS com o classificador SVM.
Erokyar, Hasan. "Age and Gender Recognition for Speech Applications based on Support Vector Machines." Scholar Commons, 2014. https://scholarcommons.usf.edu/etd/5356.
Full textBarbosa, Emmanuel Duarte. "Descri??o bioqu?mica qu?ntica do bols?o de intera??o do ?ON Zn2+ na enzima ALAD humana." PROGRAMA DE P?S-GRADUA??O EM BIOQU?MICA, 2016. https://repositorio.ufrn.br/jspui/handle/123456789/21908.
Full textApproved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-02-08T19:26:36Z (GMT) No. of bitstreams: 1 EmmanuelDuarteBarbosa_DISSERT.pdf: 9706329 bytes, checksum: cf979f942793c968afbd04719854d7f0 (MD5)
Made available in DSpace on 2017-02-08T19:26:36Z (GMT). No. of bitstreams: 1 EmmanuelDuarteBarbosa_DISSERT.pdf: 9706329 bytes, checksum: cf979f942793c968afbd04719854d7f0 (MD5) Previous issue date: 2016-07-29
A enzima Delta Aminolevul?nico Desidratase (ALAD) ? uma metaloprote?na citos?lica essencial em v?rios processos biol?gicos, uma vez que ? respons?vel pelo segundo passo da cat?lise enzim?tica na forma??o de porfobilinog?nio, um precursor dos tetrapirr?licos (heme, clorofila). Esta enzima ? bastante sens?vel a metais pesados e tem sido classicamente usada como um marcador na intoxica??o por chumbo. Sua inibi??o se d? pela substitui??o desses metais pesados no s?tio de liga??o a metais. Na ALAD humana, o Zinco (Zn2+) ocupa funcionalmente este s?tio sendo essencial para a coordena??o das cadeias de ?cido aminolevul?nico durante a cat?lise enzim?tica. Embora muitos ensaios in vitro, in vivo e in s?lico j? tenham demonstrado a import?ncia do Zn2+ nesse s?tio, n?o se tinha conhecimento de nenhum estudo baseado em abordagem qu?ntica com o intuito de elucidar esta intera??o de forma mais detalhada. Diante disso, o presente trabalho teve como objetivo analisar as muta??es missense que acometem o s?tio de liga??o ao zinco e descrever atrav?s de m?todos qu?nticos a energia de intera??o entre a enzima e o zinco com maior acur?cia utilizando o m?todo do Fracionamento Molecular com Capas Conjugadas (MFCC), quantificando energeticamente os res?duos de amino?cidos posicionados at? uma dist?ncia de 8,5 ? do centroide do ligante. Foi identificado as altera??es bioqu?micas na estrutura monom?rica dos mutantes, as quais resultam na diminui??o da atividade enzim?tica. Foram identificados um total de 30 res?duos com valores energ?ticos variados que interagem com o zinco no bols?o de liga??o. Aqueles que apresentaram valores significativos (de atra??o ou repuls?o) e est?o relacionados funcionalmente ? atividade enzim?tica foram: Lis199, Lis252, Arg 209, Arg 174, Cis122, Cis124 e Cis132; e aqueles que demonstraram relev?ncia para a perman?ncia do ?on no s?tio de liga??o foram: Asp169, Gli130, Gli133, Asp120 e Ser168. A partir disso, p?de-se concluir que al?m dos grupos nucle?filos (grupos tiolatos) dos res?duos Cis122, Cis124 e Cis132, os res?duos Asp169, Asp120 e Ser168 s?o fundamentais na composi??o do bols?o, uma vez que demonstraram grande quantidade de energia de intera??o atrativa com o ?on Zn2+.
The enzyme Delta Aminolevulinic Dehydratase (ALAD) is a cytosolic metalloproteinase essential in several biological processes since it participates in the second step in porphobilinogen formation pathway, a tetrapyrrolic precursor of heme and chlorophyll. This enzyme is very sensitive to heavy metals and has traditionally been used as a biomarker in lead poisoning. Its inhibition occurs when these heavy metals are replaced inside the metal binding site. In human ALAD, Zinc (Zn2+) functionally occupies this site and it is essential for coordination of two chains of aminolevulinic acid for the enzymatic catalysis. Although many in vitro, in vivo and in silico works have already demonstrated the importance of Zn2+ at that site, to the best of our knowledge, there isn?t any studies on literature based on quantum approach in order to elucidate this interactions in more details. Therefore, the aim of the present study was to analyse the missense mutations that affect the zinc binding site and describe through quantum methods the energy interaction between zinc and ALAD with greater accuracy using the method of Molecular fractionation with conjugated caps (MFCC) by quantifying amino acid residues? energy positioned at 8.5 ? of distance with the ligand centroid. It was identified biochemical changes in the monomeric structure of mutants, which result in decreased enzyme activity. It were identified a total of 30 residues with a wide range of energy values. The residues with significant (atractition or repulsion) values and functionally related to enzymatic activity were: Lys199, Lys252, Cys122, Cys124 and Cys132; and those that demonstrated relevance to the ion permanence inside the binding site were: Asp169, Gly130, Gly133, Asp120 and Ser168. Thus, it could be concluded that in addition to the nucleophilic groups (thiolates groups) from Cys122, Cys124 and Cys132, others residues such as Asp169, Asp120 and Ser168 are fundamental in the catalytic pocket composition, since they showed high attractive interaction energy with Zn2+ ion.
Manso, Dalila Nascimento. "An?lise molecular da muta??o HIS275TIR isolada na Neuraminidase do H1N1 resistente ao oseltamivir." PROGRAMA DE P?S-GRADUA??O EM CI?NCIAS BIOL?GICAS, 2017. https://repositorio.ufrn.br/jspui/handle/123456789/24058.
Full textApproved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-10-13T21:33:08Z (GMT) No. of bitstreams: 1 DalilaNascimentoManso_DISSERT.pdf: 1914411 bytes, checksum: 966fc442e252d656c3946bff697a75f5 (MD5)
Made available in DSpace on 2017-10-13T21:33:08Z (GMT). No. of bitstreams: 1 DalilaNascimentoManso_DISSERT.pdf: 1914411 bytes, checksum: 966fc442e252d656c3946bff697a75f5 (MD5) Previous issue date: 2017-04-19
A mais recente pandemia do v?rus influenza ocorreu no ano de 2009, causada pela cepa do influenza A (H1N1), e popularmente conhecida como gripe A ou gripe su?na, gerou preocupa??o aos ?rg?os mundiais de sa?de. Com um quadro sintom?tico que inclui febre, tosse, inflama??o na garganta na maioria dos casos, alguns pacientes, principalmente imunossuprimidos que podem apresentar complica??es que evoluem ao ?bito. A transmiss?o do v?rus ocorre atrav?s do contato entre pessoa a pessoa e seu mecanismo de infec??o se d? a partir das duas glicoprote?nas de superf?cie, a hemaglutinina e a neuraminidase. A hemaglutinina atua se ligando aos receptores do ?cido si?lico favorecendo a entrada do v?rus nas c?lulas-alvo e a neuraminidase cliva as c?lulas do receptor de res?duos do ?cido si?lico, onde as novas part?culas virais est?o se ligando. Atrav?s dessa quebra haver? libera??o das novas part?culas virais, que atrav?s da hemaglutinina invadir?o novas c?lulas. Baseado nisso, f?rmacos foram desenvolvidos com intuito de inibir a a??o da neuraminidase, os chamados inibidores da neuraminidase que interferem na libera??o dessas novas part?culas virais evitando a dissemina??o da infec??o no trato respirat?rio. Dentre estes inibidores o oseltamivir ? o f?rmaco de escolha para profilaxia e tratamento da gripe A; por?m, relatos de resist?ncia a esse f?rmaco foram descritos, o que causou preocupa??o nos profissionais da sa?de e governantes. A muta??o mais encontrada ? a HIS275TIR, onde a histidina ? substitu?da por uma tirosina, promovendo uma s?rie de altera??es conformacionais que diminuem a afinidade do f?rmaco pelo v?rus originando a resist?ncia. A partir da obten??o de dados cristalogr?ficos e simula??o computacional, calculamos a energia de intera??o da neuraminidase selvagem e com a presen?a da muta??o HIS275TIR ligadas ao oseltamivir utilizando a Teoria Funcional da Densidade (DFT) e do M?todo de Fracionamento Molecular com Capas Conjugadas (MFCC). Obtivemos 115 res?duos de intera??o para a neuraminidase selvagem (cristal 4B7R) e 109 res?duos de intera??o para o cristal com a neuraminidase mutante (3CL0). Os resultados foram avaliados de acordo com a relev?ncia dos valores energ?ticos para energias repulsivas e energias atrativas. Os c?lculos energ?ticos realizados confirmaram a redu??o da afinidade da cepa contendo a muta??o HIS275TIR e destacaram a import?ncia energ?tica do s?tio ativo da neuraminidase mostrando que os principais res?duos energ?ticos s?o encontrados nele tornando um alvo para obten??o de novos f?rmacos devido a sua conserva??o. As altera??es causadas pela substitui??o do amino?cido histidina por uma tirosina levaram a uma s?rie de mudan?as conformacionais nos amino?cidos vizinhos que provocaram altera??es eletrost?ticas resultando na resist?ncia ao f?rmaco. A partir desse estudo ser? poss?vel conhecer melhor as intera??es moleculares da neuraminidase mutante e posteriormente projetar novos designs de f?rmacos para serem elaborados e se tornarem mais eficientes na intera??o com as cepas mutantes desse v?rus.
The latest influenza pandemic occurred in the year 2009, caused by the strain of influenza A (H1N1), and popularly known as influenza A or swine flu, generated concern to the global health agencies. With a symptomatic picture that includes fever, cough, throat inflammation in most cases, some patients, mainly immunosuppressed, that can to present complications that evolve to death. Transmission of the virus takes place through contact between person to person and its mechanism of infection occurs from the two surface glycoproteins, hemagglutinin and neuraminidase. The hemagglutinin acts by binding to the sialic acid receptors favoring the entry of the virus into the target cells and the neuraminidase cleaves the receptor cells of sialic acid residues, where the new viral particles are binding. Through this breakdown there will be release of the new particles that through hemagglutinin will attack new cells. Based on these, drugs were developed in an attempt to inhibit the action of neuraminidase, so called neuraminidase inhibitors that interfere in the release of these new viral particles avoiding the spread of infection in the respiratory tract. Among the inhibitors, oseltamivir is the drug of choice for prophylaxis and treatment of influenza A, but reports of resistance to this drug have been described, which has caused concern in health professionals and rulers. The HIS275TIR mutation is most commonly found, where histidine is replaced by a tyrosine, promoting a series of conformational changes that decrease the affinity of the drug for the virus causing resistance. Based on crystallographic data and computational simulation, we calculated the interaction energy of the wild neuraminidase and the presence of the HIS275TIR mutation bonded to oseltamivir using the Functional Density Theory (DFT) and the Molecular Fractionation with Conjugated Caps (MFCC). We obtained 115 interaction residues for the wild neuraminidase (4B7R crystal) and 109 interaction residues for the crystal with the mutant neuraminidase (3CL0). The results were evaluated according to the relevance of the energy values for repulsive energies and attractive energies. The energetic calculations confirmed the reduction of the affinity of the strain containing the HIS275TIR mutation and highlighted the energy importance of the active site of the neuraminidase, showing that the main energy residues are found in it becoming a target for obtaining new drugs due to its conservation. The changes caused by the substitution of the amino acid histidine for a tyrosine led to a series of conformational changes in the neighboring amino acids that provoked electrostatic changes resulting in the resistance to the drug. From this study, it will be possible to know better the molecular interactions of the mutant neuraminidase and subsequently to project new drugs designs to be elaborated and become more efficient in the interaction with the mutant strains of this virus.
Alvarenga, Rodrigo Jorge. "Reconhecimento de comandos de voz por redes neurais." Universidade de Taubaté, 2012. http://www.bdtd.unitau.br/tedesimplificado/tde_busca/arquivo.php?codArquivo=587.
Full textSystems for speech recognition have widespread use in the industrial universe, in the improvement of human operations and procedures and in the area of entertainment and recreation. The specific objective of this study was to design and develop a voice recognition system, capable of identifying voice commands, regardless of the speaker. The main purpose of the system is to control movement of robots, with applications in industry and in aid of disabled people. We used the approach of decision making, by means of a neural network trained with the distinctive features of the speech of 16 speakers. The samples of the voice commands were collected under the criterion of convenience (age and sex), to ensure a greater discrimination between the voice characteristics and to reach the generalization of the neural network. Preprocessing consisted in the determination of the endpoints of each command signal and in the adaptive Wiener filtering. Each speech command was segmented into 200 windows with overlapping of 25%. The features used were the zero crossing rate, the short-term energy and the mel-frequency ceptral coefficients. The first two coefficients of the linear predictive coding and its error were also tested. The neural network classifier was a multilayer perceptron, trained by the backpropagation algorithm. Several experiments were performed for the choice of thresholds, practical values, features and neural network configurations. Results were considered very good, reaching an acceptance rate of 89,16%, under the `worst case conditions for the sampling of the commands.
Matos, Adriano Nogueira. "Extração de características do sinal de voz utilizando análise fatorial verdadeira." Universidade Federal do Amazonas, 2008. http://tede.ufam.edu.br/handle/tede/2959.
Full textCoordenação de Aperfeiçoamento de Pessoal de Nível Superior
Digital processing of speech signal is applied in several computer applications, which the major ones are the following: Recognition, synthesis and coding of speech. All these applications require the amount of data in the acoustic signal to be reduced, in order to allow processing by a computer device. The feature extraction of speech signal, that is the goal of this study, performs this action. The features extracted should well depict the speech signal and should have no redundancy, in order to increase the performance of the systems using them. The feature extraction Mel Frequency Cepstral Coefficients (MFCC) method partially fulfills these requirements, but it is seriously damaged when noise signal is acting. The appliance of the statistical method of Factorial Analysis is intended to filter the noise components from the speech. The results of the experiments performed in this work shows that this is a competitive method, especially when used to generate acoustic models in severe noise conditions.
O processamento digital do sinal de voz é empregado em diversas aplicações computacionais, das quais as principais são: Reconhecimento, síntese e codificação da fala. Todas estas aplicações requerem que ocorra redução da quantidade de informações da onda acústica, de maneira a permitir o processamento por um computador. O processo de extração de características do sinal de voz, objeto de estudo deste trabalho, realiza esta tarefa. As características extraídas devem caracterizar o sinal de voz e não conter redundância, de forma a maximizar o desempenho dos sistemas que as utilizem. O método MFCC (Mel Frequency Cepstral Coefficients) de extração de características cumpre parcialmente esses requisitos, mas é seriamente degradado sob a incidência de ruído. A aplicação do método estatístico de Análise Fatorial objetiva filtrar o sinal de ruído das locuções. Os resultados obtidos dos experimentos realizados indicam a competitividade deste método, especialmente quando usado na geração dos modelos acústicos robustos em condições de ruído severo.
Abraham, Aby. "Continous Speech Recognition Using Long Term Memory Cells." Ohio University / OhioLINK, 2013. http://rave.ohiolink.edu/etdc/view?acc_num=ohiou1377777011.
Full textLi, Yi. "Speaker Diarization System for Call-center data." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-286677.
Full textFör att svara på frågan vem som talade när är högtalardarisering (SD) ett kritiskt steg för många talapplikationer i praktiken. Uppdraget med vårt projekt är att bygga ett MFCC-vektorbaserat högtalar-diariseringssystem ovanpå ett högtalarverifieringssystem (SV), som är ett befintligt Call-center-program för att kontrollera kundens identitet från ett telefonsamtal. Vårt högtalarsystem använder 13-dimensionella MFCC: er som funktioner, utför Voice Active Detection (VAD), segmentering, linjär gruppering och hierarkisk gruppering baserat på GMM och BIC-poäng. Genom att tillämpa den minskar vi EER (Equal Error Rate) från 18,1 % i baslinjeexperimentet till 3,26 % för de allmänna samtalscentret. För att bättre analysera och utvärdera systemet simulerade vi också en uppsättning callcenter-data baserat på de offentliga ljuddatabaserna ICSI corpus.
Čermák, Jan. "Rozpoznávání emočních stavů na základě analýzy řečového signálu." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2009. http://www.nusl.cz/ntk/nusl-218162.
Full textVianna, J?ssica de F?tima. "Bioqu?mica qu?ntica da capreomicina e da estreptomicina em complexo com o ribossomo bacteriano." PROGRAMA DE P?S-GRADUA??O EM CI?NCIAS BIOL?GICAS, 2017. https://repositorio.ufrn.br/jspui/handle/123456789/22614.
Full textApproved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-11T18:14:29Z (GMT) No. of bitstreams: 1 JessicaDeFatimaVianna_DISSERT.pdf: 3724208 bytes, checksum: f7d62fbcd54bf6b212f2003b461810c5 (MD5)
Made available in DSpace on 2017-04-11T18:14:29Z (GMT). No. of bitstreams: 1 JessicaDeFatimaVianna_DISSERT.pdf: 3724208 bytes, checksum: f7d62fbcd54bf6b212f2003b461810c5 (MD5) Previous issue date: 2017-02-16
Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES)
A tuberculose ? uma doen?a bacteriana provocada pelo Mycobacterium tuberculosis, e de acordo com a Organiza??o Mundial de Sa?de, apenas em 2015 foram 10,4 milh?es de novos casos relatados e 1,4 milh?o de mortes. Cresce o n?mero de casos de pacientes infectados com cepas resistentes aos antimicrobianos mais comumente utilizados, fazendo-se necess?rio uso de drogas de segunda-linha. A capreomicina e a estreptomicina encaixam-se nesse grupo, e s?o antibi?ticos que possuem como mecanismo de atua??o a inibi??o da s?ntese proteica. Entretanto, seus mecanismos de liga??o em seus s?tios s?o distintos: a capreomicina ? capaz de se ligar a ambas subunidades ribossomais (30S e 50S), enquanto que a estreptomicina liga-se ? subunidade ribossomal menor (30S), e interage com alguns pontos da prote?na S12. Atrav?s de dados cristalogr?ficos e simula??es computacionais, foi calculada a energia de intera??o da capreomicina e da estreptomicina com cada um dos res?duos constituintes de seus s?tios utilizando a Teoria Funcional da Densidade (DFT) e do M?todo de Fracionamento Molecular com Capas Conjugadas (MFCC). Os resultados revelaram valores energ?ticos de cada nucleot?deo pertencente ao s?tio de liga??o desses dois medicamentos, como tamb?m dos amino?cidos da prote?na S12 com os quais a estreptomicina interage. Assim, para a capreomicina na subunidade 30S, foram avaliados res?duos presentes em um raio de at? 14 ? distantes do f?rmaco, totalizando 44 res?duos; e na subunidade 50S, 30 nucleot?deos foram analisados, e estavam distribu?dos at? o raio de 30 ? de dist?ncia. Com a estreptomicina foram levados em considera??o 60 nucleot?deos distribu?dos at? 12,5 ? de dist?ncia da droga na subunidade 30S, e 25 amino?cidos da prote?na S12 com at? 15 ? de dist?ncia. Identificamos tamb?m as contribui??es das liga??es de hidrog?nio e das intera??es hidrof?bicas nas intera??es f?rmaco-receptor; as regi?es dos f?rmacos que mais contribu?ram para as fixa??es desses em seus s?tios de liga??o; como tamb?m a identifica??o dos res?duos que s?o mais associados ?s muta??es e consequente resist?ncia.
Tuberculosis is a disease caused by Mycobacterium tuberculosis, and according to the World Health Organization, only in 2015 occurred 10.4 million new cases reported and 1.4 million deaths. The number of cases of patients infected with antimicrobial resistant strains most used is increasing, requiring the use of second-line drugs. Capreomycin and streptomycin are part of the group, and are antibiotics whose mechanism of action is the inhibition of protein synthesis. However, its binding mechanisms in their sites are distinct: capreomycin is able to bind to both ribosomal (30S and 50S) subunits, whereas streptomycin binds to the smaller ribosomal subunit (30S), and interacts with some points of S12 protein. Through crystallographic data and computational simulations, we calculated the interaction energy of capreomycin and streptomycin with each of the residues component of their sites using the Density Functional Theory (DFT) and Molecular Fractionation with Conjugated Caps (MFCC). The results showed energy values of each nucleotide belonging to binding site of these two drugs, as well as the amino acids of the S12 protein with which streptomycin interacts. Thus, for capreomycin in the 30S subunit, residues present in a radius of up to 14 ? distant from the drug, totaling 44 residues; and in the 50S subunit, 30 nucleotides were analyzed, and were distributed up to the 30? radius distance. Regarding streptomycin, 60 nucleotides distributed up to 12.5 ? away from the drug in the 30S subunit, and 25 amino acids of the S12 protein with up to 15 ? were taken into account. We also identify the contributions of hydrogen bonds and hydrophobic interactions in drug-receptor interactions; the regions of the drugs that most contributed to the anchorages of these in their binding sites; as well as the identification of residues that are most associated with mutations and consequent resistance.
Káčerová, Erika. "Odhad formantových kmitočtů pomocí strojového učení." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2019. http://www.nusl.cz/ntk/nusl-400852.
Full textDobrotka, Matúš. "Detekce Akustického Prostředí z Řeči." Master's thesis, Vysoké učení technické v Brně. Fakulta informačních technologií, 2018. http://www.nusl.cz/ntk/nusl-385945.
Full textLima, Neto Jos? Xavier de. "Bioqu?mica qu?ntica na diferencia??o dos n?veis de ativa??o de receptores AMPA por agonistas parciais Wilardina." Universidade Federal do Rio Grande do Norte, 2015. http://repositorio.ufrn.br/handle/123456789/19861.
Full textApproved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2016-02-26T00:31:29Z (GMT) No. of bitstreams: 1 JoseXavierDeLimaNeto_DISSERT.pdf: 20857554 bytes, checksum: 04aea5694e5da65425668c7f81185381 (MD5)
Made available in DSpace on 2016-02-26T00:31:29Z (GMT). No. of bitstreams: 1 JoseXavierDeLimaNeto_DISSERT.pdf: 20857554 bytes, checksum: 04aea5694e5da65425668c7f81185381 (MD5) Previous issue date: 2015-02-26
Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES
No sistema nervoso central de mam?feros, a transmiss?o sin?ptica r?pida entre c?lulas nervosa ? realizada primariamente pelo receptor ?-amino-3-hidroxi-5-metil-4- isoxazolpropi?nico (AMPA), um Receptor Ionotr?pico de Glutamato, que est? relacionado com a aprendizagem, mem?ria e homeostase do sistema nervoso. Defici?ncias em seu funcionamento s?o correlacionadas com o desenvolvimento de muitas desordens cerebrais, tais como epilepsia, esquizofrenia, autismo, Parkinson e Alzheimer. O uso dos an?logos de wilardina tem se mostrado uma poderosa ferramenta para o entendimento dos mecanismos de ativa??o e dessensibiliza??o deste receptor, pois a modifica??o em um ?nico ?tomo deste ligante permite a observa??o de variados n?veis de efic?cia. Neste trabalho, tirando vantagem das estruturas de Fl?or Wilardina (1.35?), Hidrog?nio Wilardina (1.65?), Bromo Wilardina (1.8?) e Iodo Wilardina (2.15?), co-cristalizadas com o receptor GluA2 com os c?digos 1MQI, 1MQJ, 1MQH e 1MQG, respectivamente, buscou-se diferenciar energeticamente a efic?cia dos quatro ligantes. Os complexos foram submetidos a c?lculos energ?ticos baseados na teoria do funcional da densidade (DFT), sob a ?ptica do m?todo do fracionamento molecular com caps conjugados (MFCC). Os resultados obtidos mostram uma rela??o entre os valores energ?ticos e a ordem de efic?cia de cada wilardina (FW > HW > BrW > IW), ainda evidenciam a import?ncia de E705, R485, Y450, S654, T655, T480 e P478 como os amino?cidos que contribuem mais fortemente com a intera??o dos quatro agonistas parciais wilardina. Juntamente com isto, delineamos o comportamento de M708, sendo atra?do pelos ligantes FW e HW, e repelido por BrW e IW. Com os dados relatados neste trabalho, faz-se poss?vel um melhor entendimento do receptor AMPA, o que pode servir como auxilio no desenvolvimento de novos f?rmacos para este sistema.
In the central nervous system (CNS) of mammalian, fast synaptic transmission between nerve cells is performed primarily by ?-amino-3-hydroxy-5-methyl-4- isoxazolepropionic acid (AMPA) receptors, an ionotropic glutamate receptor that is related with learning, memory and homeostasis of the nervous system. Impairments in their functions are correlated with development of many brain desorders, such as epilepsy, schizophrenia, autism, Parkinson and Alzheimer. The use of willardiine analogs has been shown a powerful tool to understanding of activation and desensitization mechanisms of this receptors, because the modification of a single ligand atom allows the observation of varying levels of efficacy. In this work, taking advantage of Fluorine Willardiine (1.35?), Hydrogen Willardiine (1.65?), Bromine Willardiine (1.8?) and Iodine Willardiine (2.15?) structures co-crystalized with GluA2 with codes 1MQI, 1MQJ, 1MQH and 1MQG, we attempted to energetically differentiate the four ligands efficacy. The complexes were submitted to energetic calculations based on density functional theory (DFT), under the optics of molecular fractionation with conjugate caps (MFCC) method. Obtained results show a relationship between the energetic values and willardiines efficacy order (FW> HW > BrW > IW), also show the importance of E705, R485, Y450, S654, T655, T480 e P478 as the amino acids that contribute most strongly with the interaction of four partial agonists. Furthermore, we outlined the M708 behaviour, attracted by FW and HW ligands, and repels by BrW and IW. With the datas reported on this work, it is possible for a better understanding of the AMPA receptor, which can serve as an aid in the development of new drugs for this system.
Bastas, Selin A. "Nocturnal Bird Call Recognition System for Wind Farm Applications." University of Toledo / OhioLINK, 2012. http://rave.ohiolink.edu/etdc/view?acc_num=toledo1325803309.
Full textDuarte, Dami Doria Narayana. "Um estudo da relevância da dinâmica espectral na classificação de sons domésticos." Universidade Federal de Sergipe, 2016. https://ri.ufs.br/handle/riufs/5021.
Full textThis work presents a study of the spectral dynamics characteristics of audio signals. More specifically, we aim at detecting regularities that can be modeled in typical domestic sounds, in order to classify them. Our starting point is the work of Sehili et al. [2], in which a household sounds classification system based on GMM is proposed. The Sehili system is reproduced in this work as a baseline system. Following the same protocol of experiments, a 73 % recognition rate is achieved. Afterwards, three sets of experiments are performed, arranged so that each new approach incorporates a new technique to highlight a different aspect of the spectral dynamics. The first technique is the insertion of the discrete gradient information of feature vectors, a strategy aimed at a local spectral dynamic analysis, and resultes in a perceptible increase in recognition rate. The next experiment is conducted with a HMM based classifier, in which the spectral dynamic should be encoded in state transition probability matrices. The tests with the HMM do not result in improved recognition rates. The last experiment is based on a features extraction method, proposed by the author, called Patterns of Energy Envelope per Band (PEEB). The PEEB is an extractor that highlight the signal spectral dynamics inside narrow bands. In domestic sounds recognition tests, the classification system based on a combination of PEEB, MFCC and GMM strategies resulted in a significant improvement over all other systems tested. We conclude, based on our results, that the spectral dynamics of the studied dataset plays an important role in the classification task. However, the approaches for spectral dynamic information extraction, studied in this work, are not definitive, for it is clear that they can be further developed. For example, in the case of PEEB, the recognition rate is strongly dependent on the sound class, suggesting more elaborate forms of fusion of PEEB and MFCC features for each class.
Este trabalho é um estudo da característica da dinâmica espectral em sinais sonoros, com vistas a encontrar as regularidades que podem ser modeladas em sons tipicamente domésticos, com o objetivo de classificá-los. O ponto de partida é o trabalho de Sehili et al. [1], no qual é proposto um sistema de classificação de sons domésticos baseado em GMM. O sistema de Sehili é reproduzido neste trabalho como marco zero na análise da dinâmica espectral, seguindo o mesmo roteiro dos experimentos. A partir daí, três conjuntos de experimentos são realizados, organizados de forma que, a cada novo experimento, uma técnica – que destaca um aspecto diferente da dinâmica espectral – seja incorporada. A primeira técnica analisada é a inserção da informação de gradiente discreto dos vetores de características, estratégia que representa uma análise de dinâmica espectral local e que resulta num aumento perceptível na taxa de classificação. O próximo experimento é realizado com um classificador baseado em HMM, no qual a informação de dinâmica espectral deve ser codificada na matriz de probabilidades de transição de estados do modelo. Os testes com o HMM não resultam em melhora na taxa de reconhecimento das classes de sons. O último experimento é baseado num extrator de características proposto pelo autor, chamado de Padrões de Envelopes de Energia por Banda (PEEB). O PEEB é um extrator que destaca os padrões de evolução espectro-temporais do sinais. Nos testes de reconhecimento de sons domésticos, o sistema de classificação baseado numa combinação das estratégias PEEB, MFCC e GMM resultam numa melhora significativa em relação a todos os outros sistemas testados. Conclui-se, com base nos resultados, que a dinâmica espectral dos sinais da base estudada é relevante à tarefa de classificação. No entanto, as maneiras de extração da informação de dinâmica espectral estudadas neste trabalho não são definitivas, pois ainda há muito espaço para desenvolvê-las. Por exemplo, no caso do PEEB, nota-se que a taxa de classificação fortemente é dependente da classe sonora, sugerindo formas mais elaboradas de fusão das características PEEB e MFCC para cada classe.
Duarte, Dami Doria Narayana. "Um estudo da relevância da dinâmica espectral na classificação de sons doméstic." Universidade Federal de Sergipe, 2016. http://ri.ufs.br:8080/xmlui/handle/123456789/5021.
Full textThis work presents a study of the spectral dynamics characteristics of audio signals. More specifically, we aim at detecting regularities that can be modeled in typical domestic sounds, in order to classify them. Our starting point is the work of Sehili et al. [2], in which a household sounds classification system based on GMM is proposed. The Sehili system is reproduced in this work as a baseline system. Following the same protocol of experiments, a 73 % recognition rate is achieved. Afterwards, three sets of experiments are performed, arranged so that each new approach incorporates a new technique to highlight a different aspect of the spectral dynamics. The first technique is the insertion of the discrete gradient information of feature vectors, a strategy aimed at a local spectral dynamic analysis, and resultes in a perceptible increase in recognition rate. The next experiment is conducted with a HMM based classifier, in which the spectral dynamic should be encoded in state transition probability matrices. The tests with the HMM do not result in improved recognition rates. The last experiment is based on a features extraction method, proposed by the author, called Patterns of Energy Envelope per Band (PEEB). The PEEB is an extractor that highlight the signal spectral dynamics inside narrow bands. In domestic sounds recognition tests, the classification system based on a combination of PEEB, MFCC and GMM strategies resulted in a significant improvement over all other systems tested. We conclude, based on our results, that the spectral dynamics of the studied dataset plays an important role in the classification task. However, the approaches for spectral dynamic information extraction, studied in this work, are not definitive, for it is clear that they can be further developed. For example, in the case of PEEB, the recognition rate is strongly dependent on the sound class, suggesting more elaborate forms of fusion of PEEB and MFCC features for each class.
Este trabalho é um estudo da característica da dinâmica espectral em sinais sonoros, com vistas a encontrar as regularidades que podem ser modeladas em sons tipicamente domésticos, com o objetivo de classificá-los. O ponto de partida é o trabalho de Sehili et al. [1], no qual é proposto um sistema de classificação de sons domésticos baseado em GMM. O sistema de Sehili é reproduzido neste trabalho como marco zero na análise da dinâmica espectral, seguindo o mesmo roteiro dos experimentos. A partir daí, três conjuntos de experimentos são realizados, organizados de forma que, a cada novo experimento, uma técnica – que destaca um aspecto diferente da dinâmica espectral – seja incorporada. A primeira técnica analisada é a inserção da informação de gradiente discreto dos vetores de características, estratégia que representa uma análise de dinâmica espectral local e que resulta num aumento perceptível na taxa de classificação. O próximo experimento é realizado com um classificador baseado em HMM, no qual a informação de dinâmica espectral deve ser codificada na matriz de probabilidades de transição de estados do modelo. Os testes com o HMM não resultam em melhora na taxa de reconhecimento das classes de sons. O último experimento é baseado num extrator de características proposto pelo autor, chamado de Padrões de Envelopes de Energia por Banda (PEEB). O PEEB é um extrator que destaca os padrões de evolução espectro-temporais do sinais. Nos testes de reconhecimento de sons domésticos, o sistema de classificação baseado numa combinação das estratégias PEEB, MFCC e GMM resultam numa melhora significativa em relação a todos os outros sistemas testados. Conclui-se, com base nos resultados, que a dinâmica espectral dos sinais da base estudada é relevante à tarefa de classificação. No entanto, as maneiras de extração da informação de dinâmica espectral estudadas neste trabalho não são definitivas, pois ainda há muito espaço para desenvolvê-las. Por exemplo, no caso do PEEB, nota-se que a taxa de classificação fortemente é dependente da classe sonora, sugerindo formas mais elaboradas de fusão das características PEEB e MFCC para cada classe.
Ali, Ahmed Mohamed Abdel Maksoud. "Multi-dialect Arabic broadcast speech recognition." Thesis, University of Edinburgh, 2018. http://hdl.handle.net/1842/31224.
Full textKotulek, Milan. "Jednoduchý textově nezávislý hlasový zámek - Softwarový systém pro verifikaci mluvčích." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2015. http://www.nusl.cz/ntk/nusl-221256.
Full textCosta, Roner Ferreira da. "BioquÃmica quÃntica das estatinas, aspirina e anti-hipertensivos." Universidade Federal do CearÃ, 2011. http://www.teses.ufc.br/tde_busca/arquivo.php?codArquivo=6234.
Full textAs doenÃas cardiovasculares (CVDs) compreendem um amplo espectro de doenÃas do coraÃÃo e vasos sanguÃneos (artÃrias e veias), entre as quais se incluem a doenÃa das artÃrias coronÃrias, o ataque cardÃaco, a angina, a sÃndrome coronariana aguda, o aneurisma da aorta, arritmias cardÃacas, a doenÃa cardÃaca congÃnita, a insuficiÃncia cardÃaca e a doenÃa cardÃaca reumÃtica. Entre os principias fÃrmacos que tratam as doenÃas cardiovasculares estÃo: (i) as estatinas, que atuam inibindo a 3-hidroxi-3-metilgluratil coenzima A (HMG-CoA) redutase no processo de conversÃo da HMG-CoA em mevalonato, numa das etapas da biossÃntese do colesterol. Observa-se em ensaios clÃnicos que a aÃÃo das estatinas pode diminuir os nÃveis de colesterol de baixa densidade (LDL) entre 20\% e 60\%, reduzindo os eventos coronarianos em atà 1/3 no perÃodo de cinco anos; (ii) a aspirina, com a qual hà mais de 400 preparaÃÃes nos EUA e se produz cerca de 20 mil toneladas anualmente. ApÃs mais de um sÃculo de prÃtica clÃnica, a aspirina continua sendo a droga antitrombÃtica, antitÃrmica, analgÃsica e antiproliferativa mais amplamente recomendada. Ela age bloqueando a biossÃntese de hormÃnios inflamatÃrios prostanÃides atravÃs da inibiÃÃo das enzimas ciclooxigenase COX-1 e COX-2; (iii) os anti-hipertensivos, para os quais a Enzima Conversora de Angiotensina (ECA) à o principal alvo (inibidores da ECA estÃo no mercado a mais de 20 anos) visando o combate das pressÃes arteriais elevadas, que provocam alteraÃÃes nos vasos sanguÃneos e na musculatura do coraÃÃo, e levam a hipertrofia do ventrÃculo esquerdo do coraÃÃo, acidente vascular cerebral, infarto do miocÃrdio, morte sÃbita, insuficiÃncias renal e cardÃaca, etc. A hipertensÃo arterial (HTA) ou hipertensÃo arterial sistÃmica (HAS), conhecida popularmente como pressÃo alta, à uma das doenÃas com maior prevalÃncia no mundo moderno. A ECA atua na regulaÃÃo da pressÃo sanguÃnea via conversÃo do decapeptÃdeo angiotensina I no potente vasopressor angiotensina II e tambÃm pela inativaÃÃo da bradicinina, sendo componente central do Sistema Renina-Angiotensina-Aldeosterona (SRAA), que controla a pressÃo sanguÃnea e tem forte influÃncia nas funÃÃes relacionadas ao coraÃÃo e os rins, bem como na contraÃÃo dos vasos sanguÃneos. Nesta tese realiza-se um estudo da bioquÃmica quÃntica de estatinas (atorvastina, rosuvastatina, cerivastatina, mevastatina, sinvastatina e fluvastatina), da aspirina/bromoaspirina e de anti-hipertensivos (captopril, enalapril, lisinopril, ramipril, trandolapril e perindopril) levando-se em conta dados cristalogrÃficos dos seus sÃtios de ligaÃÃo nas proteÃnas HMGR, COX-1 (o da aspirina foi simulado partindo-se dos dados da bromoaspirina) e ECA, respectivamente. As simulaÃÃes computacionais foram realizadas considerando-se a Teoria do Funcional de Densidade (DFT) na aproximaÃÃo da densidade local (LDA) e funcional de troca e correlaÃÃo PWC, com energia de interaÃÃo entre os resÃduos das proteÃnas circunscritos ao sÃtio de ligaÃÃo de raio r e os fÃrmacos calculada atravÃs do mÃtodo de fracionamento molecular com capas conjugadas (MFCC). Os resultados obtidos para as estatinas sugerem que: (i) as mais (menos) eficazes sÃo a atorvastatina e a rosuvastatina (sinvastatina e fluvastatina), o que està de acordo com a clÃnica e valores dos seus Ãndices de concentraÃÃes inibitÃrias IC50; (ii) sÃtios de ligaÃÃo com raios de pelo menos 12 à (alÃm do raio de 9,5 à sugerido pela anÃlise estrita de dados cristalogrÃficos) devem ser considerados para que resÃduos importantes como E665, D767, e R702 sejam considerados para que as eficiÃncias das estatinas sejam corretamente explicadas. Para a aspirina/bromoaspirina utilizou-se um refinamento quÃntico de segunda ordem dos dados cristalogrÃficos para se demonstrar que a energia de ligaÃÃo de ambos com a COX-1 sÃo aproximadamente a mesma, o que explica resultados experimentais de IC50 similares. A existÃncia de resÃduos atrativos e resulsivos à destacada, mostrando-se que Arg120 à o resÃduo que mais atrai o Ãcido salicÃlico apÃs acetilaÃÃo da Ser530, seguido de Ala527, Leu531, Leu359 e Ser353; por outro lado, Glu524 à o resÃduo repulsivo mais efetivo (intensidade comparÃvel ao Arg120), nunca tendo sido antes considerado como resÃduo importante no sÃtio de ligaÃÃo da aspirina/bromoaspirina na COX-1. Finalmente, no caso dos anti-hipertensivos, obtÃm-se que à necessÃrio se considerar raios do sÃtio de ligaÃÃo de 16 à para se obter que o lisinopropil e o ramipril (trandolapril e perindopril) apresentam as maiores (menores) energias de ligaÃÃo, o que explica a maior (menor) constante de inibiÃÃo dos mesmos entre os anti-hipertensivos estudados para a ACE da Drosophila melanogaster.
Costa, Roner Ferreira da. "Bioquímica quântica das estatinas, aspirina e anti-hipertensivos." reponame:Repositório Institucional da UFC, 2011. http://www.repositorio.ufc.br/handle/riufc/12543.
Full textSubmitted by Edvander Pires (edvanderpires@gmail.com) on 2015-05-29T22:17:20Z No. of bitstreams: 1 2011_tese_rfcosta.pdf: 5384677 bytes, checksum: b7096c8a3fe046f09eec5640166b7cba (MD5)
Approved for entry into archive by Edvander Pires(edvanderpires@gmail.com) on 2015-05-29T22:18:27Z (GMT) No. of bitstreams: 1 2011_tese_rfcosta.pdf: 5384677 bytes, checksum: b7096c8a3fe046f09eec5640166b7cba (MD5)
Made available in DSpace on 2015-05-29T22:18:27Z (GMT). No. of bitstreams: 1 2011_tese_rfcosta.pdf: 5384677 bytes, checksum: b7096c8a3fe046f09eec5640166b7cba (MD5) Previous issue date: 2011
As doenças cardiovasculares (CVDs) compreendem um amplo espectro de doenças do coração e vasos sanguíneos (artérias e veias), entre as quais se incluem a doença das artérias coronárias, o ataque cardíaco, a angina, a síndrome coronariana aguda, o aneurisma da aorta, arritmias cardíacas, a doença cardíaca congênita, a insuficiência cardíaca e a doença cardíaca reumática. Entre os principias fármacos que tratam as doenças cardiovasculares estão: (i) as estatinas, que atuam inibindo a 3-hidroxi-3-metilgluratil coenzima A (HMG-CoA) redutase no processo de conversão da HMG-CoA em mevalonato, numa das etapas da biossíntese do colesterol. Observa-se em ensaios clínicos que a ação das estatinas pode diminuir os níveis de colesterol de baixa densidade (LDL) entre 20\% e 60\%, reduzindo os eventos coronarianos em até 1/3 no período de cinco anos; (ii) a aspirina, com a qual há mais de 400 preparações nos EUA e se produz cerca de 20 mil toneladas anualmente. Após mais de um século de prática clínica, a aspirina continua sendo a droga antitrombótica, antitérmica, analgésica e antiproliferativa mais amplamente recomendada. Ela age bloqueando a biossíntese de hormônios inflamatórios prostanóides através da inibição das enzimas ciclooxigenase COX-1 e COX-2; (iii) os anti-hipertensivos, para os quais a Enzima Conversora de Angiotensina (ECA) é o principal alvo (inibidores da ECA estão no mercado a mais de 20 anos) visando o combate das pressões arteriais elevadas, que provocam alterações nos vasos sanguíneos e na musculatura do coração, e levam a hipertrofia do ventrículo esquerdo do coração, acidente vascular cerebral, infarto do miocárdio, morte súbita, insuficiências renal e cardíaca, etc. A hipertensão arterial (HTA) ou hipertensão arterial sistêmica (HAS), conhecida popularmente como pressão alta, é uma das doenças com maior prevalência no mundo moderno. A ECA atua na regulação da pressão sanguínea via conversão do decapeptídeo angiotensina I no potente vasopressor angiotensina II e também pela inativação da bradicinina, sendo componente central do Sistema Renina-Angiotensina-Aldeosterona (SRAA), que controla a pressão sanguínea e tem forte influência nas funções relacionadas ao coração e os rins, bem como na contração dos vasos sanguíneos. Nesta tese realiza-se um estudo da bioquímica quântica de estatinas (atorvastina, rosuvastatina, cerivastatina, mevastatina, sinvastatina e fluvastatina), da aspirina/bromoaspirina e de anti-hipertensivos (captopril, enalapril, lisinopril, ramipril, trandolapril e perindopril) levando-se em conta dados cristalográficos dos seus sítios de ligação nas proteínas HMGR, COX-1 (o da aspirina foi simulado partindo-se dos dados da bromoaspirina) e ECA, respectivamente. As simulações computacionais foram realizadas considerando-se a Teoria do Funcional de Densidade (DFT) na aproximação da densidade local (LDA) e funcional de troca e correlação PWC, com energia de interação entre os resíduos das proteínas circunscritos ao sítio de ligação de raio r e os fármacos calculada através do método de fracionamento molecular com capas conjugadas (MFCC). Os resultados obtidos para as estatinas sugerem que: (i) as mais (menos) eficazes são a atorvastatina e a rosuvastatina (sinvastatina e fluvastatina), o que está de acordo com a clínica e valores dos seus índices de concentrações inibitórias IC50; (ii) sítios de ligação com raios de pelo menos 12 Å (além do raio de 9,5 Å sugerido pela análise estrita de dados cristalográficos) devem ser considerados para que resíduos importantes como E665, D767, e R702 sejam considerados para que as eficiências das estatinas sejam corretamente explicadas. Para a aspirina/bromoaspirina utilizou-se um refinamento quântico de segunda ordem dos dados cristalográficos para se demonstrar que a energia de ligação de ambos com a COX-1 são aproximadamente a mesma, o que explica resultados experimentais de IC50 similares. A existência de resíduos atrativos e resulsivos é destacada, mostrando-se que Arg120 é o resíduo que mais atrai o ácido salicílico após acetilação da Ser530, seguido de Ala527, Leu531, Leu359 e Ser353; por outro lado, Glu524 é o resíduo repulsivo mais efetivo (intensidade comparável ao Arg120), nunca tendo sido antes considerado como resíduo importante no sítio de ligação da aspirina/bromoaspirina na COX-1. Finalmente, no caso dos anti-hipertensivos, obtém-se que é necessário se considerar raios do sítio de ligação de 16 Å para se obter que o lisinopropil e o ramipril (trandolapril e perindopril) apresentam as maiores (menores) energias de ligação, o que explica a maior (menor) constante de inibição dos mesmos entre os anti-hipertensivos estudados para a ACE da Drosophila melanogaster.
Kryške, Lukáš. "Rozpoznávání řeči s pomocí nástroje Sphinx-4." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2014. http://www.nusl.cz/ntk/nusl-220655.
Full textKarlsson, David. "Ljudklassificering med Tensorflow och IOT-enheter : En teknisk studie." Thesis, Mittuniversitetet, Institutionen för informationssystem och –teknologi, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-39331.
Full textTermer som Artificiell Intelligens och maskininlärning har under de senaste åren börjat etablera sig hos den breda massan och är numera någonting som på- verkar nästan alla människors vardagliga liv i någon form. Vanliga använd- ningsområden är röststyrning och bildigenkänning som bland annat används i mobiltelefoner och autonoma system som självkörande bilar med mera. Den här studien utforskar hur man kan använda sig av denna teknik för att kunna klassi- ficera ljud som ett komplement till videoövervakning i olika miljöer, till exem- pel på en busstation eller andra övervakningsobjekt. För att göra detta har en teknik kallad Convolution Neural Network använts, vilket är en mycket populär arkitektur att använda vid klassificering av bilder. I denna modell har varje ljud fått en visuell representation i form av ett spektogram som visar frekvenser över tid. Ett av huvudmålen med denna studie har varit att kunna applicera denna teknik på så kallade IOT-enheter för att klassificera ljud i realtid. Dessa är rela- tivt billiga och resurssnåla enheter vilket gör dem till ett attraktivt alternativ för detta ändamål. I denna studie används en Raspberry Pi för att köra en prototyp- version med Tensorflow & Keras som grund APIer. Studien visar bland annat på vilka moment och delar som är viktiga att tänka på för att få igång ett smidigt och pålitligt system, till exempel vilken hårdvara och mjukvara som krävs för att starta. Den visar också på vilka faktorer som spelar in för att kunna streama ljud med bra resultat, detta då en klassifikationsmodells arkitektur och upp- byggnad kan ha stor påverkan på slutresultatet.
Li, Ke. "Analysis of Energy losses of Microbial Fuel Cells (MFCs) and Design of an Innovative Constructed Wetlands-MFC." The Ohio State University, 2017. http://rave.ohiolink.edu/etdc/view?acc_num=osu1500604673955179.
Full textCampos, Victor de Abreu [UNESP]. "Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado." Universidade Estadual Paulista (UNESP), 2017. http://hdl.handle.net/11449/151725.
Full textApproved for entry into archive by Monique Sasaki (sayumi_sasaki@hotmail.com) on 2017-09-28T13:43:21Z (GMT) No. of bitstreams: 1 campos_va_me_sjrp.pdf: 5473435 bytes, checksum: 1e76ecc15a4499dc141983740cc79e5a (MD5)
Made available in DSpace on 2017-09-28T13:43:21Z (GMT). No. of bitstreams: 1 campos_va_me_sjrp.pdf: 5473435 bytes, checksum: 1e76ecc15a4499dc141983740cc79e5a (MD5) Previous issue date: 2017-08-31
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
A quantidade vertiginosa de conteúdo multimídia acumulada diariamente tem demandado o desenvolvimento de abordagens eficazes de recuperação. Nesse contexto, ferramentas de reconhecimento de locutor capazes de identificar automaticamente um indivíduo pela sua voz são de grande relevância. Este trabalho apresenta uma nova abordagem de reconhecimento de locutor modelado como um cenário de recuperação e usando algoritmos de aprendizado não supervisionado recentes. A abordagem proposta considera Coeficientes Cepstrais de Frequência Mel (MFCCs) e Coeficientes de Predição Linear Perceptual (PLPs) como características de locutor, em combinação com múltiplas abordagens de modelagem probabilística, especificamente Quantização Vetorial, Modelos por Mistura de Gaussianas e i-vectors, para calcular distâncias entre gravações de áudio. Em seguida, métodos de aprendizado não supervisionado baseados em ranqueamento são utilizados para aperfeiçoar a eficácia dos resultados de recuperação e, com a aplicação de um classificador de K-Vizinhos Mais Próximos, toma-se uma decisão quanto a identidade do locutor. Experimentos foram conduzidos considerando três conjuntos de dados públicos de diferentes cenários e carregando ruídos de diversas origens. Resultados da avaliação experimental demonstram que a abordagem proposta pode atingir resultados de eficácia altos. Adicionalmente, ganhos de eficácia relativos de até +318% foram obtidos pelo procedimento de aprendizado não supervisionado na tarefa de recuperação de locutor e ganhos de acurácia relativos de até +7,05% na tarefa de identificação entre gravações de domínios diferentes.
The huge amount of multimedia content accumulated daily has demanded the development of effective retrieval approaches. In this context, speaker recognition tools capable of automatically identifying a person through their voice are of great relevance. This work presents a novel speaker recognition approach modelled as a retrieval scenario and using recent unsupervised learning methods. The proposed approach considers Mel-Frequency Cepstral Coefficients (MFCCs) and Perceptual Linear Prediction Coefficients (PLPs) as features along with multiple modelling approaches, namely Vector Quantization, Gaussian Mixture Models and i-vector to compute distances among audio objects. Next, rank-based unsupervised learning methods are used for improving the effectiveness of retrieval results and, based on a K-Nearest Neighbors classifier, an identity decision is taken. Several experiments were conducted considering three public datasets from different scenarios, carrying noise from various sources. Experimental results demonstrate that the proposed approach can achieve very high effectiveness results. In addition, effectiveness gains up to +318% were obtained by the unsupervised learning procedure in a speaker retrieval task. Also, accuracy gains up to +7,05% were obtained by the unsupervised learning procedure in a speaker identification task considering recordings from different domains.
FAPESP: 2015/07934-4
Urbiš, Oldřich. "Algoritmy rozpoznávání řeči na FPGA/DSP." Master's thesis, Vysoké učení technické v Brně. Fakulta informačních technologií, 2008. http://www.nusl.cz/ntk/nusl-235943.
Full textŽidlík, Pavel. "Počítačová analýza sportovních zápasů." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2009. http://www.nusl.cz/ntk/nusl-218104.
Full textPelikán, Pavel. "Určení výšky osob z řečového projevu." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2013. http://www.nusl.cz/ntk/nusl-220197.
Full textAlmeida, Christiane Raulino. "Extratores de características acústicas inspirados no sistema periférico auditivo." Universidade Federal de Sergipe, 2014. http://ri.ufs.br:8080/xmlui/handle/123456789/5014.
Full textExtrair informações de sinais acústicos é uma tarefa bastante comum dentro das áreas de processamento de sinais e reconhecimento de padrões. De uma maneira geral, os sistemas de processamento têm como tarefa inicial obter uma representação de baixa dimensão do sinal acústico, obtida a partir de métodos computacionais denominados extratores de características. Tal representação propõe apresentar o som da fala de uma forma mais conveniente à tarefa de extração e utilização da informação contida no sinal. Dentro deste contexto, nesta dissertação foi realizado um estudo detalhado de três métodos clássicos para extração de características de sinais acústicos existentes na literatura, a saber: os Mel-Frequency Cepstrum Coefficients (MFCC); o modelo Ensemble Interval Histogram (EIH); e o modelo Zero-Crossing with Peak Amplitudes (ZCPA). Sendo que, ainda para revisão bibliográfica, um estudo do sistema auditivo periférico humano foi realizado, visto que os métodos EIH e ZCPA são baseados em modelos do ouvido humano. Em seguida, um novo método de extração baseado em detecção de cruzamentos de nível foi desenvolvido ao longo do trabalho, denominado Eventos Acústicos Elementares (EAE). Diversos experimentos foram realizados a fim de comparar os métodos clássicos e o método desenvolvido nessa dissertação. Na primeira etapa, foram realizados experimentos com ruídos aditivos e com efeitos convolutivos de canal, para análise de robustez dos métodos. Por fim, referente à segunda etapa da análise comparativa dos métodos, foram realizados experimentos relativos à tarefa de reconhecimento de palavras isoladas, utilizando o método de alinhamento temporal Dynamic Time Warping (DTW). Os resultados obtidos indicam que o método proposto possui maior robustez quando comparado aos métodos clássicos implementados.
Ujihara, Rintaro. "Multi-objective optimization for model selection in music classification." Thesis, KTH, Optimeringslära och systemteori, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-298370.
Full textI och med genombrottet av maskininlärningstekniker har forskning kring känsloklassificering i musik sett betydande framsteg genom att kombinera olikamusikanalysverktyg med nya maskinlärningsmodeller. Trots detta är hur man förbehandlar ljuddatat och valet av vilken maskinklassificeringsalgoritm som ska tillämpas beroende på vilken typ av data man arbetar med samt målet med projektet. Denna uppsats samarbetspartner, Ichigoichie AB, utvecklar för närvarande ett system för att kategorisera musikdata enligt positiva och negativa känslor. För att höja systemets noggrannhet är målet med denna uppsats att experimentellt hitta bästa modellen baserat på sex musik-egenskaper (Mel-spektrogram, MFCC, HPSS, Onset, CENS samt Tonnetz) och ett antal olika maskininlärningsmodeller, inklusive Deep Learning-modeller. Varje modell hyperparameteroptimeras och utvärderas enligt paretooptimalitet med hänsyn till noggrannhet och beräkningstid. Resultaten visar att den mest lovande modellen uppnådde 95% korrekt klassificering med en beräkningstid på mindre än 15 sekunder.
Ulrich, Natalja. "Linguistic and speaker variation in Russian fricatives." Electronic Thesis or Diss., Lyon 2, 2022. http://www.theses.fr/2022LYO20031.
Full textThis thesis represents an acoustic-phonetic investigation of phonetic details in Russian fricatives. The main aim was to detect acoustic correlates that carry linguistic and idiosyncratic information. The questions addressed were whether the place of articulation, speakers' gender and ID can be predicted by a set of acoustic cues and which acoustic measures represent the most reliable indicators. Furthermore, the distribution of speaker-specific characteristics and inter- and intra-speaker variation across acoustic cues were studied in more detail.The project started with the generation of a large audio database of Russian fricatives. Then, two follow-up analyses were conducted. Acoustic recordings were collected from 59 native Russian speakers. The resulting dataset consists of 22,561 tokens including the fricatives [f], [s], [ʃ], [x], [v], [z], [ʒ], [sj], [ɕ], [vʲ], [zʲ].The first study employed a data sample of 6320 tokens (from 40 speakers). Temporal and spectral measurements were extracted using three acoustic cue extraction techniques (full sound, the noise part, and the middle 30ms windows). Furthermore, 13 Mel Frequency Cepstral Coefficients were computed from the middle 30ms window.Classifiers based on single decision trees, random forests, support vector machines, and neural networks were trained and tested to distinguish between the three non-palatalized fricatives [f], [s] and [ʃ].The results demonstrate that machine learning techniques are very successful at classifying the Russian voiceless non-palatalized fricatives [f], [s] and [ʃ] by using the centre of gravity and the spectral spread irrespective of contextual and speaker variation. The three acoustic cue extraction techniques performed similarly in terms of classification accuracy (93% and 99%), but the spectral measurements extracted from the noise parts resulted in slightly better accuracy. Furthermore, Mel Frequency Cepstral Coefficients show marginally higher predictive power over spectral cues (< 2%).This suggests that both spectral measures and Mel Frequency Cepstral provide sufficient information for the classification of these fricatives and their choice depends on the particular research question or application. The second study's dataset consists of 15812 tokens (59 speakers) that contain [f], [s], [ʃ], [x], [v], [z], [ʒ], [sj], [ɕ]. As in the first study, two types of acoustic cues were extracted including 11 acoustic speech features (spectral cues, duration and HNR measures) and 13 Mel Frequency Cepstral Coefficients. Classifiers based on single decision trees and random forests were trained and tested to predict speakers' gender and ID
Грушко, Ярослав Володимирович. "Система голосової біометрії, економна до обчислювальних ресурсів." Master's thesis, КПІ ім. Ігоря Сікорського, 2019. https://ela.kpi.ua/handle/123456789/32176.
Full textThe purpose of this work is to create a cost-effective system for voice biometrics. The main purpose of the work was to build a general scheme of such a system as well as determine its components and optimal parameters. The object of study of this master's work is the recognition of human voice by computer. The subject of the study is voice biometrics, ie voice recognition of the individual. Designed system contain three basic modules. The first module is the MFCCs, the algorithm that give off individual voiceprint. The second module is a classifier that has to learn the voiceprints obtained with the first module. The third, and last, module is the verifier, which for the second time (after the classifier) verifies the correct identification of the person. A separate system was developed for parameter selection. Based on the selected optimal parameters, console application of voice biometrics in the Python programming language and a separate java mobile application were created. The accuracy of the console application on a dataset of 80 samples of 40 different individuals was 93%. During authentication, when 6 seconds of speech were been processing, the duration of the console application working was 2 seconds. The first stage of the development of the startup project was completed, namely, the marketing analysis of the startup project was performed.
Odehnal, Jiří. "Řízení a měření sportovních drilů hlasem/zvuky." Master's thesis, Vysoké učení technické v Brně. Fakulta informačních technologií, 2019. http://www.nusl.cz/ntk/nusl-399705.
Full textHacine-Gharbi, Abdenour. "Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole." Phd thesis, Université d'Orléans, 2012. http://tel.archives-ouvertes.fr/tel-00843652.
Full textHoudek, Miroslav. "Rozpoznání emočního stavu člověka z řeči." Master's thesis, Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií, 2009. http://www.nusl.cz/ntk/nusl-218117.
Full textEvelyn. "Mediator combined gaseous substrate for electricity generation in microbial fuel cells (MFCs) and potential integration of a MFC into an anaerobic biofiltration system." Thesis, University of Canterbury. Department of Chemical ad Process Engineering, 2013. http://hdl.handle.net/10092/10733.
Full textLarsson, Joel. "Optimizing text-independent speaker recognition using an LSTM neural network." Thesis, Mälardalens högskola, Akademin för innovation, design och teknik, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-26312.
Full text