Teses / dissertações sobre o tema "Sentient Machine"
Crie uma referência precisa em APA, MLA, Chicago, Harvard, e outros estilos
Veja os 50 melhores trabalhos (teses / dissertações) para estudos sobre o assunto "Sentient Machine".
Ao lado de cada fonte na lista de referências, há um botão "Adicionar à bibliografia". Clique e geraremos automaticamente a citação bibliográfica do trabalho escolhido no estilo de citação de que você precisa: APA, MLA, Harvard, Chicago, Vancouver, etc.
Você também pode baixar o texto completo da publicação científica em formato .pdf e ler o resumo do trabalho online se estiver presente nos metadados.
Veja as teses / dissertações das mais diversas áreas científicas e compile uma bibliografia correta.
OGURI, PEDRO. "MACHINE LEARNING FOR SENTIMENT CLASSIFICATION". PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO, 2006. http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9947@1.
Texto completo da fonteSentiment Analysis é um problema de categorização de texto no qual deseja-se identificar opiniões favoráveis e desfavoráveis com relação a um tópico. Um exemplo destes tópicos de interesse são organizações e seus produtos. Neste problema, documentos são classificados pelo sentimento, conotação, atitudes e opiniões ao invés de se restringir aos fatos descritos neste. O principal desafio em Sentiment Classification é identificar como sentimentos são expressados em textos e se tais sentimentos indicam uma opinião positiva (favorável) ou negativa (desfavorável) com relação a um tópico. Devido ao crescente volume de dados disponível na Web, onde todos tendem a ser geradores de conteúdo e expressarem opiniões sobre os mais variados assuntos, técnicas de Aprendizado de Máquina vem se tornando cada vez mais atraentes. Nesta dissertação investigamos métodos de Aprendizado de Máquina para Sentiment Analysis. Apresentamos alguns modelos de representação de documentos como saco de palavras e N-grama. Testamos os classificadores SVM (Máquina de Vetores Suporte) e Naive Bayes com diferentes modelos de representação textual e comparamos seus desempenhos.
Sentiment Analysis is a text categorization problem in which we want to identify favorable and unfavorable opinions towards a given topic. Examples of such topics are organizations and its products. In this problem, docu- ments are classifed according to their sentiment, connotation, attitudes and opinions instead of being limited to the facts described in it. The main challenge in Sentiment Classification is identifying how sentiments are expressed in texts and whether they indicate a positive (favorable) or negative (unfavorable) opinion towards a topic. Due to the growing volume of information available online in an environment where we all tend to be content generators and express opinions on a variety of subjects, Machine Learning techniques have become more and more attractive. In this dissertation, we investigate Machine Learning methods applied to Sentiment Analysis. We present document representation models such as bag-of-words and N-grams.We compare the performance of the Naive Bayes and the Support Vector Machine classifiers for each proposed model
Alotaibi, Saud Saleh. "Sentiment analysis in the Arabic language using machine learning". Thesis, Colorado State University, 2015. http://pqdtopen.proquest.com/#viewpdf?dispub=3720340.
Texto completo da fonteSentiment analysis has recently become one of the growing areas of research related to natural language processing and machine learning. Much opinion and sentiment about specific topics are available online, which allows several parties such as customers, companies and even governments, to explore these opinions. The first task is to classify the text in terms of whether or not it expresses opinion or factual information. Polarity classification is the second task, which distinguishes between polarities (positive, negative or neutral) that sentences may carry. The analysis of natural language text for the identification of subjectivity and sentiment has been well studied in terms of the English language. Conversely, the work that has been carried out in terms of Arabic remains in its infancy; thus, more cooperation is required between research communities in order for them to offer a mature sentiment analysis system for Arabic. There are recognized challenges in this field; some of which are inherited from the nature of the Arabic language itself, while others are derived from the scarcity of tools and sources.
This dissertation provides the rationale behind the current work and proposed methods to enhance the performance of sentiment analysis in the Arabic language. The first step is to increase the resources that help in the analysis process; the most important part of this task is to have annotated sentiment corpora. Several free corpora are available for the English language, but these resources are still limited in other languages, such as Arabic. This dissertation describes the work undertaken by the author to enrich sentiment analysis in Arabic by building a new Arabic Sentiment Corpus. The data is labeled not only with two polarities (positive and negative), but the neutral sentiment is also used during the annotation process.
The second step includes the proposal of features that may capture sentiment orientation in the Arabic language, as well as using different machine learning classifiers that may be able to work better and capture the non-linearity with a richly morphological and highly inflectional language, such as Arabic. Different types of features are proposed. These proposed features try to capture different aspects and characteristics of Arabic. Morphological, Semantic, Stylistic features are proposed and investigated. In regard with the classifier, the performance of using linear and nonlinear machine learning approaches was compared. The results are promising for the continued use of nonlinear ML classifiers for this task. Learning knowledge from a particular dataset domain and applying it to a different domain is one useful method in the case of limited resources, such as with the Arabic language. This dissertation shows and discussed the possibility of applying cross-domain in the field of Arabic sentiment analysis. It also indicates the feasibility of using different mechanisms of the cross-domain method.
Other work in this dissertation includes the exploration of the effect of negation in Arabic subjectivity and polarity classification. The negation word lists were devised to help in this and other natural language processing tasks. These words include both types of Arabic, Modern Standard and some of Dialects. Two methods of dealing with the negation in sentiment analysis in Arabic were proposed. The first method is based on a static approach that assumes that each sentence containing negation words is considered a negated sentence. When determining the effect of negation, different techniques were proposed, using different word window sizes, or using base phrase chunk. The second approach depends on a dynamic method that needs an annotated negation dataset in order to build a model that can determine whether or not the sentence is negated by the negation words and to establish the effect of the negation on the sentence. The results achieved by adding negation to Arabic sentiment analysis were promising and indicate that the negation has an effect on this task. Finally, the experiments and evaluations that were conducted in this dissertation encourage the researchers to continue in this direction of research.
Paknejad, Sepideh. "Sentiment classification on Amazon reviews using machine learning approaches". Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-233551.
Texto completo da fonteEftersom marknadsplatser online har varit populära under de senaste decennierna, så har online-säljare och inköpsmän ställt kunderna frågor om deras åsikter gällande varorna de har köpt. Som ett resultat genereras miljontals recensioner dagligen vilket gör det svårt för en potentiell konsument att fatta ett bra beslut om de ska köpa produkten eller inte. Att analysera den enorma mängden åsikter är också svårt och tidskrävande för produktproducenter. Denna avhandling tar upp problemet med att klassificera recensioner med deras övergripande semantiska (positiva eller negativa). För att genomföra studien har två olika övervakade maskininlärningstekniker, SVM och Naïve Bayes, testats på recensioner av skönhetsprodukter från Amazon. Deras noggrannhet har sedan jämförts. Resultaten visade att SVM-tillvägagångssättet överträffar Naïve Bayes-tillvägagångssättet när datasetet är större. Båda algoritmerna nådde emellertid lovande noggrannheter på minst 80%.
WESTLING, ANDERS. "Sentiment Analysisof Microblog Posts from a Crisis Eventusing Machine Learning". Thesis, KTH, Skolan för datavetenskap och kommunikation (CSC), 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-138428.
Texto completo da fonteI och med att tjänster för sociala medier blir allt mer populära, existerar det nu en konstant ström av åsikter fritt tillgängliga på internet. Dessa åsikter kan analyseras för att finna användarnas känslor kring olika ämnen. Ett exempel av intresse är att se hur folk känner under en krissituation för att få en bättre uppfattning om vilken typ av hjälp som skulle vara till mest nytta för tillfället. Målet med detta examensarbete har varit att se om det är möjligt att skapa en automatisk klassificerare, baserad på maskininlärningsmetoder, som med precision kan avgöra huruvida ett mikroblogginlägg skrivet under en politisk händelse i Ryssland är för, emot, eller neutral till den grupp människor som händelsen kretsar kring. Problemet väntas vara svårare än sentimentanalys av normallånga texter, detta eftersom mikroblogginlägg är mycket kortare och ofta har ett informellt språk. Ett antal olika algoritmer för maskininlärning studerades tillsammans med olika metoder för att representera mikroblogginläggen på ett format som algoritmerna kan arbeta med. De mest lovande utav dessa algoritmer och representationer implementerades och testades för att se om en effektiv klassificerare kunde åstakommas. Resultaten visar att algoritmerna inte är tillräckligt bra för att skapa en tillräckligt precis klassificerare med den träningsdata som användes. En stor faktor tros vara den lilla mängden träningsdata som användes. En bättre klassificerare skulle potentiellt kunna uppnås om genom att använda fler mikrobloginlägg som träningsdata. Det vore även intressant att utforska andra sentimentklassificeringar utav mikroblogginlägg, då den som användes i det här arbetet tros vara särskilt svår. Den här studien och tidigare forskning på liknande klassificeringar talar för att detta är ett svårt problem som kräver mer arbete för att en precis klassificerare ska kunna erhållas.
Erogul, Umut. "Sentiment Analysis In Turkish". Master's thesis, METU, 2009. http://etd.lib.metu.edu.tr/upload/12610616/index.pdf.
Texto completo da fonteDi, Gennaro Pierluigi. "Due approcci alla sentiment polarity classification di tweet per la lingua italiana". Master's thesis, Alma Mater Studiorum - Università di Bologna, 2017. http://amslaurea.unibo.it/13270/.
Texto completo da fonteVaswani, Vishwas. "Predicting sentiment-mention associations in product reviews". Thesis, Kansas State University, 2012. http://hdl.handle.net/2097/13714.
Texto completo da fonteDepartment of Computing and Information Sciences
Doina Caragea
With the rising trend in social networking, more people express their opinions on the web. As a consequence, there has been an increase in the number of blogs where people write reviews about the products they buy or services they experience. These reviews can be very helpful to other potential customers who want to know the pros and cons of a product, and also to manufacturers who want to get feedback from customers about their products. Sentiment analysis of online data (such as review blogs) is a rapidly growing field of research in Machine Learning, which can leverage online reviews and quickly extract the sentiment of a whole blog. The accuracy of a sentiment analyzer relies heavily on correctly identifying associations between a sentiment (opinion) word and the targeted mention (token or object) in blog sentences. In this work, we focus on the task of automatically identifying sentiment-mention associations, in other words, we identify the target mention that is associated with a sentiment word in a sentence. Support Vector Machines (SVM), a supervised machine learning algorithm, was used to learn classifiers for this task. Syntactic and semantic features extracted from sentences were used as input to the SVM algorithm. The dataset used in the work has reviews from car and camera domain. The work is divided into two phases. In the first phase, we learned domain specific classifiers for the car and camera domains, respectively. To further improve the predictions of the domain specific classifiers we investigated the use of transfer learning techniques in the second phase. More precisely, the goal was to use knowledge from a source domain to improve predictions for a target domain. We considered two transfer learning approaches: a feature level fusion approach and a classifier level fusion approach. Experimental results show that transfer learning can help to improve the predictions made using the domain specific classifier approach. While both the feature level and classifier level fusion approaches were shown to improve the prediction accuracy, the classifier level fusion approach gave better results.
Svensson, Kristoffer. "Sentiment Analysis With Convolutional Neural Networks : Classifying sentiment in Swedish reviews". Thesis, Linnéuniversitetet, Institutionen för datavetenskap (DV), 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-64768.
Texto completo da fonteCAMBA, GIACOMO. "Machine Learning in Social Media Sentiment Classification and Trading Strategy Design". Doctoral thesis, Università degli Studi di Cagliari, 2022. http://hdl.handle.net/11584/333407.
Texto completo da fonteCAPUA, M. DI. "A DEEP LEARNING APPROACH FOR SENTIMENT ANALYSIS". Doctoral thesis, Università degli Studi di Milano, 2017. http://hdl.handle.net/2434/467844.
Texto completo da fonteSentiment Analysis refers to the process of computationally identifying and categorizing opinions expressed in a piece of text, in order to determine whether the writer’s attitude towards a particular topic or product is positive, negative, or even neutral. The views expressed and its related concepts, such as feelings, judgments, and emotions have become recently a subject of study and research in both academic and industrial areas. Unfortunately language comprehension of user comments, especially in social networks, is inherently complex to computers. The ways in which humans express themselves with natural language are nearly unlimited and informal texts is riddled with typos, misspellings, badly set up syntactic constructions and also specific symbols (e.g. hashtags in Twitter) which exponentially complicate this task. Recently, deep learning approaches are emerging as powerful computational models that discover intricate semantic representations of texts automatically from data without hand-made feature engineering. These approaches have improved the state-of-the-art in many Sentiment Analysis tasks including sentiment classification of sentences or documents, sentiment lexicon learning and also in more complex problems as cyber bullying detection. The contributions of this work are twofold. First, related to the general Sentiment Analysis problem, we propose a semi-supervised neural network model, based on Deep Belief Networks, able to deal with data uncertainty for text sentences in Italian language. We test this model against some datasets from literature related to movie reviews, adopting a vectorized representation of text (Word2Vec) and exploiting methods from Natural Language Processing (NLP) pre-processing. Second, assuming that the cyber bullying phenomenon can be treated as a particular Sentiment Analysis problem, we propose an unsupervised approach to automatic cyber bullying detection in social networks, based both on Growing Hierarchical Self Organizing Map (GHSOM) and on a new specific features model, showing that our solution can achieve interesting results, respect to classical supervised approaches.
Salah, Zaher. "Machine learning and sentiment analysis approaches for the analysis of Parliamentary debates". Thesis, University of Liverpool, 2014. http://livrepository.liverpool.ac.uk/19793/.
Texto completo da fonteManda, Kundan Reddy. "Sentiment Analysis of Twitter Data Using Machine Learning and Deep Learning Methods". Thesis, Blekinge Tekniska Högskola, Institutionen för datavetenskap, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:bth-18447.
Texto completo da fonteHeeley, Robert. "A hybrid machine learning approach to measuring sentiment, credibility and influence on Twitter". Thesis, City, University of London, 2017. http://openaccess.city.ac.uk/20213/.
Texto completo da fonteSundaram, Arun C. "A Comparison of Machine Learning Techniques on Automated Essay Grading and Sentiment Analysis". The Ohio State University, 2015. http://rave.ohiolink.edu/etdc/view?acc_num=osu1428460405.
Texto completo da fonteBlomkvist, Oscar. "Machine Learning Based Sentiment Classification of Text, with Application to Equity Research Reports". Thesis, KTH, Matematisk statistik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-257506.
Texto completo da fonteI denna rapport analyserar vi sentimentet, eller attityden, i aktieanalysrapporter skrivna av analytiker på Skandinaviska Enskilda Banken (SEB). Etablerade statistiska metoder och maskininlärningsmetoder för klassificering av sentimentet i textdokument som antingen positivt eller negativt presenteras. Vi är speciellt intresserade av en typ av rekurrent neuronnät känt som long short-term memory (LSTM). Vidare undersöker vi två olika scheman för att märka upp träningsdatan som genereras från rapporterna. Riktmärken för klassificeringsgraden erhålls med hjälp av logistisk regression. Slutligen implementeras två olika ordrepresentationsmodeller och dubbelriktad LSTM av varierande nätverksstorlek, och jämförs med riktmärkena. Vi finner att logistisk regression presterar bra för ett av märkningsschemana, och att LSTM har något bättre prestanda.
Poria, Soujanya. "Novel symbolic and machine-learning approaches for text-based and multimodal sentiment analysis". Thesis, University of Stirling, 2017. http://hdl.handle.net/1893/25396.
Texto completo da fonteAngioni, Consuelo <1991>. "Machine learning e fattore umano nella sentiment analysis. Il caso Starbucks a Milano". Master's Degree Thesis, Università Ca' Foscari Venezia, 2017. http://hdl.handle.net/10579/10577.
Texto completo da fonteMemari, Majid. "Predicting the Stock Market Using News Sentiment Analysis". OpenSIUC, 2018. https://opensiuc.lib.siu.edu/theses/2442.
Texto completo da fonteLarsson, Martin, e Samuel Ljungberg. "Readability: Man and Machine : Using readability metrics to predict results from unsupervised sentiment analysis". Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301842.
Texto completo da fonteLäsbarhetsmått bedömer hur lätt eller svårt det är för människor att läsa och förstå skrivna texter. Eftersom nya maskininlärningstekniker har utvecklats kan datorer numera också analysera texter. Därför är en intressant infallsvinkel huruvida läsbarhetsmåtten också kan användas för att bedöma hur lätt eller svårt det är för maskiner att förstå texter. Mot denna bakgrund använder den specifika maskinen i denna uppsats ordinbäddningar i syfte att utföra oövervakad sentimentanalys. Således minimeras behovet av etikettering och mänsklig handpåläggning, vilket resulterar i en mer djupgående analys av maskinen istället för människan. I två olika dataset jämförs rätt svar mot sentimentförutsägelser från Googles ordinbäddnings-algoritm Word2Vec för att producera en binär utdatavariabel per sentiment. Denna variabel, som representerar om en förutsägelse är korrekt eller inte, används sedan som beroende variabel i en logistisk regression med 17 olika läsbarhetsmått som oberoende variabler. Den resulterande modellen har högt förklaringsvärde och effekterna av läsbarhetsmåtten på resultaten från sentimentanalysen är mestadels statistiskt signifikanta. Emellertid är effekten på klassificeringen beroende på dataset, vilket indikerar att läsbarhetsmåtten ger uttryck för olika lingvistiska beteenden som är unika till datamängderna. Implikationen av resultaten är att läsbarhetsmåtten kan användas direkt i modeller som utför sentimentanalys för att förbättra deras prediktionsförmåga. Dessutom indikerar resultaten också att maskiner kan plocka upp på information som människor inte kan, exempelvis att vissa ord är associerade med positiva eller negativa sentiment.
Pereira, Vinicius Gomes. "Using supervised machine learning and sentiment analysis techniques to predict homophobia in portuguese tweets". reponame:Repositório Institucional do FGV, 2018. http://hdl.handle.net/10438/24301.
Texto completo da fonteApproved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2018-07-11T12:40:51Z (GMT) No. of bitstreams: 1 DissertacaoFinal.pdf: 2029614 bytes, checksum: 3eda3dc97f25c0eecd86608653150d82 (MD5)
Made available in DSpace on 2018-07-16T17:48:51Z (GMT). No. of bitstreams: 1 DissertacaoFinal.pdf: 2029614 bytes, checksum: 3eda3dc97f25c0eecd86608653150d82 (MD5) Previous issue date: 2018-04-16
Este trabalho estuda a identificação de tweets homofóbicos, utilizando uma abordagem de processamento de linguagem natural e aprendizado de máquina. O objetivo é construir um modelo preditivo que possa detectar, com razoável precisão, se um Tweet contém conteúdo ofensivo a indivı́duos LGBT ou não. O banco de dados utilizado para treinar os modelos preditivos foi construı́do agregando tweets de usuários que interagiram com polı́ticos e/ou partidos polı́ticos no Brasil. Tweets contendo termos relacionados a LGBTs ou que têm referências a indivı́duos LGBT foram coletados e classificados manualmente. Uma grande parte deste trabalho está na construção de features que capturam com precisão não apenas o texto do tweet, mas também caracterı́sticas especı́ficas dos usuários e de expressões coloquiais do português. Em particular, os usos de palavrões e vocabulários especı́ficos são um forte indicador de tweets ofensivos. Naturalmente, n-gramas e esquemas de frequência de termos também foram considerados como caracterı́sticas do modelo. Um total de 12 conjuntos de recursos foram construı́dos. Uma ampla gama de técnicas de aprendizado de máquina foi empregada na tarefa de classificação: Naive Bayes, regressões logı́sticas regularizadas, redes neurais feedforward, XGBoost (extreme gradient boosting), random forest e support vector machines. Depois de estimar e ajustar cada modelo, eles foram combinados usando voting e stacking. Voting utilizando 10 modelos obteve o melhor resultado, com 89,42% de acurácia.
This work studies the identification of homophobic tweets from a natural language processing and machine learning approach. The goal is to construct a predictive model that can detect, with reasonable accuracy, whether a Tweet contains offensive content to LGBT or not. The database used to train the predictive models was constructed aggregating tweets from users that have interacted with politicians and/or political parties in Brazil. Tweets containing LGBT-related terms or that have references to open LGBT individuals were collected and manually classified. A large part of this work is in constructing features that accurately capture not only the text of the tweet but also specific characteristics of the users and language choices. In particular, the uses of swear words and strong vocabulary is a quite strong predictor of offensive tweets. Naturally, n-grams and term weighting schemes were also considered as features of the model. A total of 12 sets of features were constructed. A broad range of machine learning techniques were employed in the classification task: naive Bayes, regularized logistic regressions, feedforward neural networks, extreme gradient boosting (XGBoost), random forest and support vector machines. After estimating and tuning each model, they were combined using voting and stacking. Voting using 10 models obtained the best result, with 89.42% accuracy.
Dettori, Emilio. "Sentiment Analysis per la moderazione di una community". Bachelor's thesis, Alma Mater Studiorum - Università di Bologna, 2018.
Encontre o texto completo da fonteTorchi, Andrea. "Sperimentazioni per "Sentiment Analysis" tramite Reti Neurali Profonde". Master's thesis, Alma Mater Studiorum - Università di Bologna, 2020.
Encontre o texto completo da fonteZhang, Jun. "Sentiment analysis of movie reviews in Chinese". Thesis, Uppsala universitet, Institutionen för lingvistik och filologi, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-412670.
Texto completo da fonteAhmed, Kachkach. "Analyzing user behavior and sentiment in music streaming services". Thesis, KTH, Skolan för datavetenskap och kommunikation (CSC), 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186527.
Texto completo da fonteDe senaste åren har strömningtjänster (för musik, podcasts, TV-serier och filmer) varit i strålkastarljuset genom att förändra synen på hur vi konsumerar media. Om det tekniska impikationerna av att strömma stora mängder data är väl utforskat finns det mycket kvar i att analysera de stora datamängderna som samlas in för att förstå och förbättra tjänsterna. Genom att använda rådata om hur användarna interagerar med musiktjänsten Spotify, fokuserar den här uppsatsen på tre huvudkoncept: strömmandets kontext, användares uppmäksamhet samt sekvensiell analys av användares handlingar. Vi diskuterar betydelsen av varje koncept och föreslår en olika statistiska och maskininlärningstekniker för att modellera dem. Vi visar hur dessa modeller kan användas för att förbättra strömmningstjänster genom att antyda användares sentiment, förbättra rekommendationer, karaktärisera användarsessioner, extrahera betendemönster och ta fram användbar affärsdata.
Nilsson, Ludvig, e Olle Djerf. "How to improve Swedish sentiment polarityclassification using context analysis". Thesis, Uppsala universitet, Institutionen för lingvistik och filologi, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-446382.
Texto completo da fonteNepal, Srijan. "Linguistic Approach to Information Extraction and Sentiment Analysis on Twitter". University of Cincinnati / OhioLINK, 2012. http://rave.ohiolink.edu/etdc/view?acc_num=ucin1342544962.
Texto completo da fonteClark, Eric Michael. "Applications In Sentiment Analysis And Machine Learning For Identifying Public Health Variables Across Social Media". ScholarWorks @ UVM, 2019. https://scholarworks.uvm.edu/graddis/1006.
Texto completo da fonteHaddi, Emma. "Sentiment analysis : text, pre-processing, reader views and cross domains". Thesis, Brunel University, 2015. http://bura.brunel.ac.uk/handle/2438/11196.
Texto completo da fonteSychra, Martin. "Analýza sentimentu s využitím dolování dat". Master's thesis, Vysoké učení technické v Brně. Fakulta informačních technologií, 2016. http://www.nusl.cz/ntk/nusl-255424.
Texto completo da fontePecore, Stefania. "Analyse des sentiments et des émotions de commentaires complexes en langue française". Thesis, Lorient, 2019. http://www.theses.fr/2019LORIS522/document.
Texto completo da fonte"Sentiment", "opinion" and "emotion" are words really vaguely defined; not even the dictionary seems to be of any help, being it the first to define each of the three by using the remaining two. And yet, the civilised world is heavily affected by opinions: companies need them to understand how to sell their products; people use them to buy the most fitting product and, more generally, to weigh their decisions; researchers exploit them in Artificial Intelligence studies to understand the nature of the human being. Today we can count on a humongous amount of available information, though it’s hard to use it. In fact, the so-called “Big data” are not always structured – especially for certain languages. French research suffers from a lack of readily available resources for tests. In the context of Natural Language Processing, this thesis aims to explore the nature of sentiment and emotion. Some of our contributions to the NLP research community are: creation of new resources for sentiment and emotion analysis, tests and comparisons of several machine learning methods to study the problem from different points of view - classification of online reviews using sentiment polarity, classification of product characteristics using Aspect- Based Sentiment Analysis. Finally, a psycholinguistic study - supported by a machine learning and lexical approaches – on the relation between who judges, the reviewer, and the object that has been judged, the product
Cunanan, Kevin. "Developing a Recurrent Neural Network with High Accuracy for Binary Sentiment Analysis". Scholarship @ Claremont, 2018. http://scholarship.claremont.edu/cmc_theses/1835.
Texto completo da fonteViegas, Catarina Correia. "Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system". Master's thesis, Instituto Superior de Economia e Gestão, 2020. http://hdl.handle.net/10400.5/20993.
Texto completo da fonteNunca se geraram tantos dados e a um ritmo tão alucinante como atualmente. Vive-se indubitavelmente numa era de Big Data e este termo não passa despercebido, trazendo consigo inúmeros desafios, mas também múltiplas oportunidades. Cerca de 80% dos dados encontra-se de forma desestruturada. Aqui, há um foco especial para o formato de texto, formato esse que para além de comum, agrega um grande potencial. Existem várias aplicações, técnicas e ferramentas associadas à análise de documentos textuais, e esta área surge fortemente ligada ao Processamento de Linguagem Natural. Um dos grandes desafios de ambos está relacionado com Análise de Sentimentos. Sendo interessante aliar tendências e abordar questões como a reputação online, o presente projeto focou-se na criação de um sistema capaz de identificar o sentimento associado a figuras públicas demonstrado através de publicações no Twitter. Com essa finalidade, o levou-se a cabo uma revisão de literatura capaz de explicitar os tópicos associados à temática escolhida. Relativamente ao sistema, optou-se por uma abordagem de Machine Learning com recurso a métodos supervisionados de aprendizagem. Para tal, criou-se um dataset manualmente anotado e procedeu-se ao treino de três classificadores (Naïve Bayes, Support Vector Machines e Entropia Máxima). O impacto de algumas técnicas de pré-processamento também foi medido. Os resultados obtidos não foram tão bons como desejado, mas o melhor modelo foi incorporado no sistema. Este projeto contribuiu para aumentar a base de conhecimento das áreas em que se insere, e fornece ainda um dataset manualmente anotado que poderá ser utilizado em investigações futuras.
Never has so much data been generated and at such an astounding rate as nowadays. This is undoubtedly an era of Big Data and this term does not go unnoticed, bearing within innumerous challenges, but also a multitude of opportunities. Of the generated data, roughly 80% comes unstructured, and there is a special focus on the text format, which appears frequently and carries great potential. There are several applications, techniques and tools connected to the analysis of textual documents and this area is strongly linked to Natural Language Processing. One of the greatest challenges of both is related to Sentiment Analysis. Since it would be interesting to combine trends and address issues such as online reputation, this project focused on creating a system capable of identifying the sentiment associated with public figures, demonstrated through Twitter publications. Firstly, a literature review capable of exploring the topics associated with the chosen subject was carried out. Afterwards,and regarding the system, a Machine Learning approach using supervised learning methods was adopted. For this, a manually annotated dataset was created and three of the most used classifiers (Naïve Bayes, Support Vector Machines and Maximum Entropy) were trained. The impact of some pre-processing techniques was also assessed. The obtained results were not as good as initially desired, nonetheless the best model was chosen to incorporate the system. This project contributed to increase the knowledge base of the areas in which it is comprised and provides a manually annotated dataset that can be used in further research.
info:eu-repo/semantics/publishedVersion
Wright, Lindsey. "Classifying textual fast food restaurant reviews quantitatively using text mining and supervised machine learning algorithms". Digital Commons @ East Tennessee State University, 2018. https://dc.etsu.edu/honors/451.
Texto completo da fonteJabreel, Mohammed Hamood Abdullah. "Sentiment Analysis of Textual Content in Social Networks. From Hand-Crafted to Deep Learning-Based Models". Doctoral thesis, Universitat Rovira i Virgili, 2020. http://hdl.handle.net/10803/669441.
Texto completo da fonteEsta tesis propone varios métodos avanzados para analizar automáticamente el contenido textual compartido en las redes sociales e identificar opiniones, emociones y sentimientos, en diferentes niveles de análisis y en diferentes idiomas. Comenzamos proponiendo un sistema de análisis de sentimientos, llamado SentiRich, que está basado en un conjunto rico de características, que incluyen la información extraída de léxicos de sentimientos y modelos de word embedding previamente entrenados. Luego, proponemos un sistema basado en redes neuronales convolucionales y regresores XGboost para resolver una variedad de tareas de análisis de sentimientos y emociones en Twitter. Estas tareas van desde las típicas tareas de análisis de sentimientos hasta la determinación automática de la intensidad de una emoción (como alegría, miedo, ira, etc.) y la intensidad del sentimiento de los autores de los tweets. También proponemos un novedoso sistema basado en Deep Learning para abordar el problema de clasificación de emociones múltiples en Twitter. Además, consideramos el problema del análisis de sentimientos dependiente del objetivo. Para este propósito, proponemos un sistema basado en Deep Learning que identifica y extrae el objetivo de los tweets. Si bien algunos idiomas, como el inglés, tienen una amplia gama de recursos para permitir el análisis de sentimientos, la mayoría de los idiomas carecen de ellos. Por lo tanto, utilizamos la técnica de Análisis de Sentimiento Inter-lingual para desarrollar un sistema novedoso, multilingüe y basado en Deep Learning para los lenguajes con pocos recursos lingüísticos. Proponemos combinar la Ayuda a la Toma de Decisiones Multi-criterio y el análisis de sentimientos para desarrollar un sistema que brinde a los usuarios la capacidad de explotar las opiniones junto con sus preferencias en el proceso de clasificación de alternativas. Finalmente, aplicamos los sistemas desarrollados al campo de la comunicación de las marcas de destino a través de las redes sociales. Con este fin, recopilamos tweets de personas locales, visitantes, y gabinetes oficiales de Turismo de diferentes destinos turísticos y analizamos las opiniones y las emociones compartidas en ellos. En general, los métodos propuestos en esta tesis mejoran el rendimiento de los enfoques de vanguardia y muestran hallazgos interesa.
This thesis proposes several advanced methods to automatically analyse textual content shared on social networks and identify people’ opinions, emotions and feelings at a different level of analysis and in different languages. We start by proposing a sentiment analysis system, called SentiRich, based on a set of rich features, including the information extracted from sentiment lexicons and pre-trained word embedding models. Then, we propose an ensemble system based on Convolutional Neural Networks and XGboost regressors to solve an array of sentiment and emotion analysis tasks on Twitter. These tasks range from the typical sentiment analysis tasks, to automatically determining the intensity of an emotion (such as joy, fear, anger, etc.) and the intensity of sentiment (aka valence) of the authors from their tweets. We also propose a novel Deep Learning-based system to address the multiple emotion classification problem on Twitter. Moreover, we considered the problem of target-dependent sentiment analysis. For this purpose, we propose a Deep Learning-based system that identifies and extracts the target of the tweets. While some languages, such as English, have a vast array of resources to enable sentiment analysis, most low-resource languages lack them. So, we utilise the Cross-lingual Sentiment Analysis technique to develop a novel, multi-lingual and Deep Learning-based system for low resource languages. We propose to combine Multi-Criteria Decision Aid and sentiment analysis to develop a system that gives users the ability to exploit reviews alongside their preferences in the process of alternatives ranking. Finally, we applied the developed systems to the field of communication of destination brands through social networks. To this end, we collected tweets of local people, visitors, and official brand destination offices from different tourist destinations and analysed the opinions and the emotions shared in these tweets.
Carter, David. "Inferring Aspect-Specific Opinion Structure in Product Reviews". Thesis, Université d'Ottawa / University of Ottawa, 2015. http://hdl.handle.net/10393/32177.
Texto completo da fonteCOREA, FRANCESCO. "Essays on machine learning for economics and finance". Doctoral thesis, Luiss Guido Carli, 2017. http://hdl.handle.net/11385/201135.
Texto completo da fonteElena, Podasca. "Predicting the Movement Direction of OMXS30 Stock Index Using XGBoost and Sentiment Analysis". Thesis, Blekinge Tekniska Högskola, Institutionen för datavetenskap, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:bth-21119.
Texto completo da fonteSchulder, Marc [Verfasser], e Dietrich [Akademischer Betreuer] Klakow. "Sentiment polarity shifters : creating lexical resources through manual annotation and bootstrapped machine learning / Marc Schulder ; Betreuer: Dietrich Klakow". Saarbrücken : Saarländische Universitäts- und Landesbibliothek, 2019. http://d-nb.info/1199932906/34.
Texto completo da fonteJamil, Zunaira. "Monitoring Tweets for Depression to Detect At-Risk Users". Thesis, Université d'Ottawa / University of Ottawa, 2017. http://hdl.handle.net/10393/36030.
Texto completo da fonteTempfli, Peter. "Preprocessing method comparison and model tuning for natural language data". Thesis, Högskolan Dalarna, Mikrodataanalys, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:du-34438.
Texto completo da fonteSmith, Anri. "Comparison of sovereign risk and its determinants". Master's thesis, Faculty of Science, 2019. http://hdl.handle.net/11427/31119.
Texto completo da fonteAbdullah, Siti Norbaiti binti. "Machine learning approach for crude oil price prediction". Thesis, University of Manchester, 2014. https://www.research.manchester.ac.uk/portal/en/theses/machine-learning-approach-for-crude-oil-price-prediction(949fa2d5-1a4d-416a-8e7c-dd66da95398e).html.
Texto completo da fonteSommar, Fredrik, e Milosz Wielondek. "Combining Lexicon- and Learning-based Approaches for Improved Performance and Convenience in Sentiment Classification". Thesis, KTH, Skolan för datavetenskap och kommunikation (CSC), 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-166430.
Texto completo da fonteAtt klassificera text i kategorier baserat på känslan de uttrycker är ett aktuellt område idag och kan tillämpas inom många industrier. Rapporten undersöker en kombination av de två framstående tillvägagångssätten till denna typ av klassificering baserade på ett lexikon med definerade ordvikter respektive maskininlärning. Denna hybridlösning jämförs mot de två andra tillvägagångssätten för att framlägga deras relativa styrkor och svagheter. På ett dataset med filmrecensioner från IMDb får maskininlärningsklassificeraren bäst resultat, följt av hybridlösningen och sist den lexikonbaserade lösningen. Trots det kan hybridlösningen vara att föredra i situationer där det är ogenomförbart eller oskäligt att förbereda träningsdata för maskininlärningsklassificeraren, dock med ett visst avkall på prestanda.
Mao, Yi. "Domain knowledge, uncertainty, and parameter constraints". Diss., Georgia Institute of Technology, 2010. http://hdl.handle.net/1853/37295.
Texto completo da fonteSundström, Johan. "Sentiment analysis of Swedish reviews and transfer learning using Convolutional Neural Networks". Thesis, Uppsala universitet, Avdelningen för systemteknik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-339066.
Texto completo da fonteBarakat, Serena, e Mahesh Chathuranga. "Improving Hashtag Recommendation for Instagram Images by Considering Hashtag Relativity and Sentiment". Thesis, Högskolan Dalarna, Mikrodataanalys, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:du-29455.
Texto completo da fonteHolmqvist, Carl. "Opinion analysis of microblogs for stock market prediction". Thesis, KTH, Teoretisk datalogi, TCS, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-233197.
Texto completo da fonteDetta examensarbete undersöker om ett företags aktievärdesutveckling kan förutspås genom att använda sig av den generella opinionen hos tweets skrivna om företaget. Examensarbetet utgår ifrån en model från ett tidigare projekt och försöker förbättra resultaten från denna genom att använda sig av dels state-of-the-art sentimentanalys med neurala nätverk, dels mer tweet data. Examensarbetet undersöker både prognoser timvis samt dygnsvis för att undersöka metoden djupare. Resultaten tyder på en minskad träffsäkerhet jämfört med det tidigare projektet. Resultaten indikerar också att sentimentanalys med neurala nätverk förbättrar träffsäkerheten hos aktievärdesprognosen jämfört med tidigare sentimentanalysmetod givet jämförbara förutsättningar.
Nhlabano, Valentine Velaphi. "Fast Data Analysis Methods For Social Media Data". Diss., University of Pretoria, 2018. http://hdl.handle.net/2263/72546.
Texto completo da fonteDissertation (MSc)--University of Pretoria, 2019.
National Research Foundation (NRF) - Scarce skills
Computer Science
MSc
Unrestricted
Hernández, Martínez Víctor Alejandro. "Identificación de la presencia de ironía en el texto generado por usuarios de Twitter utilizando técnicas de Opinion Mining y Machine Learning". Tesis, Universidad de Chile, 2015. http://repositorio.uchile.cl/handle/2250/134793.
Texto completo da fonteEl siguiente trabajo tiene como objetivo general dise~nar e implementar un módulo clasificador de texto que permita identificar la presencia de ironía en el contenido generado por usuarios de Twitter, mediante el uso de herramientas asociadas a Opinion Mining y Machine Learning. La ironía es un fenómeno que forma parte del contenido generado por las personas en la Web, y representa un campo de estudio nuevo que ha atraído la atención de algunos investigadores del área de Opinion Mining debido a su complejidad y al impacto que puede tener en el desempeño de las aplicaciones de Análisis de Sentimientos actuales. Este trabajo de título se desarrolla dentro del marco de OpinionZoom, proyecto CORFO código 13IDL2-23170 titulado "OpinionZoom: Plataforma de análisis de sentimientos e ironía a partir de la información textual en redes sociales para la caracterización de la demanda de productos y servicios" desarrollado en el Web Intelligence Centre del Departamento de Ingeniería Industrial de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, el cual busca generar un sistema avanzado para analizar datos extraídos desde redes sociales para obtener información relevante para las empresas en relación a sus productos y servicios. La hipótesis de investigación de este trabajo dice que es posible detectar la presencia de ironía en texto en idioma Español con cierto nivel de precisión, utilizando una adaptación de la metodología propuesta por Reyes et al. (2013) en [5] la cual involucra la construcción de un corpus en función de la estructura de Twitter junto con la capacidad de las personas para detectar ironía. El modelo utilizado se compone de 11 atributos entre los cuales se rescatan características sintácticas, semánticas y emocionales o psicológicas, con el objetivo de poder describir ironía en texto. Para esto, se genera un corpus de casos irónicos y no irónicos a partir de una selección semiautomática utilizando una serie de hashtags en Twitter, para luego validar su etiquetado utilizando evaluadores humanos. Además, esto se complementa con la inclusión de textos objetivos como parte del set de casos no irónicos. Luego, utilizando este corpus, se pretende realizar el entrenamiento de un algoritmo de aprendizaje supervisado para realizar la posterior clasificación de texto. Para ésto, se implementa un módulo de extracción de atributos que transforma cada texto en un vector representativo de los atributo. Finalmente, se utilizan los vectores obtenidos para implementar un módulo clasificador de texto, el cual permite realizar una clasificación entre tipos irónicos y no irónicos de texto. Para probar su desempe~no, se realizan dos pruebas. La primera utiliza como casos no irónicos los textos objetivos y la segunda utiliza como casos no irónicos aquellos textos evaluados por personas como tales. La primera obtuvo un alto nivel de precisión, mientras que la segunda fue insuficiente. En base a los resultados se concluye que esta implementación no es una solución absoluta. Existen algunas limitaciones asociadas a la construcción del corpus, las herramientas utilizadas e incluso el modelo, sin embargo, los resultados muestran que bajo ciertos escenarios de comparación, es posible detectar ironía en texto por lo que se cumple la hipótesis. Se sugiere ampliar la investigación, mejorar la obtención del corpus, utilizar herramientas más desarrolladas y analizar aquellos elementos que el modelo no puede capturar.
Liaghat, Zeinab. "Quality-efficiency trade-offs in machine learning applied to text processing". Doctoral thesis, Universitat Pompeu Fabra, 2017. http://hdl.handle.net/10803/402575.
Texto completo da fonteAvui en dia, la quantitat de documents digitals disponibles està creixent ràpidament, expandint- se a un ritme considerable i procedint de diverses fonts. Les fonts d’informació no estructurada i semiestructurada inclouen la World Wide Web, articles de notícies, bases de dades biològiques, correus electrònics, biblioteques digitals, repositoris electrònics governamentals, , sales de xat, forums en línia, blogs i mitjans socials com Facebook, Instagram, LinkedIn, Pinterest, Twitter, YouTube i molts d’altres. Extreure’n informació d’aquests recursos i trobar informació útil d’aquestes col.leccions s’ha convertit en un desafiament que fa que l’organització d’aquesta enorme quantitat de dades esdevingui una necessitat. La mineria de dades, l’aprenentatge automàtic i el processament del llenguatge natural són tècniques poderoses que poden utilitzar-se conjuntament per fer front a aquest gran desafiament. Segons la tasca o el problema en qüestió existeixen molts emfo- caments diferents que es poden utilitzar. Els mètodes que s’estan implementant s’optimitzen continuament, però aquests mètodes d’aprenentatge automàtic supervisats han estat provats i comparats amb grans dades d’entrenament. La pregunta és : Què passa amb la qualitat dels mètodes si incrementem les dades de 100 MB a 1 GB? Més encara: Les millores en la qualitat valen la pena quan la taxa de processament de les dades minva? Podem canviar qualitat per eficiència, tot recuperant la perdua de qualitat quan processem més dades? Aquesta tesi és una primera aproximació per resoldre aquestes preguntes de forma gene- ral per a tasques de processament de text, ja que no hi ha hagut suficient investigació per a comparar aquests mètodes considerant el balanç entre el tamany de les dades, la qualitat dels resultats i el temps de processament. Per tant, proposem un marc per analitzar aquest balanç i l’apliquem a tres problemes importants de processament de text: Reconeixement d’Entitats Anomenades, Anàlisi de Sentiments i Classificació de Documents. Aquests problemes tam- bé han estat seleccionats perquè tenen nivells diferents de granularitat: paraules, opinions i documents complerts. Per a cada problema seleccionem diferents algoritmes d’aprenentatge automàtic i avaluem el balanç entre aquestes variables per als diferents algoritmes en grans conjunts de dades públiques ( notícies, opinions, patents). Utilitzem subconjunts de diferents tamanys entre 50 MB i alguns GB per a explorar aquests balanç. Per acabar, com havíem suposat, no perquè un algoritme és eficient en poques dades serà eficient en grans quantitats de dades. Per als dos últims problemes considerem algoritmes similars i també dos conjunts diferents de dades i tècniques d’avaluació per a estudiar l’impacte d’aquests dos paràmetres en els resultats. Mostrem que els resultats no canvien significativament amb aquests canvis.
Hoy en día, la cantidad de documentos digitales disponibles está creciendo rápidamente, ex- pandiéndose a un ritmo considerable y procediendo de una variedad de fuentes. Estas fuentes de información no estructurada y semi estructurada incluyen la World Wide Web, artículos de noticias, bases de datos biológicos, correos electrónicos, bibliotecas digitales, repositorios electrónicos gubernamentales, salas de chat, foros en línea, blogs y medios sociales como Fa- cebook, Instagram, LinkedIn, Pinterest, Twitter, YouTube, además de muchos otros. Extraer información de estos recursos y encontrar información útil de tales colecciones se ha convertido en un desafío que hace que la organización de esa enorme cantidad de datos sea una necesidad. La minería de datos, el aprendizaje automático y el procesamiento del lenguaje natural son técnicas poderosas que pueden utilizarse conjuntamente para hacer frente a este gran desafío. Dependiendo de la tarea o el problema en cuestión, hay muchos enfoques dife- rentes que se pueden utilizar. Los métodos que se están implementando se están optimizando continuamente, pero estos métodos de aprendizaje automático supervisados han sido probados y comparados con datos de entrenamiento grandes. La pregunta es ¿Qué pasa con la calidad de los métodos si incrementamos los datos de 100 MB a 1GB? Más aún, ¿las mejoras en la cali- dad valen la pena cuando la tasa de procesamiento de los datos disminuye? ¿Podemos cambiar calidad por eficiencia, recuperando la perdida de calidad cuando procesamos más datos? Esta tesis es una primera aproximación para resolver estas preguntas de forma general para tareas de procesamiento de texto, ya que no ha habido investigación suficiente para comparar estos métodos considerando el balance entre el tamaño de los datos, la calidad de los resultados y el tiempo de procesamiento. Por lo tanto, proponemos un marco para analizar este balance y lo aplicamos a tres importantes problemas de procesamiento de texto: Reconocimiento de En- tidades Nombradas, Análisis de Sentimientos y Clasificación de Documentos. Estos problemas fueron seleccionados también porque tienen distintos niveles de granularidad: palabras, opinio- nes y documentos completos. Para cada problema seleccionamos distintos algoritmos de apren- dizaje automático y evaluamos el balance entre estas variables para los distintos algoritmos en grandes conjuntos de datos públicos (noticias, opiniones, patentes). Usamos subconjuntos de distinto tamaño entre 50 MB y varios GB para explorar este balance. Para concluir, como ha- bíamos supuesto, no porque un algoritmo es eficiente en pocos datos será eficiente en grandes cantidades de datos. Para los dos últimos problemas consideramos algoritmos similares y tam- bién dos conjuntos distintos de datos y técnicas de evaluación, para estudiar el impacto de estos dos parámetros en los resultados. Mostramos que los resultados no cambian significativamente con estos cambios.