Browsing by Author "Rodrigues, Daniel Henriques"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Construção automática de um dicionário emocional para o portuguêsPublication . Rodrigues, Daniel Henriques; Dias, Gaël Harry Adélio AndréNos últimos anos tem-se ve rificado um crescente fluxo de conteúdos disponíveis e de fácil acesso na World Wide Web (Web), fazendo com que actualmente haja uma acumulação excessiva de textos de diversas naturezas. Apesar dos aspectos positivos que isto representa e do potencial que acarreta, surge uma nova problemática que consiste na necessidade de desenvolver ferramentas e metodologias capazes de tratar esses mesmos conteúdos ao nível das opiniões e/ou sentimentos neles evidenciados. A avaliação dos conteúdos Web não é uma tarefa fácil. As técnicas de avaliação dos conteúdos estão inseridos na área de análise de sentimento e muitos são os trabalhos sugeridos. Esta lese segue um rumo diferente, com ela pretende-se avaliar os conteúdos Web para a língua portuguesa europeia. O critério base adoptado é criar as bases para, no futuro, construir classificadores de sentimentos. Os léxicos emocionais servem de base a grande parte dos métodos que efectuam a análise de sentimento. Apesar de existir uma grande quantidade desses recursos disponíveis para a comunidade científica, depois de muita pesquisa, verificou-se que não existe um recurso semelhante para a língua portuguesa europeia. Com o interesse cada vez maior por parte das empresas ou indivíduos em obter informação sobre os produtos em tempo real a partir dos dados da Web, existe a necessidade de construir um léxico emocional para o português que possa ser utilizado para efectuar a análise de sentimento, para esta língua. Para colmatar esta falta, construiu-se automaticamente um léxico emocional para o português. Os métodos que efectuam a análise de sentimento utilizam léxicos construídos manualmente ou semiautomaticamente, surgindo o problema do acrescentar conhecimentos linguísticos aos léxicos, inerente ao modo como estes são construídos. Sendo a identificação dos sentimentos a chave do processo, é necessário saber que os sentimentos são sinónimo de subjectividade. O desafio colocado nesta dissertação é de construir automaticamente um léxico subjectivo para o português europeu, aplicando técnicas estatísticas. A base da construção do léxico são os corpora que vaã ser utilizados. Para efectuar este ˜ estudo é necessário um corpus subjectivo (constituído por textos dos blogues) e um corpus objectivo (constituído por textos do corpus jornalístico CETEMPublico). Os corpora foram escolhidos com base no estudo efectuado por Pais [21] na demonstração da similaridade entre um conjunto de blogues e um corpus jornalístico, relativamente a um corpus constituído por textos subjectivos e objectivos. Para identificar a subjectividade no texto utilizou-se a informação das categorias morfológicas (part-of-speech) das palavras simples e as palavras compostas (n-grams). Estes indícios de subjectividade foram extraídos com ferramentas que efectuam o processo automaticamente. Com este trabalho demonstrou-se que é possível construir um léxico de subjectividade para o português europeu, aplicando técnicas estatísticas e utilizando corpora não anotados manualmente e ferramentas para extrair automaticamente os indícios de subejctividade.