Repository logo
 
Loading...
Thumbnail Image
Publication

Massive Text Data Visualization

Use this identifier to reference this record.
Name:Description:Size:Format: 
10798_25766.pdf8.47 MBAdobe PDF Download

Abstract(s)

This thesis focuses on the development of a specialized solution for the visualization of textual data. With the increasing volume of unstructured text in various fields of research, there is a growing need for effective tools that help users analyze and visualize such data. The primary objective of this research is twofold: first, to investigate the needs and challenges faced by researchers working with text data, and second, to design and implement a practical solution that meets those needs. The initial phase involves an extensive review of the literature, aiming to understand the current landscape of text data visualization, categorize researcher objectives, and identify the processes they follow. This research informs the selection of visualization types and the most suitable Python libraries to implement them. The final product is made accessible as both a Python package and an open-source repository on GitHub, providing a flexible tool that addresses the key challenges in text data visualization. This thesis not only contributes a functional tool for researchers but also highlights the importance of targeted solutions in handling and visualizing unstructured textual data.
Esta tese centra-se no desenvolvimento de uma solução especializada para a visualização de dados textuais. Com o aumento do volume de texto não estruturado em vários campos de investigação, há uma necessidade crescente de ferramentas eficazes que ajudem os utilizadores a analisar e visualizar esses dados. O objetivo principal desta investigação é duplo: em primeiro lugar, investigar as necessidades e os desafios enfrentados pelos investigadores que trabalham com dados de texto e, em segundo lugar, conceber e implementar uma solução prática que satisfaça essas necessidades. A fase inicial envolve uma extensa revisão da literatura, com o objetivo de compreender o panorama atual da visualização de dados de texto, categorizar os objectivos dos investigadores e identificar os processos que seguem. Esta pesquisa informa a seleção dos tipos de visualização e as bibliotecas Python mais adequadas para os implementar. O produto final é disponibilizado como um pacote Python e um repositório de código aberto no GitHub, fornecendo uma ferramenta flexível que aborda os principais desafios na visualização de dados de texto. Esta tese não só contribui com uma ferramenta funcional para os investigadores, como também destaca a importância de soluções direcionadas para o tratamento e visualização de dados textuais não estruturados.

Description

Keywords

Data Visualization Massive Text Data Word Cloud

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue