Gouveia, João José TelesSousa, Maria Paula Prata deCruz, Fernando José Silva Salcedas2025-10-292025-10-292025-06-272025-06-11http://hdl.handle.net/10400.6/19036Este documento descreve o trabalho desenvolvido durante o estágio curricular realizado na empresa Latitudde, com início a 11 de novembro de 2024 e término a 30 de maio de 2025. O estágio consistiu no desenvolvimento de uma solução de automação de processos, com foco na extração de dados de plataformas de concursos públicos e dos respetivos documentos associados. O objetivo principal do estágio foi a exploração de possíveis soluções e a implementação de uma abordagem para o problema descrito, recorrendo a formações técnicas em web scraping, assim como à exploração de estratégias para a extração de dados em documentos. Para atingir estes objetivos, foi utilizado o Robot Framework para desenvolver um script de web scraping, uma tecnologia abordada nas formações técnicas que o estagiário realizou no primeiro mês de estágio. Foi também experimentada uma solução com regex para extrair informações dos documentos, tendo sido mais tarde utilizada uma abordagem com recurso à IA. Para este projeto, foi ainda desenvolvida uma aplicação web com Laravel para a visualização dos dados recolhidos, contudo, esta aplicação não foi desenvolvida pelo estagiário, tendo apenas colaborado na correção de bugs. Os vários componentes da solução desenvolvida foram colocados em containers para serem utilizados na infraestrutura da empresa. Durante o desenvolvimento deste projeto foi ainda utilizada a metodologia Scrum. A solução desenvolvida apresentou resultados promissores, com a extração de dados para uma das plataformas realizada com sucesso, e para a outra com resultados menos consistentes. A extração de dados com recurso à IA, mais concretamente através de um assistente da Assistants API da OpenAI, apresentou bons resultados, mais positivos do que os obtidos com regex. Em suma, a implementação final permitiu automatizar uma tarefa rotineira, que anteriormente exigia várias horas para ser concluída. Desta forma, é possível melhorar a produtividade da empresa, mantendo a motivação dos seus colaboradores mais elevada. Embora nem todas as etapas tenham sido concluídas a 100%, estas encontram-se praticamente finalizadas, destacando-se apenas as dificuldades com CAPTCHA numa das plataformas e a falta de um domínio para a publicação da página web. A automação desta tarefa representa apenas o início, existindo potencial para expandir a solução e automatizar outras tarefas com impacto semelhante na produtividade da empresa.This document describes the work carried out during the curricular internship at Latitudde, which started on November 11, 2024, and ended on May 30, 2025. The internship consisted in the development of a process automation solution, focusing on the extraction of data from public procurement platforms and their associated documents. The main objective of the internship was to explore possible solutions and implement an approach to the identified problem, including technical training in web scraping as well as the exploration of strategies for document data extraction. To achieve these goals, Robot Framework was used to develop a web scraping script, a technology covered in the technical courses completed by the intern during the first month of the internship. A solution using regex was also tested for extracting information from documents, but was later replaced by an approach based on AI. Additionally, a web application in Laravel was developed to visualize the extracted data, however, this application was not implemented by the intern, who contributed only to bug fixing. All components of the developed solution were containerized to run within the company’s infrastructure. The Scrum methodology was adopted throughout the project to manage tasks and development cycles. The developed solution showed promising results, with successful data extraction from one of the platforms, while the other yielded less consistent results. Data extraction using Artificial Intelligence, specifically through an assistant from OpenAI’s Assistants API, produced better outcomes than those achieved with regex. In summary, the final implementation enabled the automation of a previously time-consuming and repetitive task. As a result, the company can increase productivity while maintaining employee motivation. Although not all stages were completed in full, most were finalized, with only a few remaining limitations, namely, issues with CAPTCHA on one of the platforms and the absence of a domain for publishing the web page. This automation marks only the beginning, with clear potential to extend the solution to other tasks that could similarly enhance the company’s operational efficiency.porAutomação de TarefasExtração de Dados em Documen- TosInteligência ArtificialRobot FrameworkWeb ScrapingProcura e Extração de Dados Automatizada de Concursos Públicos e Respetivos Documentosmaster thesis204026792