Neves, João Carlos RaposoProença, Hugo Pedro Martins CarriçoPaulo, Diogo José dos Santos2025-10-292025-10-292025-07-102025-06-11http://hdl.handle.net/10400.6/19033Urban waste management faces growing challenges due to population growth and improper disposal practices, which often lead to overflowing bins and the presence of parasitic waste in public areas. This dissertation proposes an intelligent system for the automatic detection and segmentation of overflowing waste using advanced computer vision techniques. A custom dataset comprising over 7,200 annotated images was collected using fisheye cameras mounted on moving vehicles in real urban environments. Several state-of-the-art segmentation models, such as YOLOv11, YOLACT, and others, were evaluated in terms of precision, recall, and mean average precision (area under the precision-recall curve). To overcome the limitations of traditional RGB-based methods, a novel approach is introduced that combines RGB images with estimated depth and normal surface maps generated from a single RGB image. The interaction of geometric information with the model provides a fusion of information that enhances the model’s ability to distinguish between real waste and background clutter. The proposed system significantly improves segmentation accuracy, achieving up to 47% mAP gains over baseline methods. The results highlight the potential of this approach for real-time urban waste monitoring and contribute a novel dataset and methodology to the field.Atualmente, a gestão eficaz de resíduos domésticos apresenta muitos desafios, incluindo situações de transbordo de resíduos em contentores e a acumulação de resíduos à volta dos mesmos. Esta dissertação oferece um sistema inteligente que deteta e segmenta de forma automática os resíduos em situações de transbordo, utilizando técnicas de visão computacional. Para isto, foi criado um conjunto de dados personalizado com mais de 7.200 imagens anotadas, capturadas em ambientes urbanos reais, por câmaras fisheye montadas em veículos em movimento. Modelos de segmentação de imagem de estado da arte, como o YOLOv11 e YOLACT, foram usados e as métricas utilizadas para avaliar estes foram a precisão, o recall e a área sob a curva precisão-recall. O método proposto para superar os métodos tradicionais e limitados ao uso de imagens RGB é uma abordagem que integra a estimativa de mapas de profundidade e normais a partir de uma única imagem RGB. A interação de informações geométricas com o modelo oferece uma fusão de informações que permite aumentar o desempenho do modelo, distinguindo o foreground do background. Este método chega a conseguir ganhos de até 47% em relação a métodos usados como referência, o que demonstra o seu potencial para aplicações em tempo real de monitorização de resíduos urbanos.engEstimativa de ProfundidadeEstimativa de Superfícies NormaisGestão de Resíduos UrbanosSegmentação de ObjetosVisão ComputacionalDetection of Overflowing Waste and Litter near Trash Binsmaster thesis204026750