Repository logo
 
Publication

Redes Neuronais Espaciais e Temporais para a Compreensão de Vídeo em Sistemas Embebidos

datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informáticapor
dc.contributor.advisorAlexandre, Luis Filipe Barbosa de Almeida
dc.contributor.advisorNeves, João Carlos Raposo
dc.contributor.authorDuarte, Paulo Renato Borges
dc.date.accessioned2024-01-15T14:23:55Z
dc.date.available2024-01-15T14:23:55Z
dc.date.issued2023-07-11
dc.date.submitted2023-06-12
dc.description.abstractA deteção e classificação de ação humana em vídeo são, hoje em dia, tarefas de extrema importância da área de Visão Computacional. Tal importância é atribuída a estas tarefas devido à necessidade de detetar atividade criminosa ou situações de perigo, tornando possível a prevenção e a rápida intervenção no caso de ocorrências das mesmas. Um problema subjacente à utilização desta tecnologia é, precisamente, o elevado poder computacional que lhe está associado, seja a treinar as redes de Aprendizagem Profunda ou na própria inferência. Os dispositivos usados para desempenhar as funções dos sistemas de vigilância são, sobretudo, dispositivos de baixo poder computacional, devido principalmente a fatores como: o elevado custo das placas gráficas e a sua dimensão. É aqui que surgem os problemas que esta dissertação se propõe a tentar resolver. Em virtude da impossibilidade da fase de treino de um modelo ser realizada nos próprios dispositivos e, dado tal processo não ser indispensável, uma vez que esta fase pode ser efetuada em dispositivos com elevado poder computacional, torna-se necessário otimizar o modelo para que este possa ter o menor tempo de inferência e tamanho com a melhor taxa de acertos. Para tentar solucionar este problema, este projeto visa explorar diversas técnicas/métodos de otimização, tais como: fazer uso das camadas convolucionais separáveis, quantização, knowledge distillation, entre outros; assim como criar métodos ou algoritmos que possam ser adicionados ou substituam parte de uma rede.por
dc.description.abstractThe detection and classification of human action in video are, nowadays, extremely important tasks in the field of Computer Vision. Such importance is attributed to these tasks due to the need to detect criminal activity or dangerous situations, making prevention and quick intervention possible in the event of occurrences. A problem underlying the use of this technology is precisely the high computational power associated with it, whether training Deep Learning networks or inference itself. The devices used to carry out the functions of surveillance systems are, above all, devices with low computational power, mainly due to factors such as: the high cost of graphics cards and their size. It is here that the problems that this dissertation proposes to try to solve arise. Due to the impossibility of the training phase of a model being carried out on the devices themselves and, given that such a process is not essential, since this phase can be carried out on devices with high computational power, it becomes necessary to optimize the model so that it may have the shortest inference time and size with the best hit rate. To try to solve this problem, this project aims to explore several optimization techniques/methods, such as: making use of separable convolutional layers, quantization, knowledge distillation, among others; as well as creating methods or algorithms that can be added to or replace part of a network.eng
dc.identifier.tid203460499
dc.identifier.urihttp://hdl.handle.net/10400.6/14034
dc.language.isoporpor
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectClassificação em Vídeopor
dc.subjectDeteção de Objetospor
dc.subjectDispositivos de Baixo Poder Computacionalpor
dc.subjectOtimizaçãopor
dc.subjectRedes de Aprendizagem Profundapor
dc.subjectVisão Computacionalpor
dc.titleRedes Neuronais Espaciais e Temporais para a Compreensão de Vídeo em Sistemas Embebidospor
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspor
rcaap.typemasterThesispor
thesis.degree.name2º Ciclo em Engenharia Informáticapor

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
9859_21368
Size:
5.89 MB
Format:
Unknown data format