Name: | Description: | Size: | Format: | |
---|---|---|---|---|
17.02 MB | Adobe PDF |
Authors
Abstract(s)
Over the years, high school dropout, college dropout, in particular, has always been a hot
topic. With the advancement of technology and Artificial Intelligence and Machine Learning, we necessarily have to think of ways to help mitigate this problem. If there are factors
that we cannot control, such as the economic ones, there are others where our actions can
be directed. One factor that allows us to evaluate the risk of dropping out of school is student attendance. Although this data can be manually analyzed to make these detections,
it would be more efficient to have a capable system of recording this attendance, since the
human capacity to analyze data is finite, and often can only infer this situation too late. Of
course, a system that only registers attendance will not give a definitive answer, but it will
be an essential first step. Thus, a system that can reconcile the detection of a subject and
his face while being able to constantly monitor where the subject is, always to be able to
identify him even if he moves from one place to another, together with facial recognition,
seem to be determining factors to bring a system of this calibre to a successful conclusion.
This type of system is generally very much related to the quality of the data and its annotations, so it is vital to collect or obtain quality data to help solve the various problems
presented.
Considering what has been described, the main goal of this dissertation is to try to start
solving the problem of school dropout, namely through the study, validation and testing of
several stateoftheart methods in the area of object detection, namely people and faces,
but also tracking. The same work will have to be done on face recognition methods, being able to indicate the best stateoftheart methods for each task. As mentioned in the
previous paragraph, a significant limitation to this type of task is the data quality since it
is not always possible to find a set that perfectly fits our context. Thus, to solve this gap,
we will also present a dataset with about 40,000 images, thoroughly annotated frame by
frame and that we believe to be an asset in solving this problem. In addition to the above,
and in order not only to give a more meaningful and targeted response to our detailed
data but also to provide a preliminary view of how one of the system’s tasks might work,
we will present two experiments with our data in the area of detection. The first will involve finetuning our data, while the second will involve training it from scratch and then
presenting its results as proof of the correct choice of the stateoftheart method.
Ao longo dos anos, o abandono escolar, o universitário em particular, tem sido sempre um tema em grande destaque. Com o avanço de várias áreas tecnológicas, assim como da Inteligência Artificial e da Aprendizagem Automática temos necessariamente de pensar em maneiras de ajudar a mitigar este problema. Se há fatores que não podemos controlar, como os económicos, há outros onde a nossa ação pode ser dirigida. Um dos fatores que permite avaliar o risco de abandono escolar é a assiduidade dos estudantes. Embora, naturalmente, estes dados possam ser analisados manualmente para fazer estas deteções, seria mais eficiente ter um sistema que fosse capaz de registar esta assiduidade, uma vez que a capacidade humana para os analisar é finita e muitas vezes apenas consegue inferir esta situação demasiado tarde. Naturalmente que um sistema que registe apenas assiduidade não irá ser capaz de dar uma resposta definitiva, mas será um primeiro passe importante. Deste modo, um sistema que seja capaz de conciliar a deteção de uma pessoa e da sua face enquanto é capaz de monitorizar de forma constante o sítio onde a pessoa está, para ser sempre capaz de a identificar mesmo que mude de sítio em conjunto com o seu reconhecimento facial, parecem ser fatores determinantes para levar a bom porto um sistema deste calibre. Este tipo de sistemas está, geralmente, muito relacionado com a qualidade dos dados e das suas anotações, pelo que é extraordinariamente importante ser capaz de recolher ou obter dados de qualidade que auxiliem na resolução dos diversos problemas apresentados. Tendo em atenção aquilo que foi sendo descrito, o principal objetivo desta dissertação passa por tentar dar início à resolução do problema do abandono escolar, nomeadamente através do estudo, validação e teste de diversos métodos estadodaarte no que diz respeito à área da deteção de objetos, nomeadamente de pessoas e faces, mas também de tracking. O mesmo trabalho terá de ser realizado nos métodos de reconhecimento facial, sendo capaz no final de poder indicar os melhores métodos estadodaarte de cada tarefa. Como referido no parágrafo anterior, uma limitação grande a este tipo de tarefas é a respetiva qualidade dos dados, visto que nem sempre e possível encontrar um conjunto que se adeque perfeitamente ao nosso contexto. Assim, de modo a solucionar esta lacuna iremos também apresentar um dataset com cerca de 40,000 imagens, completamente anotado frame a frame e que acreditamos ser uma mais valia na resolução deste problema. Para além do referido, e de modo não só a dar uma resposta mais significativa e dirigida aos nossos dados em particular, mas também para que seja possível ter uma visão preliminar daquilo que poderá ser o funcionamento de uma das tarefas do sistema, iremos apresentar duas experiências com os nossos dados, na área da deteção. A primeira irá envolver o finetuning dos nossos dados, enquanto que a segunda levará a um treino iniciado de raiz, apresentando depois os seus resultados como uma prova da escolha acertada do método de estado da arte.
Ao longo dos anos, o abandono escolar, o universitário em particular, tem sido sempre um tema em grande destaque. Com o avanço de várias áreas tecnológicas, assim como da Inteligência Artificial e da Aprendizagem Automática temos necessariamente de pensar em maneiras de ajudar a mitigar este problema. Se há fatores que não podemos controlar, como os económicos, há outros onde a nossa ação pode ser dirigida. Um dos fatores que permite avaliar o risco de abandono escolar é a assiduidade dos estudantes. Embora, naturalmente, estes dados possam ser analisados manualmente para fazer estas deteções, seria mais eficiente ter um sistema que fosse capaz de registar esta assiduidade, uma vez que a capacidade humana para os analisar é finita e muitas vezes apenas consegue inferir esta situação demasiado tarde. Naturalmente que um sistema que registe apenas assiduidade não irá ser capaz de dar uma resposta definitiva, mas será um primeiro passe importante. Deste modo, um sistema que seja capaz de conciliar a deteção de uma pessoa e da sua face enquanto é capaz de monitorizar de forma constante o sítio onde a pessoa está, para ser sempre capaz de a identificar mesmo que mude de sítio em conjunto com o seu reconhecimento facial, parecem ser fatores determinantes para levar a bom porto um sistema deste calibre. Este tipo de sistemas está, geralmente, muito relacionado com a qualidade dos dados e das suas anotações, pelo que é extraordinariamente importante ser capaz de recolher ou obter dados de qualidade que auxiliem na resolução dos diversos problemas apresentados. Tendo em atenção aquilo que foi sendo descrito, o principal objetivo desta dissertação passa por tentar dar início à resolução do problema do abandono escolar, nomeadamente através do estudo, validação e teste de diversos métodos estadodaarte no que diz respeito à área da deteção de objetos, nomeadamente de pessoas e faces, mas também de tracking. O mesmo trabalho terá de ser realizado nos métodos de reconhecimento facial, sendo capaz no final de poder indicar os melhores métodos estadodaarte de cada tarefa. Como referido no parágrafo anterior, uma limitação grande a este tipo de tarefas é a respetiva qualidade dos dados, visto que nem sempre e possível encontrar um conjunto que se adeque perfeitamente ao nosso contexto. Assim, de modo a solucionar esta lacuna iremos também apresentar um dataset com cerca de 40,000 imagens, completamente anotado frame a frame e que acreditamos ser uma mais valia na resolução deste problema. Para além do referido, e de modo não só a dar uma resposta mais significativa e dirigida aos nossos dados em particular, mas também para que seja possível ter uma visão preliminar daquilo que poderá ser o funcionamento de uma das tarefas do sistema, iremos apresentar duas experiências com os nossos dados, na área da deteção. A primeira irá envolver o finetuning dos nossos dados, enquanto que a segunda levará a um treino iniciado de raiz, apresentando depois os seus resultados como uma prova da escolha acertada do método de estado da arte.
Description
Keywords
Análise de Imagens de Vídeo Aprendizagem Automática Biometria Deteção de Faces Deteção de Pessoas Inteligência Artificial Reconhecimento Facial Tracking Visão Computacional