Extracting speech text from comics

Inácio, Pedro Daniel Clemente Rodrigues

Publicação

Extracting speech text from comics

2016-11-9Dissertação de mestrado

datacite.subject.fos	Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática	por
dc.contributor.advisor	Gomes, Abel João Padrão
dc.contributor.author	Inácio, Pedro Daniel Clemente Rodrigues
dc.date.accessioned	2019-12-11T16:51:37Z
dc.date.available	2019-12-11T16:51:37Z
dc.date.issued	2016-11-9
dc.date.submitted	2016-10-7
dc.description.abstract	Overall, it has been challenging to find solutions able to correctly extract distinct types of text balloons from any sort of comics, but in particulary from complex comic books. The challenge comes from the fact that there is no general extraction algorithm in the literature capable of handling any text balloons without making any assumption regarding color depth of the image, orientation or language of the text. Even worse, it is the fact that the comics art evolves over time, so that there is some degree of unpredictability associated to comics. This means that, an algorithm may work well for comic books released twenty years ago, but not so well for current comic books, even considering they belong to the same category or series. With this dissertation it is intended to present a possible solution to this problem, by introducing an algorithm capable of extracting text balloons from comic book pages. The presented algorithm, here called CCD (components and corners detection), relies in the concept of corner detection to identify text snippets inside balloon candidates. So, after discarding a significant number of regions that are not considered as tentative text balloons for one reason or another, we look at the shape of the holes of the remaining regions to check if they still hold a significant number of corners capable to make a candidate be classified as text balloon.	eng
dc.description.abstract	No geral, tem sido desafiante encontrar soluções capazes de extrair correctamente distintos tipos de balões de texto a partir de qualquer tipo de banda desenhada, mas particularmente da mais complexa. O desafio provém do facto de que não existe na literatura um algoritmo capaz de lidar com quaisquer balões de texto sem fazer qualquer suposição em relação à profundidade de cor da imagem, orientação ou linguagem do texto. Pior ainda, é o facto de que a arte da banda desenhada evolui ao longo do tempo, o que faz com que exista um certo grau de imprevisibilidade associado aos livros. Isto significa que, um algoritmo pode funcionar bem para livros de banda desenhada lançados há vinte anos atrás, mas não tão bem para livros mais actuais, mesmo considerando que eles pertencem à mesma categoria ou série. Com esta dissertação pretende-se apresentar uma possível solução para este problema, ao introduzir um algoritmo capaz de extrair balões de texto de páginas de banda desenhada. O algoritmo apresentado, aqui designado por CCD (components and corners detection), baseia-se no conceito de detecção de cantos para identificar trechos de texto dentro de componentes candidatos a balão. Assim sendo, depois de descartar um número significativo de regiões que não são consideradas balões de texto por um ou outro motivo, olhamos para a forma dos buracos das restantes regiões para verificar se ainda possuem um número significativo de cantos que seja capaz de fazer com que um candidato seja classificado como balão de texto.	por
dc.identifier.tid	202330613
dc.identifier.uri	http://hdl.handle.net/10400.6/7725
dc.language.iso	eng	por
dc.subject	Análise de Componentes Ligados	por
dc.subject	Análise de Contornos	por
dc.subject	Detecção de Arestas	por
dc.subject	Detecção de Cantos	por
dc.subject	Extracção de Balões de Texto	por
dc.subject	Extracção de Texto	por
dc.subject	Livros de Banda Desenhada	por
dc.title	Extracting speech text from comics	por
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	por
rcaap.type	masterThesis	por
thesis.degree.name	2º Ciclo em Engenharia Informática	por

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: 5076_10010.pdf
Tamanho:: 11.65 MB
Formato:: Adobe Portable Document Format

Ver/Abrir

Coleções

FE - DI | Dissertações de Mestrado e Teses de Doutoramento