| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 11.65 MB | Adobe PDF |
Advisor(s)
Abstract(s)
Overall, it has been challenging to find solutions able to correctly extract distinct types
of text balloons from any sort of comics, but in particulary from complex comic books.
The challenge comes from the fact that there is no general extraction algorithm in
the literature capable of handling any text balloons without making any assumption
regarding color depth of the image, orientation or language of the text. Even worse,
it is the fact that the comics art evolves over time, so that there is some degree of
unpredictability associated to comics. This means that, an algorithm may work well for
comic books released twenty years ago, but not so well for current comic books, even
considering they belong to the same category or series.
With this dissertation it is intended to present a possible solution to this problem, by
introducing an algorithm capable of extracting text balloons from comic book pages.
The presented algorithm, here called CCD (components and corners detection), relies in
the concept of corner detection to identify text snippets inside balloon candidates. So,
after discarding a significant number of regions that are not considered as tentative text
balloons for one reason or another, we look at the shape of the holes of the remaining
regions to check if they still hold a significant number of corners capable to make a
candidate be classified as text balloon.
No geral, tem sido desafiante encontrar soluções capazes de extrair correctamente distintos tipos de balões de texto a partir de qualquer tipo de banda desenhada, mas particularmente da mais complexa. O desafio provém do facto de que não existe na literatura um algoritmo capaz de lidar com quaisquer balões de texto sem fazer qualquer suposição em relação à profundidade de cor da imagem, orientação ou linguagem do texto. Pior ainda, é o facto de que a arte da banda desenhada evolui ao longo do tempo, o que faz com que exista um certo grau de imprevisibilidade associado aos livros. Isto significa que, um algoritmo pode funcionar bem para livros de banda desenhada lançados há vinte anos atrás, mas não tão bem para livros mais actuais, mesmo considerando que eles pertencem à mesma categoria ou série. Com esta dissertação pretende-se apresentar uma possível solução para este problema, ao introduzir um algoritmo capaz de extrair balões de texto de páginas de banda desenhada. O algoritmo apresentado, aqui designado por CCD (components and corners detection), baseia-se no conceito de detecção de cantos para identificar trechos de texto dentro de componentes candidatos a balão. Assim sendo, depois de descartar um número significativo de regiões que não são consideradas balões de texto por um ou outro motivo, olhamos para a forma dos buracos das restantes regiões para verificar se ainda possuem um número significativo de cantos que seja capaz de fazer com que um candidato seja classificado como balão de texto.
No geral, tem sido desafiante encontrar soluções capazes de extrair correctamente distintos tipos de balões de texto a partir de qualquer tipo de banda desenhada, mas particularmente da mais complexa. O desafio provém do facto de que não existe na literatura um algoritmo capaz de lidar com quaisquer balões de texto sem fazer qualquer suposição em relação à profundidade de cor da imagem, orientação ou linguagem do texto. Pior ainda, é o facto de que a arte da banda desenhada evolui ao longo do tempo, o que faz com que exista um certo grau de imprevisibilidade associado aos livros. Isto significa que, um algoritmo pode funcionar bem para livros de banda desenhada lançados há vinte anos atrás, mas não tão bem para livros mais actuais, mesmo considerando que eles pertencem à mesma categoria ou série. Com esta dissertação pretende-se apresentar uma possível solução para este problema, ao introduzir um algoritmo capaz de extrair balões de texto de páginas de banda desenhada. O algoritmo apresentado, aqui designado por CCD (components and corners detection), baseia-se no conceito de detecção de cantos para identificar trechos de texto dentro de componentes candidatos a balão. Assim sendo, depois de descartar um número significativo de regiões que não são consideradas balões de texto por um ou outro motivo, olhamos para a forma dos buracos das restantes regiões para verificar se ainda possuem um número significativo de cantos que seja capaz de fazer com que um candidato seja classificado como balão de texto.
Description
Keywords
Análise de Componentes Ligados Análise de Contornos Detecção de Arestas Detecção de Cantos Extracção de Balões de Texto Extracção de Texto Livros de Banda Desenhada
