Abstract(s)
Traditional breast cancer diagnostic methods are heavily reliant on different medical imaging modalities. These imaging modalities, such as MG, MRI, US, and DBT, are used
in breast cancer screening, treatment planning, as well as tracking disease progression. However, the process of evaluating each diagnostic image and extract relevant information from it requires a trained and experienced professional. This can be very time consuming for the medical professional, and thwarts efforts of expanding breast cancer screening to areas with a deficit of medical staff, such as rural areas away from major metropolitan centers. With the rise of digital imaging methods, DICOM, and PACS systems, it has become possible to connect patients with medical staff that reside in a different location. […]
Os métodos tradicionais de diagnóstico do cancro de mama dependem fortemente de diferentes modalidades de imagens médicas. Essas modalidades de imagem, como MG, MRI, US e DBT, são usadas no rastreamento do cancro de mama, no planejamento do tratamento, bem como no rastreamento da progressão da doença. Porém, o processo de avaliar cada imagem diagnóstica e extrair dela informações relevantes requer um profissional treinado e experiente. Isto pode consumir muito tempo para o profissional médico e frustrar os esforços de expansão do rastreio do cancro da mama para áreas com défice de pessoal médico, como áreas rurais afastadas dos grandes centros metropolitanos. Com o surgimento dos métodos de imagem digital, dos sistemas DICOM e PACS, tornou-se possível conectar pacientes com equipes médicas que residem em um local diferente. Além disso, esses métodos de imagem digital são ideais para sistemas CAD, que têm o potencial de auxiliar a equipe médica e aumentar a eficiência e a eficácia do rastreamento do cancro de mama e do atendimento aos pacientes. Esta tese contribui para a tarefa de diagnóstico do cancro da mama através da utilização de sistemas CAD baseados em IA e centra-se em quatro aspectos principais: Detecção, segmentação, classificação do cancro da mama e o desenvolvimento e utilização destes sistemas CAD baseados em IA. Primeiro, realizamos uma revisão aprofundada da literatura sobre tarefas de detecção, segmentação e classificação do cancro de mama em todas as modalidades modernas de imagens médicas e destacamos os diferentes avanços, deficiências, conjuntos de dados existentes sobre cancro de mama e métricas de avaliação comum ente usadas. Estas três tarefas de diagnóstico do cancro da mama são desafiantes em muitos aspectos, mas uma questão recorrente observada na literatura são os dados de treino disponíveis, ou a falta deles. Tamanhos pequenos de conjuntos de dados podem levar a vários problemas, como variabilidade intraclasse insuficiente, especialmente considerando que os conjuntos de dados existentes contêm um número significativamente maior de imagens saudáveis em comparação com imagens com diferentes tipos de cancro de mama. Além disso, para reduzir o viés do modelo, é importante que o conjunto de dados contenha amostras com uma variedade de formatos, tamanhos e densidades de tecidos diferentes (fibrosos, glandulares, adiposos), bem como diferentes formatos, tamanhos e localizações de cancro de mama. tipos (massa, calcificações), classificação BIRADS, entre outros. Primeiramente fornecemos uma pesquisa aprofundada sobre a aprendizagem automática aplicada ao diagnóstico do cancro da mama, com ênfase nos conjuntos de dados disponíveis publicamente, nos métodos de pré-processamento utilizados no diagnóstico por imagem do cancro da mama, modelos atuais utilizados para a deteção, segmentação e classificação do cancro da mama, e as métricas utilizadas para avaliar estes modelos. Apresentamos todas as áreas e aspetos relevantes da aprendizagem automática aplicada ao diagnóstico do cancro da mama, onde cada método, conjunto de dados e técnica foi organizado com base nas diferentes tarefas que foram concebidas para resolver pelos seus respetivos autores. Destacamos ainda os fatores que diferenciam cada uma das técnicas revistas, bem como as suas deficiências. No final, fornecemos aos leitores um roteiro orientado de aprendizagem automática aplicado ao diagnóstico por imagem do cancro da mama, com foco na abordagem de cada uma das tarefas específicas de imagem do cancro da mama através das melhores abordagens de pre-processamento, métodos de melhor desempenho e métricas de avaliação adequadas. A seguir, abordamos o problema da insuficiência de dados de treinamento propondo um GAN capaz de gerar imagens realistas de cancro de mama que podem ser usadas para desenvolver ainda mais sistemas CAD de cancro de mama. Nosso GAN proposto usa modelos personalizados como entradas para definir diferentes formatos, tamanhos e densidades de tecido de mama, bem como formatos, tamanhos e localizações de massa de cancro de mama, entre outras características, preservando as informações originais do rótulo. Os dados de imagem sintetizados podem então ser usados para treinar outros modelos de aprendizagem de máquina para tarefas como detecção, segmentação ou classificação. Esta solução GAN proposta pode ser considerada como uma etapa de aumento de dados em um pipeline completo do sistema CAD e pode ser implementada juntamente com outras técnicas de aumento de dados para acrescentar ainda mais ao tamanho do conjunto de dados de treinamento. Para a tarefa de segmentação do cancro de mama, avaliamos o efeito das anotações contextuais no desempenho do modelo. Muitas soluções de ML e DL existem atualmente na literatura para abordar a segmentação do cancro de mama. No entanto, estas abordagens não aproveitam ao máximo a informação contextuai das massas do cancro da mama e do tecido circundante presente nas imagens do cancro da mama, o que tem provado ser uma pista fundamental para lidar com a ambiguidade local. Abordamos essa questão propondo uma abordagem de ML baseada em CNN com três backbones possíveis, LinkNet, FPN e UNet, para segmentação de cancro de mama em mamografias. Nossos experimentos demonstraram que informações de contexto adicionais são benéficas para a segmentação de mamografias por cancro de mama, variando os graus de anotações para cada instância de treinamento. Ao comparar o desempenho desses três modelos quando treinados com vários níveis de anotações, quantificamos o impacto de anotações não-alvo e identificamos a estrutura do modelo de segmentação de cancro de mama que mais se beneficia dessa abordagem. O uso de anotações suplementares não-alvo pode ajudar a mitigar o problema da necessidade de grandes conjuntos de dados para treinar modelos de segmentação DI., que por sua vez têm o potencial de reduzir a carga de trabalho dos radiologistas e melhorar o desempenho do rastreio do cancro da mama em áreas mal servidas, cujo acesso aos cuidados de saúde é limitado. Finalmente, para a tarefa de classificação do cancro de mama, propusemos um pipeline de ponta-a-ponta que realiza a segmentação, deteção e classificação do cancro da mama. O pipeline baseia-se na arquitetura de rede neural convolucional em forma de U, capaz de extrair mapas de características seletivas de imagens segmentadas para auxiliar os módulos de inferência do pipeline na execução de tarefas específicas de classificação e deteção. O nosso pipeline é capaz de extrair conjuntamente a máscara de segmentação para vários tecidos mamários saudáveis e doentes, ao mesmo tempo que infere informações sobre o tipo de tecido, densidade mamária, grau BIRADS e patologia da massa. Esta abordagem de mascaramento de características convolucionais serve como um mecanismo de atenção que direciona os módulos de classificação do pipeline para se concentrarem nas características dentro das regiões específicas, enquanto ignora a informação irrelevante de outras áreas da imagem, resolvendo assim o nosso terceiro objetivo de tese de melhorar o diagnóstico do cancro da mama.
Os métodos tradicionais de diagnóstico do cancro de mama dependem fortemente de diferentes modalidades de imagens médicas. Essas modalidades de imagem, como MG, MRI, US e DBT, são usadas no rastreamento do cancro de mama, no planejamento do tratamento, bem como no rastreamento da progressão da doença. Porém, o processo de avaliar cada imagem diagnóstica e extrair dela informações relevantes requer um profissional treinado e experiente. Isto pode consumir muito tempo para o profissional médico e frustrar os esforços de expansão do rastreio do cancro da mama para áreas com défice de pessoal médico, como áreas rurais afastadas dos grandes centros metropolitanos. Com o surgimento dos métodos de imagem digital, dos sistemas DICOM e PACS, tornou-se possível conectar pacientes com equipes médicas que residem em um local diferente. Além disso, esses métodos de imagem digital são ideais para sistemas CAD, que têm o potencial de auxiliar a equipe médica e aumentar a eficiência e a eficácia do rastreamento do cancro de mama e do atendimento aos pacientes. Esta tese contribui para a tarefa de diagnóstico do cancro da mama através da utilização de sistemas CAD baseados em IA e centra-se em quatro aspectos principais: Detecção, segmentação, classificação do cancro da mama e o desenvolvimento e utilização destes sistemas CAD baseados em IA. Primeiro, realizamos uma revisão aprofundada da literatura sobre tarefas de detecção, segmentação e classificação do cancro de mama em todas as modalidades modernas de imagens médicas e destacamos os diferentes avanços, deficiências, conjuntos de dados existentes sobre cancro de mama e métricas de avaliação comum ente usadas. Estas três tarefas de diagnóstico do cancro da mama são desafiantes em muitos aspectos, mas uma questão recorrente observada na literatura são os dados de treino disponíveis, ou a falta deles. Tamanhos pequenos de conjuntos de dados podem levar a vários problemas, como variabilidade intraclasse insuficiente, especialmente considerando que os conjuntos de dados existentes contêm um número significativamente maior de imagens saudáveis em comparação com imagens com diferentes tipos de cancro de mama. Além disso, para reduzir o viés do modelo, é importante que o conjunto de dados contenha amostras com uma variedade de formatos, tamanhos e densidades de tecidos diferentes (fibrosos, glandulares, adiposos), bem como diferentes formatos, tamanhos e localizações de cancro de mama. tipos (massa, calcificações), classificação BIRADS, entre outros. Primeiramente fornecemos uma pesquisa aprofundada sobre a aprendizagem automática aplicada ao diagnóstico do cancro da mama, com ênfase nos conjuntos de dados disponíveis publicamente, nos métodos de pré-processamento utilizados no diagnóstico por imagem do cancro da mama, modelos atuais utilizados para a deteção, segmentação e classificação do cancro da mama, e as métricas utilizadas para avaliar estes modelos. Apresentamos todas as áreas e aspetos relevantes da aprendizagem automática aplicada ao diagnóstico do cancro da mama, onde cada método, conjunto de dados e técnica foi organizado com base nas diferentes tarefas que foram concebidas para resolver pelos seus respetivos autores. Destacamos ainda os fatores que diferenciam cada uma das técnicas revistas, bem como as suas deficiências. No final, fornecemos aos leitores um roteiro orientado de aprendizagem automática aplicado ao diagnóstico por imagem do cancro da mama, com foco na abordagem de cada uma das tarefas específicas de imagem do cancro da mama através das melhores abordagens de pre-processamento, métodos de melhor desempenho e métricas de avaliação adequadas. A seguir, abordamos o problema da insuficiência de dados de treinamento propondo um GAN capaz de gerar imagens realistas de cancro de mama que podem ser usadas para desenvolver ainda mais sistemas CAD de cancro de mama. Nosso GAN proposto usa modelos personalizados como entradas para definir diferentes formatos, tamanhos e densidades de tecido de mama, bem como formatos, tamanhos e localizações de massa de cancro de mama, entre outras características, preservando as informações originais do rótulo. Os dados de imagem sintetizados podem então ser usados para treinar outros modelos de aprendizagem de máquina para tarefas como detecção, segmentação ou classificação. Esta solução GAN proposta pode ser considerada como uma etapa de aumento de dados em um pipeline completo do sistema CAD e pode ser implementada juntamente com outras técnicas de aumento de dados para acrescentar ainda mais ao tamanho do conjunto de dados de treinamento. Para a tarefa de segmentação do cancro de mama, avaliamos o efeito das anotações contextuais no desempenho do modelo. Muitas soluções de ML e DL existem atualmente na literatura para abordar a segmentação do cancro de mama. No entanto, estas abordagens não aproveitam ao máximo a informação contextuai das massas do cancro da mama e do tecido circundante presente nas imagens do cancro da mama, o que tem provado ser uma pista fundamental para lidar com a ambiguidade local. Abordamos essa questão propondo uma abordagem de ML baseada em CNN com três backbones possíveis, LinkNet, FPN e UNet, para segmentação de cancro de mama em mamografias. Nossos experimentos demonstraram que informações de contexto adicionais são benéficas para a segmentação de mamografias por cancro de mama, variando os graus de anotações para cada instância de treinamento. Ao comparar o desempenho desses três modelos quando treinados com vários níveis de anotações, quantificamos o impacto de anotações não-alvo e identificamos a estrutura do modelo de segmentação de cancro de mama que mais se beneficia dessa abordagem. O uso de anotações suplementares não-alvo pode ajudar a mitigar o problema da necessidade de grandes conjuntos de dados para treinar modelos de segmentação DI., que por sua vez têm o potencial de reduzir a carga de trabalho dos radiologistas e melhorar o desempenho do rastreio do cancro da mama em áreas mal servidas, cujo acesso aos cuidados de saúde é limitado. Finalmente, para a tarefa de classificação do cancro de mama, propusemos um pipeline de ponta-a-ponta que realiza a segmentação, deteção e classificação do cancro da mama. O pipeline baseia-se na arquitetura de rede neural convolucional em forma de U, capaz de extrair mapas de características seletivas de imagens segmentadas para auxiliar os módulos de inferência do pipeline na execução de tarefas específicas de classificação e deteção. O nosso pipeline é capaz de extrair conjuntamente a máscara de segmentação para vários tecidos mamários saudáveis e doentes, ao mesmo tempo que infere informações sobre o tipo de tecido, densidade mamária, grau BIRADS e patologia da massa. Esta abordagem de mascaramento de características convolucionais serve como um mecanismo de atenção que direciona os módulos de classificação do pipeline para se concentrarem nas características dentro das regiões específicas, enquanto ignora a informação irrelevante de outras áreas da imagem, resolvendo assim o nosso terceiro objetivo de tese de melhorar o diagnóstico do cancro da mama.
Description
Keywords
Segmentation Breast Cancer Classification Context-Aware Neural Networks