Logo do repositório
 
A carregar...
Miniatura
Publicação

Lexique médical unifié pour le Portugais - UMLP

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
Isabel_Marcelino.pdf2.39 MBAdobe PDF Ver/Abrir

Resumo(s)

La médecine est un domaine caractérisé par une terminologie spéci que. C’est pour cela qu’elle a une position très spéciale, non seulement en raison du nombre impressionnant de termes mis en jeu, mais aussi par les efforts internationaux déjà consacrés pour établir des terminologies standardisées. Ces terminologies, créées principalement de forme manuelle, jouent un rôle clé dans le traitement de l’information et des connaissances médicales. Pour le portugais, il n’existe qu’une seule grande terminologie standardisée, et ce, pour la variante brésilienne. C’est pour cette raison que notre travail consiste à créer et à maintenir (semi-)automatiquement un dictionnaire électronique uni é et évolutif pour le portugais luso-africain, à partir de diverses terminologies collectées sur la toile, également de forme (semi-)automatique. Le codage de ces terminologies selon un même langage informatique de balisage générique a relevé plusieurs dif cultés qui ont dû être résolues, a n de pouvoir faire l’uni cation intra-terminologique. Cette étape a souligné plusieurs problèmes que nous avons résolu de diverses formes en fonction du type de problème : soit par l’application des règles du Nouvel Accord Orthographique, soit par une distance d’édition. Ce n’est qu’après être passé par ces différentes étapes que nous pouvons alors fusionner nos données a n de corriger les problèmes d’uni cation inter-terminologiques alors apparus lors de la fusion. C’est ainsi que nous obtenons le plus grand dictionnaire médical luso-africain de plus de 81.000 termes, où sont également précisées, quand disponibles, les variantes brésiliennes.
A integração de sistemas de terminologia padronizada em um sistema de representação unificada de conhecimento para a biomedicina formou uma área chave da investigação nos últimos anos. A Unified Medical Language System (UMLS) é a base de conhecimento médico mais conhecida que combina o Metathesaurus, o léxico ESPECIALISTA e a Rede semântica. No entanto, o UMLS é principalmente dedicado ao idioma Inglês. De fato, apenas algumas línguas são incluídas em seu núcleo, cuja cobertura é muito limitada. Por exemplo, Bodenreider & McCray (1998) mostram que apenas uma mínima percentagem da terminologia médica francesa está incluída no UMLS. Consequentemente, diferentes projectos foram aparecendo, como o UMLF (Zweigenbaum et al., 2003) para o francês e os esforços do Instituto Alemão de Documentação e Informação Médica para produzir dados para a língua alemã para o UMLS original. Mas, a maioria das metodologias utilizadas até agora para construir um UMLS são baseadas em usar o original ou a versão traduzida do thesaurus MeSH (Medical Subject Headings), que é o mais importante recurso do Metathesaurus. No nosso ponto de vista, a m de construir uma base de conhecimento médico dinâmica, a linguagem médica precisa de ser recolhida por meio de diversos vocabulários médicos controlados, existentes na forma de terminologias, dicionários ou glossários, a fim de obter um leque representando diversas áreas e géneros da medicina. De facto, embora o MeSH seja um recurso valioso, são necessárias constantes atualizações manuais para acompanhar a dinamicidade da linguagem. Demais, a manutenção do MeSH e do UMLS é cara, demorosa e pode não refletir a realidade da linguagem médica em tempo útil. Além disso, é definida com base em indexação manual, o que pode não reflectir a realidade das relações entre conceitos. Para evitar tais limitações, propomos construir semi-automaticamente um Metathesaurus médico unificado para o Português chamado UMLP (Unified Medical Lexicon for Portuguese). A nossa ideia é, primeiro, construir um léxico unificado baseado em dicionários eletrónicos, glossários e taxonomias online, na Wikipédia e no Wikcionário. Depois, com base nos thesauri criados automaticamente a partir dos recursos, pretendemos construir o Metatesaurus Português. Para isso, depois de ter codificado todos esses recursos em uma única e mesma linguagem informática, vamos resolver os problemas de unificação intra-terminológicos com a aplicação das regras do Novo Acordo Ortográfico e com o cálculo da distância de Levenshtein. Só depois é que podemos fazer a fusão de todos os nossos dados e resolver os novos problemas de unificação surgidos, para chegar à criação do maior léxico médico unificado para o português luso-africano (com as informações do português do Brasil, sempre que disponíveis), com aproximadamente 81.000 entradas, juntamente com seus respectivos caminhos taxonómicos vindos dos diferentes recursos.
Medicine is a eld characterized by a terminology. That is why it takes a very special not only because of the impressive number of words involved, but also international efforts already devoted to establish standardized terminologies. These terminologies, created primarily as manual, play a key role in information processing and medical knowledge. For Portuguese, there is only one major standardized terminology in the Brazilian variant. For this reason our job is to create and automatically maintain a uni ed and scalable electronic dictionary for Portuguese European (while maintaining the Brazilian standard), from various terminologies collected on the Web also form automatically. The coding of these terminologies in a very generic markup language, has identi ed several challenges that had to be resolved in order to move to the intra-uni cation of terminology. This stage highlighted several problems we solved in different forms depending on the type of problem : either by applying the rules of the New Orthographic Agreement, or by an edit distance. Only after going through these steps so that we can combine our data to correct the problems of inter-uni cation of terminology then appeared in the merger. Thus we get the largest dictionary Luso-African about 81.000 words, which are also included, when available, the Brazilian variants.

Descrição

Palavras-chave

Thesauri - Medicina Terminologia médica

Contexto Educativo

Citação

Unidades organizacionais

Fascículo

Editora

Universidade da Beira Interior

Licença CC