Logo do repositório
 
Publicação

Lexique médical unifié pour le Portugais - UMLP

dc.contributor.advisorCasteleiro, João Malaca
dc.contributor.advisorDias, Gaël Harry Adélio André
dc.contributor.advisorOliveira, José António Martinez Souto de
dc.contributor.authorMarcelino, Isabel Maria Clara
dc.date.accessioned2014-06-11T13:55:47Z
dc.date.available2014-06-11T13:55:47Z
dc.date.issued2012-06
dc.description.abstractLa médecine est un domaine caractérisé par une terminologie spéci que. C’est pour cela qu’elle a une position très spéciale, non seulement en raison du nombre impressionnant de termes mis en jeu, mais aussi par les efforts internationaux déjà consacrés pour établir des terminologies standardisées. Ces terminologies, créées principalement de forme manuelle, jouent un rôle clé dans le traitement de l’information et des connaissances médicales. Pour le portugais, il n’existe qu’une seule grande terminologie standardisée, et ce, pour la variante brésilienne. C’est pour cette raison que notre travail consiste à créer et à maintenir (semi-)automatiquement un dictionnaire électronique uni é et évolutif pour le portugais luso-africain, à partir de diverses terminologies collectées sur la toile, également de forme (semi-)automatique. Le codage de ces terminologies selon un même langage informatique de balisage générique a relevé plusieurs dif cultés qui ont dû être résolues, a n de pouvoir faire l’uni cation intra-terminologique. Cette étape a souligné plusieurs problèmes que nous avons résolu de diverses formes en fonction du type de problème : soit par l’application des règles du Nouvel Accord Orthographique, soit par une distance d’édition. Ce n’est qu’après être passé par ces différentes étapes que nous pouvons alors fusionner nos données a n de corriger les problèmes d’uni cation inter-terminologiques alors apparus lors de la fusion. C’est ainsi que nous obtenons le plus grand dictionnaire médical luso-africain de plus de 81.000 termes, où sont également précisées, quand disponibles, les variantes brésiliennes.por
dc.description.abstractA integração de sistemas de terminologia padronizada em um sistema de representação unificada de conhecimento para a biomedicina formou uma área chave da investigação nos últimos anos. A Unified Medical Language System (UMLS) é a base de conhecimento médico mais conhecida que combina o Metathesaurus, o léxico ESPECIALISTA e a Rede semântica. No entanto, o UMLS é principalmente dedicado ao idioma Inglês. De fato, apenas algumas línguas são incluídas em seu núcleo, cuja cobertura é muito limitada. Por exemplo, Bodenreider & McCray (1998) mostram que apenas uma mínima percentagem da terminologia médica francesa está incluída no UMLS. Consequentemente, diferentes projectos foram aparecendo, como o UMLF (Zweigenbaum et al., 2003) para o francês e os esforços do Instituto Alemão de Documentação e Informação Médica para produzir dados para a língua alemã para o UMLS original. Mas, a maioria das metodologias utilizadas até agora para construir um UMLS são baseadas em usar o original ou a versão traduzida do thesaurus MeSH (Medical Subject Headings), que é o mais importante recurso do Metathesaurus. No nosso ponto de vista, a m de construir uma base de conhecimento médico dinâmica, a linguagem médica precisa de ser recolhida por meio de diversos vocabulários médicos controlados, existentes na forma de terminologias, dicionários ou glossários, a fim de obter um leque representando diversas áreas e géneros da medicina. De facto, embora o MeSH seja um recurso valioso, são necessárias constantes atualizações manuais para acompanhar a dinamicidade da linguagem. Demais, a manutenção do MeSH e do UMLS é cara, demorosa e pode não refletir a realidade da linguagem médica em tempo útil. Além disso, é definida com base em indexação manual, o que pode não reflectir a realidade das relações entre conceitos. Para evitar tais limitações, propomos construir semi-automaticamente um Metathesaurus médico unificado para o Português chamado UMLP (Unified Medical Lexicon for Portuguese). A nossa ideia é, primeiro, construir um léxico unificado baseado em dicionários eletrónicos, glossários e taxonomias online, na Wikipédia e no Wikcionário. Depois, com base nos thesauri criados automaticamente a partir dos recursos, pretendemos construir o Metatesaurus Português. Para isso, depois de ter codificado todos esses recursos em uma única e mesma linguagem informática, vamos resolver os problemas de unificação intra-terminológicos com a aplicação das regras do Novo Acordo Ortográfico e com o cálculo da distância de Levenshtein. Só depois é que podemos fazer a fusão de todos os nossos dados e resolver os novos problemas de unificação surgidos, para chegar à criação do maior léxico médico unificado para o português luso-africano (com as informações do português do Brasil, sempre que disponíveis), com aproximadamente 81.000 entradas, juntamente com seus respectivos caminhos taxonómicos vindos dos diferentes recursos.por
dc.description.abstractMedicine is a eld characterized by a terminology. That is why it takes a very special not only because of the impressive number of words involved, but also international efforts already devoted to establish standardized terminologies. These terminologies, created primarily as manual, play a key role in information processing and medical knowledge. For Portuguese, there is only one major standardized terminology in the Brazilian variant. For this reason our job is to create and automatically maintain a uni ed and scalable electronic dictionary for Portuguese European (while maintaining the Brazilian standard), from various terminologies collected on the Web also form automatically. The coding of these terminologies in a very generic markup language, has identi ed several challenges that had to be resolved in order to move to the intra-uni cation of terminology. This stage highlighted several problems we solved in different forms depending on the type of problem : either by applying the rules of the New Orthographic Agreement, or by an edit distance. Only after going through these steps so that we can combine our data to correct the problems of inter-uni cation of terminology then appeared in the merger. Thus we get the largest dictionary Luso-African about 81.000 words, which are also included, when available, the Brazilian variants.
dc.identifier.tid101245777
dc.identifier.urihttp://hdl.handle.net/10400.6/1843
dc.language.isofrapor
dc.peerreviewedyespor
dc.publisherUniversidade da Beira Interiorpor
dc.relationA New Unified Medical Lexicon for Portuguese: UMLP [SFRH/BD/29625/2006]
dc.subjectThesauri - Medicinapor
dc.subjectTerminologia médicapor
dc.titleLexique médical unifié pour le Portugais - UMLPpor
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardNumberSFRH/BD/29625/2006
oaire.awardTitleA New Unified Medical Lexicon for Portuguese: UMLP [SFRH/BD/29625/2006]
oaire.awardURIinfo:eu-repo/grantAgreement/FCT//SFRH%2FBD%2F29625%2F2006/PT
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspor
rcaap.typedoctoralThesispor
relation.isProjectOfPublication33691450-9f69-409d-afb5-bacbda64a54a
relation.isProjectOfPublication.latestForDiscovery33691450-9f69-409d-afb5-bacbda64a54a

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
Isabel_Marcelino.pdf
Tamanho:
2.39 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: