|
|
Aluno(a) |
Ariani Di Felippo |
Titulo |
Delimitação e Alinhamento de Conceitos Lexicalizados no Inglês Norte-americano e no Português Brasileiro |
Orientador(a) |
|
Data |
01/08/2008 |
Resumo |
Esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxico-conceitual que possa auxiliar o processamento computacional dessa língua em meio escrito. Para tanto, as atividades de pesquisa foram divididas em dois domínios. No primeiro, o lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No segundo domínio, o lingüístico-computacional, os conceitos lexicalizados no AmE e PB foram alinhados por uma interlíngua estruturada (ou ontologia) que segue os construtos do modelo de representação do conhecimento MultiNet. O alinhamento dos conceitos foi feito no editor Protégé-OWL, um dos mais utilizados para se criar e editar ontologias, o que resultou na base de dados denominada REBECA. Além de permitir a comparação entre os padrões de lexicalização apresentados por essas línguas, a base REBECA tem potencial para ser utilizada em várias aplicações de PLN. Ainda no domínio lingüístico-computacional, o alinhamento dos conceitos lexicalizados no AmE e PB nos moldes do projeto EuroWordNet também foi realizado, o que pode auxiliar o mapeamento da wordnet do português brasileiro (a WordNet.Br) à WN.Pr. Dessa forma, esta tese é uma tentativa de contribuir para a identificação das diferenças léxico-conceituais entre o AmE e o PB e para o processamento automático do PB, promovendo a visão lingüisticamente motivada das pesquisas de PLN e fortificando o trabalho colaborativo entre lingüistas e cientistas da computação.
Palavras-chave: conceitos; unidades lexicais; alinhamento léxico-conceitual; representação do conhecimento; base de dados; semântica. |
Tipo |
Defesa-Doutorado |
Texto Completo |
|
|
|
|
|