UNIVERSIDADE ESTADUAL PAULISTA
"JÚLIO DE MESQUITA FILHO"

Faculdade de Ciências e Letras - Campus de Araraquara
  Agenda Pós-Graduação - Lingüística e Língua Portuguesa

Aluno(a) Ariani Di Felippo
Titulo Delimitação e Alinhamento de Conceitos Lexicalizados no Inglês Norte-americano e no Português Brasileiro
Orientador(a)
Data 01/08/2008
Resumo Esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxico-conceitual que possa auxiliar o processamento computacional dessa língua em meio escrito. Para tanto, as atividades de pesquisa foram divididas em dois domínios. No primeiro, o lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No segundo domínio, o lingüístico-computacional, os conceitos lexicalizados no AmE e PB foram alinhados por uma interlíngua estruturada (ou ontologia) que segue os construtos do modelo de representação do conhecimento MultiNet. O alinhamento dos conceitos foi feito no editor Protégé-OWL, um dos mais utilizados para se criar e editar ontologias, o que resultou na base de dados denominada REBECA. Além de permitir a comparação entre os padrões de lexicalização apresentados por essas línguas, a base REBECA tem potencial para ser utilizada em várias aplicações de PLN. Ainda no domínio lingüístico-computacional, o alinhamento dos conceitos lexicalizados no AmE e PB nos moldes do projeto EuroWordNet também foi realizado, o que pode auxiliar o mapeamento da wordnet do português brasileiro (a WordNet.Br) à WN.Pr. Dessa forma, esta tese é uma tentativa de contribuir para a identificação das diferenças léxico-conceituais entre o AmE e o PB e para o processamento automático do PB, promovendo a visão lingüisticamente motivada das pesquisas de PLN e fortificando o trabalho colaborativo entre lingüistas e cientistas da computação.

Palavras-chave: conceitos; unidades lexicais; alinhamento léxico-conceitual; representação do conhecimento; base de dados; semântica.
Tipo Defesa-Doutorado
Texto Completo

APG 2.0
Copyright 2014 (c) UNESP - Faculdade de Ciências e Letras do Campus de Araraquara