|
|
Aluno(a) |
Cláudia Zavaglia |
Titulo |
Análise da Homonímia no Português: tratamento semântico com vistas a procedimentos computacionais |
Orientador(a) |
|
Data |
02/10/2002 |
Resumo |
Uma database semântica constitui um repositório lexical fundamental como fonte de Recursos Lingüísticos para os estudos do Processamento Automático das Línguas Naturais (PALN). De fato, a informação semântica é indispensável para programas que analisam e decodificam textos em língua natural. Nesta tese, foram analisadas formas homógrafas do português contemporâneo, a partir do Dicionário de Freqüências do Português Contemporâneo de Biderman, com o escopo de identificar e distinguir homônimos usuais do português contemporâneo. Efetuou-se, assim, a análise dessas formas ambíguas com o intuito de oferecer estratégias e meios de desambiguá-las com vistas à sua aplicação em sistemas computacionais. Para tanto, foi elaborada uma Base de Conhecimento Lexical (BCL), a partir de nomes homógrafos para o português do Brasil, para servir de modelo teórico-prático para a implementação dos dados sugeridos para outras classes de palavras além dos nomes. A BCL possui conhecimentos lexicais de natureza semântica, morfossintática, ontológica, contemplando uma vasta gama de informações lingüísticas com vistas à utilização em sistemas de PALN. O Léxico Gerativo de Pustejovsky foi usado como modelo teórico. Nesse modelo, a Estrutura Qualia foi selecionada como um dos expedientes lingüístico-semânticos para a realização da desambiguação das formas homônimas. A organização conceitual da BCL assemelha-se àquela de um thesaurus, já que os itens lexicais encontram-se correlacionados e interligados por diferentes tipos de relações semânticas. Para o modelo relacional de BCL sugerido, foi elaborada e implementada uma interface computacional que convalida todas as análises e pesquisas realizadas. |
Tipo |
Defesa-Doutorado |
|
|
|
|