Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/269729
Type: TESE
Title: Prototipo de um lexico para o processamento da linguagem natural : o caso dos adjetivos polissemicos
Author: Bidarra, Jorge
Advisor: Françozo, Edson, 1951-
Abstract: Resumo: A maioria das palavras em português revela um alto grau de polissemia. Apesar disso, os modelos de léxicos convencionais não têm se mostrado aptos para lidar adequadamente com o fenômeno. O tratamento que dão às palavras polissêmicas, não raro, é exatamente o mesmo aplicado aos casos de homonímia. Ou seja, para cada significado diferente que a palavra admite, cria-se uma nova entrada no léxico, totalmente desarticulada dos demais sentidos, mesmo que entre eles haja algum tipo de relacionamento semântico estabelecido. A principal implicação desta falta de estruturação é que ao sistema lexical deixa-se pouco ou nenhum recurso para enfrentar situações tais como aquela em que um novo sentido de uma palavra é detectado mas que não encontra correspondência com qualquer das entradas descritas no léxico. Esta tese investiga justamente o problema da representação no léxico de palavras ambíguas, mas em particular no que tange à polissemia adjetival, e propõe um protótipo de léxico semântico para o PLN. O modelo em si resulta da integração de duas importantes teorias gramaticais, quais sejam, a do léxico gerativo de James PUSTEJOVSKY (1991, 1995) e a da HPSG desenvolvida por Carl POLLARD e Ivan A. SAG (1987, 1994). Do ponto de vista da arquitetura, o léxico como aqui é proposto, e que se encontra formalmente especificado, apresenta algumas vantagens (das quais citaremos apenas três) em relação a outras modelagens existentes. Uma delas dizendo respeito a sua capacidade para integrar de uma maneira bastante satisfatória ambos os níveis de representação sintática e semântico-conceitual de qualquer um dos itens a serem lexicalizados. Uma outra vantagem é que, partindo de uma representação lexical interna ricamente estruturada, cujas especificações são feitas com base nas chamadas estruturas de traços tipadas, dá-se ao modelo um alto poder de expressividade, na medida em que pela unificação das estruturas toma-se também possível combinar informações que não só as oriundas do próprio item lexical mas também aquelas obtidas de outros itens que com ele se estruturam para formar uma expressão gramatical mais complexa. A terceira e última vantagem, talvez sendo ela a mais importante de todas, tem a ver com a habilidade do modelo para, a partir de uma única entrada lexical (esta representando a especificação do significado básico e central da palavra polissêmica), capturar cada um dos diferentes sentidos que o item em questão possa admitir quando submetido ao contexto

Abstract: Most words in portuguese display a highest degree of polysemy. Nevertheless the conventional lexical models have not been able to deal with this phenomenon adequately. The treatment given to polysemy is often the same as to homonymy. That is, for each different meaning the word presents, a new lexicon entry is created, unrelated to the others even if there is some kind of semantic relation among them. The most important implication of this lack of structure is that the lexical system finds few or no resources to deal with situations in which a new sense is detected for a given word but this sense does not match any of the listed homonymous senses in the lexicon. This thesis investigates the lexical ambiguity problem but in particular that concerning the adjectival polysemy and proposes a prototypical semantic lexicon for NLP. The model we propose integrates two important grammatical theories, that is, the Generative Lexicon by James PUSTEJOVKSY (1991, 1995), and HPSG by Carl POLLARDand Ivan A. SAG (1987, 1994). From the point of view of its architecture, the lexicon formally specified here, shows some advantages (only three of them are mentioned here) when compared to the other proposed models. The first advantage is certainly its capacity to integrate satisfactorily both syntactical and semantic-conceptuallevels for any item to be inserted in the lexicon. Second, starting with a highly structured lexical representation, the model reaches a high leveI of expression because the unification of structures enables a combination of information obtained not only from the lexical item itself, but also trom other items combined to form a more complex grammatical expression. The last advantage, perhaps the most important one, refers to the model's ability to capture each one of the different senses the word admits when submitted to the context, taking as a start point only one lexical entry (which represents the basic and central meaning specification of the polyssemic word)
Subject: Ambiguidade
Polissemia
Processamento da linguagem natural (Computação)
Inteligência artificial
Language: Português
Editor: [s.n.]
Date Issue: 2001
Appears in Collections:IEL - Dissertação e Tese

Files in This Item:
File SizeFormat 
Bidarra_Jorge_D.pdf8.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.