PADRONIZAÇÃO LEXICAL
UM ESTUDO DESCRITIVO INICIAL SOBRE COLOCAÇÃO, COLIGAÇÃO E PROSÓDIA SEMÂNTICA
APLICADOS À EXTRAÇÃO AUTOMÁTICA
DE INFORMAÇÃO DE TEXTOS

Lucielen Porfirio (Unioeste)
Jorge Bidarra
(Unioeste)

O estudo da padronização lexical se concentra na pesquisa da regularidade em que unidades lexicais aparecem co-ocorrendo com outras. Segundo Berber Sardinha (2000) pode-se distinguir três tipos de padrões lexicais: colocação, coligação e prosódia semântica. Partindo do pressuposto de que toda língua é preenchida por padrões, os quais são observáveis estatisticamente, pensamos que o estudo da padronização lexical vem a ser muito importante para a identificação de informação relevante em um corpus, ou seja, para a área de extração de informação. Assim, o objetivo que temos com a realização deste trabalho é fazer uma descrição formal sobre como este tipo de padronização pode colaborar com a área de extração automática de informação.

...........................................................................................................................................................

Copyright © Círculo Fluminense de Estudos Filológicos e Lingüísticos