Como o computador deve concordar
o
adjetivo com o substantivo?

Carolina Monte (PUC-Rio)

 

Introdução

Quem é ou já foi usuário do principal editor de textos do mercado sabe que sua ferramenta de correção gramatical - aqueles sublinhados em verde -, apesar de notadamente útil, inspira cuidados no seu uso. Isso porque não podemos aceitar tudo o que o programa nos levanta como sendo errado e nem mesmo podemos acreditar que os únicos erros em nosso texto sejam aqueles marcados pelos sublinhados.

Um exemplo disso é a concordância entre palavras que, quando vêem intercaladas por outras, muitas vezes falha ao ser avaliada automaticamente: erros são apontados quando a concordância é legítima ou, ainda, algumas concordâncias enganosas não são apontadas como tais pelo corretor.

Esse trabalho visa analisar a relação de concordância estabelecida entre o adjetivo e o substantivo sobre o qual o adjetivo incide, buscando refinar as regras de ligação entre essas duas classes de palavras para uma futura aplicação em corretores gramaticais automáticos.

Ao refinarmos as regras estamos tornando-as menos genéricas, isso é, estamos reduzindo a atuação de certos fenômenos a alguns poucos tipos de adjetivos ou substantivos em particular e não a todos. Dessa forma, a máquina poderá afirmar com maior precisão um “erro” e propor com mais confiança uma sugestão de conserto.

Como operam as ligações sintáticas entre adjetivo e substantivo nesse trabalho?

O refinamento das regras de ligação sintática do adjetivo com o substantivo que apresento aqui segue um modelo computacional da gramática na forma de um grafo, que tenho desenvolvido já há algum tempo. Não será necessário por ora explicar os principais fundamentos desse modelo, mas primeiramente mostrarei do que ele consiste.

Matematicamente, um grafo é um conjunto de pontos (chamados vértices) e um conjunto de arcos ou setas que ligam os pontos dois a dois. Esses pontos e arcos podem representar uma série infindável de situações reais. No nosso caso, os pontos representarão as palavras de uma sentença e as setas representarão as funções sintáticas, sendo que as setas partem de uma palavra e incidem naquela palavra que serve de argumento à primeira.

Assim delimitado nosso grafo, já podemos perceber uma conseqüência na nossa análise sintática: as funções sintáticas ligarão palavras e não sintagmas. E essa opção é central ao propormos nosso novo modelo, isso porque os modelos de análise sintática baseados em constituintes geram regras muitas vezes ambíguas.

Por exemplo, numa sentença como “estudos de Lingüística avançados”, pelo modelo dos constituintes, o adjetivo poderia fazer parte somente do sintagma nominal que tem “estudos” como núcleo, ou poderia fazer parte também do sintagma nominal que tem “Lingüística” como núcleo. Se estivermos considerando que o adjetivo se liga àquele substantivo que é núcleo do sintagma nominal em que o adjetivo está sendo gerado, o computador, seguindo o modelo dos constituintes, não poderia decidir sobre qual dos substantivos o adjetivo “avançados” estaria ligado, para avaliar se a concordância nominal está sendo cumprida ou não.

Saber qual dos substantivos de uma sentença um adjetivo está incidindo ou poderá incidir é a questão fundamental desse trabalho, porque é a partir dessa ligação que se estabelece as regras de concordância. Vem daí a necessidade de refinamento das regras dessa ligação.

Para isso vamos aprimorar uma série de regras que definem as possíveis ligações entre o adjetivo e o substantivo.

 

Delimitando o adjetivo

Tradicionalmente alguns substantivos podem ser classificados como adjetivos quando ocorrem em seqüências como essas:

O defunto subst. autor adj.

O autor subst. defunto adj.

Uma das principais opções de economia teórica desse estudo é reduzir ao máximo o número de casos em que duas classes gramaticais diferentes possam ser atribuídas a uma mesma palavra.

Por essa razão considero, dentro do modelo, que em ambos os exemplos temos dois substantivos e nenhum adjetivo. A regra da definição dessas duas adjunções dos exemplos acima é do escopo dos substantivos. Deve haver alguma regra que defina porque alguns substantivos possam se comportar dessa forma e quais são os tipos de substantivos que assim se comportam (acredito que tais substantivos são quase-adjetivos, mas não adjetivos), sendo que essa regra não é relevante para o presente trabalho. E, portanto, para esse estudo, esses não são exemplos de relação entre adjetivo e substantivo.

Os adjetivos considerados aqui são classificados em três categorias. Adjetivos qualificadores, adjetivos classificadores e adjetivos-eventos.

Apesar de ter retirado as nomenclaturas “qualificador” e “classificador” de Borba (1996), nossas definições não são as mesmas, mas como delimitamos os mesmos grupos de palavras de forma igual, achei relevante manter as nomenclaturas dele.

Os adjetivos classificadores são pseudo-adjetivos que representam de forma sintética um grupo preposição + substantivo. Exemplo:

(a) Estudos de Lingüística.

(b) Estudos lingüísticos. (adjetivo classificador)

Essa forma de adjetivo sempre é derivada de substantivo, ao contrário dos adjetivos-eventos que estão ligados aos particípios de verbos:

(c) Vaso quebrado. (adjetivo-evento)

Já os adjetivos qualificadores são os adjetivos propriamente[1], e se identificam por não se enquadrarem em nenhuma das duas outras classificações:

(d) Gato gordo. (adjetivo qualificador)

Claro que as classificações não são congruentes com as distribuições lexicais. Um mesmo adjetivo pode aparecer num contexto com um significado classificador e em outro como qualificador, e o mesmo pode acontecer com adjetivos-eventos.

(e) As flores levadas ao paciente no hospital. (adjetivo-evento)

(f) O menino levado. (adjetivo qualificador)

(g) Estudo literário. (adjetivo classificador)

(h) Texto literário. (adjetivo qualificador)

Cabe ainda um estudo lexical para definir se essas variações são apenas diferentes significados de uma mesma palavra ou se chegariam a configurar entradas distintas num dicionário[2].

Posto isso, passemos a estudar as principais posições gramaticais do adjetivo.

 

Adjetivos antepostos e adjetivos pospostos

Em português, a posição preferencial dos adjetivos é a pós-nome. Tanto é assim que somente um dos três tipos básicos apresentados pode aparecer em posição pré-nominal. Os adjetivos qualificadores assim podem se comportar.

No entanto, a partir de análise de exemplos de adjetivos antepostos retirados do corpus anotado pelo NILC, observa-se que uns poucos e mesmos exemplos de adjetivos aparecem antes do substantivo. Havendo ainda a possibilidade de alguns deles também configurarem na posição pós-nominal - exemplos (a) e (b), que seguem -, alguns somente na posição pré-nominal - exemplos (c) e (d) - e outros podendo configurar em ambas posições, mas com mudança de significado - exemplos (e) e (f).

(a) As principais ferramentas de trabalho.

(b) As ferramentas principais de trabalho.

(c) Único exportador de petróleo.

(d) ?Exportador único de petróleo.

(e) As grandes empresas.

(f) As empresas grandes.

(g) Água quente.

(h) *Quente água.

Os exemplos que encontrei de adjetivos que rejeitam a posição pós-nominal (a posição posposta sempre é mais marginal que agramatical) se relacionam à ordenação numa seqüência como os numerais ordinais.

(i) Primeiro/segundo/último/único vencedor da prova.

Portanto, ainda tenho ressalvas em considerá-los adjetivos e não numerais ordinais. Dessa maneira, podemos afirmar que nem todo adjetivo qualificador admite a posição anteposta ao substantivo, mas que todo anteposto admite a posição posposta. E ainda, quando as duas possibilidades são permitidas, em alguns casos uma posição é preferencial e para outros adjetivos não existe preferência quanto a posição anteposta ou posposta ao substantivo.

Para fim de algoritmo, será necessário que, em cada entrada lexical de um termo adjetivo qualificador no dicionário, seja demarcado a sua possibilidade ou não de figurar na posição pré-nominal e qual a preferência de posição (se antes ou se depois do substantivo). Proponho a simplificação dessas duas características em uma única. Assim, para cada posição deve-se atribuir um valor. Os valores podem ser três: 1, 0 ou –1. O valor 1 atribuído a uma posição significa “preferencial”, o valor 0 significa “não preferencial” e o valor –1 significa “vetado”.

Por exemplo:

Adjetivo qualificador

Posição pré-nome

Posição pós-nome

maior

1

0

grande

0

0

quente

-1(ou talvez 0)

1

Sendo assim, em dado momento do algoritmo, o programa perguntará qual os valores para as posições que o adjetivo poderá ocupar, para saber em qual direção deverá procurar pelo substantivo a que o adjetivo se liga. Por exemplo, na frase “O maior jogador do planeta” a tabela informará valor pré-nome = 1 e valor pós-nome = 0, então a procura pelo substantivo deverá ser feita à esquerda do adjetivo.

 

Adjetivos e recursividade

A recursividade numa regra de formação ocorre quando um sintagma pode ser composto também pelo próprio sintagma. No caso do adjetivo isso ocorreria da seguinte maneira:

Sintagma Adjetivo à adjetivo (Sintagma Adjetivo)

Nesse exemplo, o sintagma adjetivo apresenta uma recursão.

Como em nosso modelo, falar em recursividade não é possível, pois não trabalhamos com conjuntos de palavras, mas com as palavras como elementos separados, então o que nos interessa aqui é analisar não a recursão em si, mas o produto da regra recursiva na gramática.

A recursão do exemplo anterior gera a possibilidade de seqüências infinitas de adjetivos após o substantivo. O que queremos saber aqui é se isso realmente é possível na língua.

Novamente recorri ao corpus anotado do NILC. Segue alguns exemplos de seqüências de adjetivos antepostos:

par Dinheiro-94b-eco-1: As atuais vagas promessas de «urvização» dos recursos destinados ao setor de saúde deverão encontrar grandes obstáculos, pois os orçamentos públicos foram proibidos, taxativamente, de utilizarem este indexador .

par Esporte-94b-des-1: No final do jogo, a torcida, impaciente com os recentes maus resultados, pediu a saída do técnico Oscar Bernardi .

par Ilustrada-94a-nd-2: Como insurgidas contra seu criador, as velhas ásperas músicas se convertem em acessíveis .

Apesar de o corpus não fornecer exemplos em que mais de dois adjetivos antepostos apareçam lado a lado, não vejo por que não seria possível:

(a) As raras velhas ásperas músicas.

Mostrando que, pelo menos na posição pré-nome, os adjetivos qualificadores podem se seguir uns aos outros, sem problemas. Já quando se trata dos adjetivos de posição pós-nome, a seqüência dependerá do tipo de adjetivo.

Os adjetivos qualificadores somente podem configurar uma vez e somente podem ser intercalados por adjetivos classificadores, exemplos (b) e (c):

(b) Células sangüíneas vermelhas.

(c) Estado policial moderno.

Os adjetivos classificadores podem seguir um adjetivo qualificador, (d), e ainda outro classificador, (e), não parecendo existir limites para o número de classificadores, (f):

(d) Artigos finos culinários.

(e) Seleção brasileira feminina.

(f) Música brasileira instrumental contemporânea.

Já os adjetivos-eventos podem seguir qualquer das seqüências mencionadas, mas não podem ser seguidos por outro tipo de adjetivo que não sejam também adjetivos-eventos, como em (i):

(g) Turismo sexual pedófilo existente principalmente na Alemanha. (dois classificadores seguidos por um evento)

(h) Parques temáticos principais localizados em Orlando. (classificador, qualificador e evento)

(i) Muita coisa escrita guardada num baú. (dois eventos)

Ao pensarmos na execução algorítmica dessas regras, devemos utilizar dois recursos básicos aos estudos da teoria dos grafos: a ponderação e a ordenação topológica.

De um modo geral, a ordenação topológica de um grafo é o estudo que visa ordenar um grafo (não-cíclico) numa seqüência linear enquanto a ponderação consiste em dar valor aos arcos de um grafo.

Somando-se essas duas características podemos ordenar topologicamente um grafo de nossas seqüências de classes de palavras segundo o valor dos arcos ponderados. Sendo assim, uma palavra poderá seguir outra se seu arco tiver valor maior que o da palavra anterior.

 

Intercalação de sintagmas preposicionados

Outra posição que um adjetivo pode aparecer numa sentença é depois de um sintagma preposicionado[3]. Como no exemplo recorrentemente usado nesse trabalho

 

Estudos de Lingüística avançados

Novamente me fundamentei nos exemplos encontrados no corpus do NILC para concluir que também a possibilidade do adjetivo se ligar a um substantivo tendo um sintagma preposicionado entre os dois é dada conforme o tipo do adjetivo.

Tanto os adjetivos qualificadores - exemplos (a), (b), e (c) - quanto os classificadores - exemplos (d), (e), e (f) - só podem aparecer em estruturas como essa se o grupo preposicionado for um complemento nominal (negritos) e não um adjunto.

(a) Número de cromossomos normal.

(b) Conteúdo dessas vesículas rico em enzimas.

(c) Um jogo de compromissos cheio de zonas obscuras.

(d) Ex-promotor de eventos francês.

(e) Um famoso fabricante de cosméticos tradicional no mercado.

(f) Mercado de capitais brasileiro.

Já os adjetivos-eventos podem ser intercalados tanto por adjuntos - exemplos (g) e (h) - quanto por complementos nominais ­- exemplos (i) e (j).

(g) Lâmina de aço imantada.

(h) Urina de ratos contida nas águas.

(i) Diversidade de povos encontrada.

(j) A redução de pessoal aliada ao aumento de carga.

Nos exemplos que apresentei fica claro para o leitor sobre qual substantivo o adjetivo está incidindo porque existe uma diferença de flexão entre os substantivos. Devemos saber se a ligação que fizemos poderia também ser feita se os substantivos compartilhassem a flexão.

(l) Conteúdo desse órgão rico em enzimas.

(m) Mercados de capitais brasileiros.

(n) Lâmina de prata imantada.

(o) Diversidade de gente encontrada.

Tenho a impressão que, no caso dos adjetivos qualificadores e classificadores, existe uma leitura dominante na qual associamos o adjetivo ao substantivo que o antecede mais imediatamente, parecendo a ligação com o primeiro substantivo um tanto forçada se não houver variação na flexão. O que não ocorre no caso dos adjetivos-eventos, cujas ligações a cada um dos substantivos (tanto no caso de adjuntos quanto de complementos) parece ter o mesmo peso de preferência. Esse seria, portanto, um único caso que poderíamos considerar ambíguo.

Mas ainda existe uma particularidade que diminui o número de casos de falsos erros de ambigüidade estrutural que o programa de correção gramatical poderia gerar. Ao vermos o exemplo:

(p) A bola da partida furada pelo jogador.

Pelo que tínhamos dito até então, esse seria um exemplo de sentença ambígua já que o adjetivo-evento poderia se ligar a ambos os substantivos por estarem flexionados como ele. No entanto não seria essa a opinião de um leitor comum, que facilmente atribuiria o adjetivo-evento “furada” exclusivamente ao substantivo “bola” a despeito da coincidência nas flexões.

Exemplos como esse nos mostram que o adjetivo faz uma seleção semântica do substantivo sobre o qual irá incidir. E para que o computador não afirme erroneamente que esse seria um exemplo de sentença ambígua, cabe unirmos ao processo de ligação entre adjetivo e substantivo as características da seleção semântica da gramática das valências.

Na realidade o modelo que trabalho se assemelha em muito com a gramática das valências principalmente na linha de Borba (1996), que considera o substantivo como argumento na estrutura valencial do adjetivo.

Podemos concluir que, para a decisão de informar se uma sentença é ou não ambígua, o programa deve passar pelos seguintes passos: 1.verificar se o adjetivo é do tipo adjetivo-evento; 2. verificar se os dois substantivos satisfazem a seleção semântica do adjetivo; 3. verificar se os dois substantivos estão concordando com o adjetivo.

Se alguma dessas condições não for confirmada, não há ambigüidade. Reduzimos assim a possibilidade de ambigüidade a um caso.

 

A posição predicativa

Até o momento vimos os adjetivos figurando na posição de adjuntos. Agora veremos como se comportam os adjetivos quando a posição em que aparecem é predicativa.

Temos três posições predicativas representadas por cada um dos exemplos:

(a) O artilheiro do jogo estava gordo.

(b) O homem chegou suado ao trabalho.

(c) O mágico deixou as crianças da festa encantadas.

Nos exemplos (b) e (c) acima, os adjetivos grifados se ligam aos sujeitos da sentença, “artilheiro” e “homem”. O adjetivo da terceira sentença se liga ao objeto “crianças”. No entanto, nos três casos essa ligação entre adjetivo e substantivo é feita por intermédio dos verbos. Nesse ponto do trabalho será necessário apresentarmos mais um conceito do modelo de gramática em estudo.

Quando ligávamos até o momento duas palavras por uma seta como num grafo, o fizemos de maneira direta, isso é, a seta partia do adjetivo e apontava para o substantivo.

No entanto, existem ligações indiretas, como as mediadas por preposições nos objetos indiretos. Mas para os exemplos de adjetivos em posição predicativa, o que age como mediador não são preposições, mas sim os próprios verbos.

O terceiro exemplo é um pouco diferente, pois o adjetivo, ao mesmo tempo em que se liga ao substantivo também é argumento do verbo.

O que nos interessa nesse tópico de estudo é saber como se dá essa ligação dependendo do tipo de adjetivo empregado e do tipo de estrutura. Primeiramente, especifiquemos as três estruturas gramaticais em questão.

A estrutura representada pelo exemplo (b) é o que conhecemos como predicado nominal e o adjetivo, um predicativo do sujeito. A estrutura de (c) também produz um predicativo do sujeito, mas dessa vez num predicado verbo-nominal. Já o adjetivo de (d) é um predicativo do objeto.

Dessa vez, o estudo empregado não foi o acesso ao corpus do NILC. Preferiu-se o estudo de Borba (1996) sobre as valências dos adjetivos.

Em concordância com o autor, podemos afirmar que os adjetivos classificadores não podem figurar na estrutura representada por (c) nem, tampouco na de (d):

(f) * A polícia chegou federal à cena do crime.

(g) * Encontrei a polícia federal. (com o significado: “a polícia estava federal quando a encontrei”)

E na estrutural frasal com o verbo de ligação, o adjetivo classificador não poderá aparecer com nenhum verbo que não seja o verbo “ser”.

(h) * Os estudos estavam lingüísticos.

(i) * Os estudos pareciam lingüísticos.

(j) Os estudos eram lingüísticos.

Os adjetivos qualificadores aparecem nas estruturas em que funcionam como predicativos do sujeito sem maiores problemas:

(l) Os estudantes estavam/eram felizes.

(m) Os estudantes chegaram felizes no cinema.

Porém, no momento em que os adjetivos qualificadores figurarem em estruturas do terceiro tipo, aquelas em que funcionam como predicativo do objeto, poderá existir ambigüidade dependendo do verbo:

(n) Encontramos os estudantes felizes.

(o) Considero os estudantes felizes.

Os verbos que vêem a produzir orações ambíguas são aqueles que admitem também uma estrutura argumental em que não apresente o predicativo do objeto. É o caso do verbo “encontrar”, em (n). Como o verbo “considerar” sempre exigirá o predicativo em seu argumento, nunca haverá problema de ambigüidade estrutural desse tipo.

Já o que acontece com os adjetivos-eventos nas estruturas predicativas só falarei rapidamente, por parecer que esta é uma questão muito mais do âmbito dos verbos do que dos adjetivos.

Dos exemplos levantados no corpus do NILC fica claro que alguns particípios só admitem a construção com o verbo “ser” e outros com o verbo “estar”, além de outros admitirem as duas estruturas.

(p) O banco foi comparado com outra instituição.

(q) * O banco esteve comparado.

(r) O atleta estava suado.

(s) * O atleta era suado.

(t) O vaso foi quebrado.

(u) O vaso estava quebrado.

A construção com o verbo “ser” podemos considerar como a voz passiva desse verbo. Por isso deduz-se que somente os adjetivos-eventos que derivem de verbos que admitem a forma passiva possam assim ser estruturados[4] - exemplo (b). Já a sentença em que o verbo “estar” media a ligação do adjetivo com o substantivo está mais próximo das construções ergativas - exemplo (d) - ou intransitivas - exemplo (f).

(a) Alguém gasta dinheiro no evento.

(b) O dinheiro foi gasto no evento.

(c) O sapato gastou.

(d) O sapato estava gasto.

(e) O homem suou.

(f) O homem estava suado.

Como as demais construções predicativas são associadas a um verbo “estar” implícito, somente com os sentidos em que tal verbo aparece, os adjetivos-eventos as aceitam.

(g) As crianças deixaram o sapato gasto.

(h) * O dinheiro me pareceu gasto.

Conclusão

A pesar de esses serem resultados ainda preliminares, as hipótese levantadas pelo trabalho sobre o refinamento das regras que determinam a ligação entre o adjetivo e aquele substantivo que ele irá incidir mostram que novas estratégias para a análise sintática podem ser usadas no lugar dos parsing convencionais e das gramáticas de constituintes.

Ao evitarmos sistemas de regras ambíguos, a ligação sintática será mais eficiente, podendo a análise da concordância - além de outros erros de aceitabilidade - serem avaliados com maior confiança.

 

Bibliografia

BORBA, Francisco S. Uma gramática de valências para o português. São Paulo: Ática, 1996.

CANÇADO, Márcia. “Um estatuto teórico para os papéis temáticos”. In: A. Müller, E. Negrão & M. J. Foltran (orgs.). Semântica Formal. São Paulo: Contexto, 2003.

Corpus do NILC: http://acdc.linguateca.pt


 

[1] Acredito que o que defina “propriamente” um adjetivo seja a propriedade semântica da qualificação. Considero que os demais tipos de adjetivos (classificadores e eventos) façam parte do âmbito dos adjetivos basicamente por eles possuírem marcas morfológicas que os diferenciam das classes gramaticais que os originam (substantivo e verbo). Sempre lembrando que esse é um trabalho de enfoque sintático, portanto somente distingui três classes de adjetivo porque será essa divisão importante para as análises sintáticas posteriores.

[2] Essa decisão parece importante para feitura do dicionário eletrônico que acompanharia o corretor gramatical.

[3] Essa posição mostra a urgência de se aperfeiçoar as regras de ligação entre adjetivo e substantivo no corretor gramatical eletrônico, pois boa parte dos exemplos absolutamente normais que mostro a seguir foi considerada errada pelo corretor do editor que uso.

[4] Uma hipótese para as possibilidades ou não de formar passivas se encontram em Cançado (2003).