AS UNIDADES LEXEMÁTICAS
Sílvio Edmundo Elia
1. O lingüista suíço Ferdinand de Saussure, no seu
Curso de Lingüística Geral (póstumo, como se sabe, e
redigido por dois colegas da Universidade de Genebra, Charles Bally e Albert
Sechehaye , com a colaboração de Albert Riedlinger,
“maître ao Collège de Genève”, 1a ed. 1916; S.
falecera em 1913). Ao se ocupar com o que se viria a chamar “análise
estrutural das línguas”, e partindo do princípio de que “dans
une état de langue, tout repos sur des rapports” , distingue entre
dois tipos fundamentais de relações, que “correspondent à
deux formes de notre activité mentale” , as quais denominou
relações sintagmáticas e relações associativas.
Posteriormente, o lingüista dinamarquês, Luís Hjelmslev,
criador de uma teoria estruturalista que se queria de bases puramente formais,
a Glossemática, apadrinhou esses dois tipos de relações,
mas às segundas preferiu chamar relações paradigmáticas,
inovação que acabou por predominar. Relações
paradigmáticas e sintagmáticas passaram então
a integrar o campo da análise estrutural das línguas.
2. Um tanto sumariamente poder-se-á dizer que o ofício
do lingüista afiliado à corrente estruturalista consiste em
depreender as unidades mínimas do nível de cada língua
(paradigmática) para depois combiná-las entre si, segundo
regras que viabilizem a construção de frases (oratio, sentença),
portadores de sentido (sintagmática). A primeira dá o código,
a segunda a mensagem.
Essa rede de oposições atravessa todos os níveis
da linguagem: o fônico, o gramatical e o lexical. As unidades mínimas
correspondentes a cada um deles são, respectivamente, o fonema,
o morfema e o lexema. E as disciplinas que as estudam a Fonologia, a Morfologia
e a Lexologia, cada uma com seus ramos paradigmático e sintagmático,
a saber: Fonêmica (paradig.) e Fonotática (sint.); Morfêmica
e Morfotática; Lexêmica e Lexotática. A presente comunicação
se situa no âmbito da Lexologia.
3. Acabamos de dizer que a Lexologia se desdobra em Lexêmica
e Lexotática . A Lexêmica se ocupa com a depreensão
de unidades mínimas de cada um dos estratos e a Lexotática
, com as suas combinações.
A unidade mínima da Fonêmica é o fonema, a da Morfêmica,
o morfema e a da Lexêmica, o lexema. Morfema e lexema são
unidades significativas, ao passo que o fonema é unidade não-significativa.
Não-significativa, não, porém, assignificativa,
pois na linguagem tudo é significação; o fonema não
significa por si mesmo, mas tem por função distinguir significações
(cf. os pares opositivos pomba/bomba, tia/dia, saca/saga, por. ex.).
O morfema tem significação interna ou gramatical; isto
é, pertence ao sistema e não ao mundo interior; por isso
o seu número é limitado, ao passo que o universo das palavras
lexemáticas é praticamente ilimitado.
A palavra é uma unidade significativa, mas a sua significação
não é só lexemática, pode também ser
morfemática, isto é, gramatical. O lexema, ao contrário,
tem significação externa ou referencial. A sua referência
pode ser a coisas concretas ou abstratas
Conforme conhecida classificação de Bloomfield, as unidades
significativas mínimas ou se apresentam como formas livres ou como
formas presas. As formas livres ocorrem isoladamente; as formas presas,
ao revés, pressupõem sempre uma forma livre à qual
se ligam. A palavra pode então ser definida como unidade significativa
livre. Livre, não, porém, mínima. Já dissemos
que a palavra pode ter significação lexemática ou
morfemática, isto é, ou referencial ou gramatical. Neste
último caso a palavra é tida como uma das possíveis
formas de morfemas, ou seja o chamado morfema vocabular, também
conhecido como palavra gramatical. Mattoso Câmara Jr. Prefere, em
vez de “palavra gramatical”, a expressão “vocábulo gramatical”
, porque, na sua ótica, a palavra deve ter sempre significação
lexemática (ou, na nomenclatura que adota, valor semântico,
isto é, de um semantema). Usaremos indiferentemente palavra ou vocábulo
gramatical. São exemplos de palavras gramaticais os artigos, as
preposições, as conjunções. Estudam-se na Gramática
e são em número limitado; já as palavras lexemáticas,
ou referenciais, constituem a maior parte do léxico de uma língua
e são de número indeterminado; encontram-se nos dicionários.
Isso resulta de que, por refletirem as constantes mutações
por que passam as coletividades humanas (lembrem-se aqui os grandes progressos
tecnológicos alcançados neste expirante século XX,
sempre surgem novas criações no acervo lexical dos idiomas
(neologismos).
4. Cabe observar não haver fronteiras estanques entre palavras
lexemáticas e as palavras morfemáticas. No decorrer
da história das línguas, as palavras lexemáticas podem
converter-se em morfemáticas ou até em simples morfemas presos.
É, p. ex., o caso dos chamados “verbos auxiliares”. Na conjugação
verbal portuguesa, p. ex., aparece o verbo Ter com a função
de auxiliar na formação dos “tempos compostos”: tenho cantado,
tinha cantado, terei cantado, tenha cantado... Ter provém do latim
tenere, onde significa “sustentar, segurar, possuir”. Foi esta última
acepção que passou às línguas românicas:
ex. “Tenho quatro canetas”. Mas esse sentido pleno ou lexemático
foi-se esvaziando quando passou a integrar a conjugação dos
verbos e o verbo ter passou a constituir com o verbo principal uma nova
forma verbal. Destarte, em ptg., criou-se o sintagma tenho cantado, dito
“presente continuado”, ao lado das demais formas, ditas “perfeitas” como
terei cantado, “futuro perfeito”, isto é “acabado”. Note-se que
nas línguas românicas (mesmo em galego, onde o uso normal
é o das formas simples) não existe o valor continuado próprio
do português. O que prevaleceu foi o auxiliar habere “ter, possuir”
e não tenere; habere mais particípio passado convergiu sempre
num tempo perfeito: esp. he cantado, fr. j’ai chanté, it. ho cantato,
rom. am cântat, mas port. cantei.
Outro exemplo é o do verbo ir, usado nas formas ditas periféricas,
para indicar começo de ação futura, como em vou chorar,
onde o sentido próprio de ir: “deslocar-se de um ponto para outro”
está apagado, para ceder lugar ao de um morfema de natureza aspectual.
Quanto a chegar à condição de morfema preso, o
caso talvez mais frisante seja o dos futuros românicos. A princípio
(latim vulgar) duas palavras cantare habeo , acabaram por fundir-se numa
só, passando as flexões de habeo a incorporar-se ao tomado
verbo principal, tornando-se assim mera flexão verbal: ptg. cantarei,
esp. cantaré, fr. chanterai, it. canterò. Em romeno, como
em inglês, o futuro é sempre analítico, funcionando
como auxiliares os verbos a voi “querer” ou a avea “ter de”. O português,
ainda hoje, traço arcaizante, permite, nos futuros de indicativo,
que as formas verbais de habeo se desmembrem do infinitivo do verbo principal;
é a chamada tmese. Ex.: amar-te-ei, amar-te-ia.
Relembre-se que, ainda em 1885, Gonçalves Viana e Vasconcelos
Abreu, distinguindo entre “perífrase consciente” e “perífrase
inconsciente”, recomendavam a grafia descrevê-lo hei para o futuro-do-presente,
mas descrevê-lo-ia para o futuro-do-pretérito, porque acreditavam
persistir no sentimento da língua de certo modo a existência
de um verbo haver embutido na forma futura do presente, o que não
se daria em descrevê-lo-ia.
Exemplo bastante conhecido é o do sufixo adverbial –mente, na
origem o subst. Latino mens, -entis “a mente, o espírito”, que no
ptg. arc., ainda podia ocorrer em duas palavras separadas. Mesmo no ptg.
atual essa separação pode dar-se, ainda que indiretamente,
quando o sufixo se prende a dois adjetivos sucessivos como em “caminhava
lenta e silenciosamente”. Note-se que, ainda hoje, o adjetivo, que funciona
como palavra primitiva, vai para o gên. feminino para concordar com
o substantivo mente. A esse processo de passagem de um lexema a morfema,
dá-se o nome de “gramaticalização”.
5. De passagem, já nos referimos ao conceito de “palavra”. Vamos
agora voltar ao ponto para melhor precisá-lo.
Como se sabe, o termo palavra tem gerado um monte de definições.
A razão está em que alguns se detêm no aspecto fônico
(quando se trata, p. ex. , de sua delimitação), outros, no
morfológico (palavras simples e compostas), outros ainda, no semântico
(por que ? ou porque ?). Existem até definições que
poderíamos chamar “desesperadas”, como a ortográfica, que
ensina que a palavra “é um conjunto de letras separado de outros
conjuntos de letras por espaços em branco”. Ou a intuitiva de Gauger
(V. “Determination und Determinans im abgleiten Wort”, em Festschr, H.
Marchand), segundo a qual é a consciência do sujeito falante
quem determina a existência da palavra como unidade semântica
discreta.
Para Martinet (Eléments: 1967: 114), a palavra é “um
sintagma formado de monemas não separáveis”. Mais antiga
e famosa é a definição de Meillet (Linguistique Historique
et Linguistique Générale, I: 1926: 30): “Uma palavra é
definida pela associação de um dado sentido a um dado conjunto
de sons susceptível de um dado emprego gramatical”. Quer dizer,
Meillet reuniu na definição as três faxes da palavra:
a fônica, a semântica e a gramatical.
6. Apesar de mais antiga, cremos que ainda é a melhor definição.
De fato, a palavra, como tudo que é lingüístico, tem
de ter uma base vocal, no caso um segmento fônico; também
como tudo que é lingüístico, tem que ser portadora de
uma significação; finalmente há que exercer qualquer
função no enunciado, pois as línguas são sistemas
de unidades funcionais. Apenas, si parva licet, acrescentaríamos
algo que a tornasse menos vulnerável e assim poderíamos tê-la:
“Palavra é a menor forma livre constituída pela associação,
etc.”
Fonema, morfema, lexema são entidades abstraídas
de suas respectivas realizações fônicas, respectivamente
o fone, o morfe, a palavra. Aqui se impõe a incômoda distinção
entre palavra e vocábulo. Geralmente se ensina que o vocábulo
é simplesmente o espaço fônico da palavra, ou seja,
a sua realização no enunciado ou discurso. P. ex. , a seguinte
frase : “Um grande homem não é necessariamente um homem grande
conteria nove palavras mas somente oito vocábulos, porque o mesmo
segmento fônico (/grande/) ocorre duas vezes. Dubois et alii, em
seu prestimoso Dictionnaire de Linguistique relembram que, no poema épico
espanhol El Cid, contam-se 16.690 palavras, mas somente 1.518 vocábulos.
7. Cabe aqui a introdução de um termo novo: lexia.
A lexia, termo que se deve ao lingüista francês Bernard
Pottier, é nome geral para qualquer unidade lexemática
. A menor unidade lexemática é a palavra, que Pottier denomina
lexia simples. A lexia simples se combina com outras lexias simples para
formar novas unidades lexemáticas: a lexia composta (correntemente
palavra composta), que Pottier define como resultado de uma integração
semântica e exemplifica com o fr. tire-bouchons (ptg. saca-rolhas)
e a lexia complexa, entendida como uma seqüência de palavras
em via de lexicalização, em graus diversos. Cabem aqui certas
expressões que assumem o caráter de palavra composta, como
guerra fria ou mesmo já como locução (B. exemplifica
com o fr. bel et bien). No referente à lexia composta , B. também
assim considera as palavras derivadas ou as compostas por prefixação
e exemplifica com fourchette e remanier. Preferimos incluir as palavras
derivadas por sufixação ou compostas por prefixação
(derivadas por prefixação, segundo Said Ali) como novas palavras,
pois contêm apenas um lexema.
8. Outro termo que também se impõe à nossa atenção
é o de sintagma, como se sabe introduzido por F. de Saussure, que
define (Cours, 1931: 170) como “relação que as palavras contraem
entre si, em virtude do caráter linear do significante”. Portanto
a depreensão das unidades lexemáticas é assunto próprio
da Sintagmática. Em nosso caso, mais restritamente da Lexotática.
André Martinet distingue entre sintagma e sintema, termo por
ele criado. Sintagma, diz-nos, é “toda e qualquer combinação
de monemas”. O sintema distingue-se do sintagma por ser esta constituído
de monemas livres, ao passo que o sintema é formado por monemas
“conjuntos”. Monemas conjuntos são os constitutivos da palavra composta
ou derivada. Então sem-vergonha é um sintema e sem chapéu,
um sintagma.
Outro termo novo no capítulo é sinápsia, criado
pelo lingüista francês Emile Benveniste.
Benveniste distingue entre compostos, conglomerados e sinápsias.
“Há composição quando dois termos identificáveis
para o locutor se conjugam numa unidade nova dotada de significado único
e constante” (p. 171). B. exemplifica com centímetro, palmípede,
telégrafo (traduzimos os exemplos). Há casos em que o sentimento
da composição desaparece. Podemos exemplificar em português
com fidalgo; nessa hipótese deixa de haver composição.
B. chama conglomerados “unidades novas formadas por sintagmas complexos
constituídas de mais de dois elementos” (ib.).
Pelos mesmos dados, ou se trata das lexias fixas, de Pottier
(meurt-de-faim, décrochez-moi-ça) ou de casos de aglutinação
(désormais = dès or mais).corresponde Sinápsia
corresponde à lexia semifixa, de Pottier.
9. Parece-nos, contudo, que se pode trabalhar sem essas novidades
terminológicas. Eis o que modestamente propomos para concluir.
Adotaremos o termo lexia como denominação geral das unidades
lexemáticas.
A lexia pode ser vocabular ou fraseológica. A lexia vocabular
pode constar de uma palavra simples (a lexia simples, de Pottier), ou de
uma palavra derivada (lato sensu). A lexia simples é monolexemática,
isto é, contém um só lexema: o radical ou tema; a
palavra derivada também é monolexemática (contém
somente um tema ou radical) acrescido porém de um afixo (prefixo
ou sufixo, ou ambos). Ex.: velho (lexia simples; palavra), revelho (lexia
derivada; radical + prefixo), velhice (lexia derivada; radical + sufixo),
envelhecer (lexia duplamente derivada ou parassintética; radical
+ prefixo + sufixo).
As lexias fraseológicas são polilexemáticas,
isto é, contêm mais de um tema ou radical. Resultam de uma
associação de palavras, que, em virtude de seu uso constante
na língua, acabam por se transformar em construções
fixas. Acham-se, pois, num processo de lexicalização semântica,
vale dizer, de, numa forma múltipla, adquirirem significado único,
Podem ir da aglutinação à locução. No
caso da aglutinação, se desaparecer o sentimento de composição
(lato sensu), como em fidalgo, o melhor é considerar o vocábulo
uma lexia simples; mas, se sobrevive o sentimento da composição,
como em planalto ou aguardente, a preferência deve ser no sentido
de lexia fraseológica.
Entre a aglutinação e a locução, se situa
a lexia composta. Consiste esta em pôr lado a lado duas lexias simples
ou derivadas, ligadas pela significação. Escrevem-se simplesmente
justapostas ou separadas por um hífen, segundo regras ortográficas
um tanto caprichosas. Exemplos não faltam: auriverde, vaivém,
rubronegro, malmequer, beija-flor, caneta-tinteiro, porta-bandeira...
Nas locuções sempre intervém uma palavra de relação;
o uso do hífen também depende de regras ortográficas.
Ex.: ferro de engomar, imposto de renda, bife à milanesa, pé-de-moleque,
olho-de-boi, rosa-dos-ventos.
Há um quarto caso de lexias fraseológicas, o de formação
de sintagmas, que passam a ter significação específica
e corrente, mas cuja institucionalização na língua
fica dependente de fatores de ordem social imprevisíveis. São
constituídos de palavras graficamente separadas ou relacionadas
por morfemas vocabulares. Exs.: guerra fria, testa coroada, canto do cisne,
galinho de briga, jovem guarda, dar bola e muitos outros. Poderíamos
chamá-los lexias semifixas.
10. O que fica dito pode ser resumido no seguinte quadro:
palavras radicais (mar)
monolexemáticas Simples
palavras derivadas (marinho)
Lexias
aglutinação (aguardente)
Fixas justaposição (malmequer,
beija-flor)
locução (rosa-dos-ventos)
polilexemáticas Fraseológicas
justapostas (guerra fria)
lexias complexas Semifixas
locucionais (bola de neve)
Obs.: As lexias semifixas tendem a fixar-se, se deixam de permitir intercalação
de elementos vocabulares. As lexias semifixas são as sinápsias
de Benveniste. O importante é a unidade de significação.
Assim valet de chambre é sinápsia, mas coin de chambre não
o é.