O LÉXICO ROMÂNICO
HERANÇA LATINA NAS LÍNGUAS OCIDENTAIS

Bruno Fregni Bassetto (USP e ABF)

Léxico é o conjunto de todas as palavras pertencentes de alguma forma a um idioma, passíveis de serem empregadas em seus vários níveis lingüísticos. O léxico constitui um inventário aberto, em parte mutável por representar a Weltanschauung, a visão do mundo e a cultura do povo que o usa. Essa mutabilidade, porém, observa-se mais nas palavras ditas de significação externa, como substantivos, adjetivos e verbos, que nas de significação interna, tais como advérbios, preposições e conjunções, cujo inventário é geralmente fechado. As mudanças léxicas acompanham as alterações sociais, econômicas, políticas e culturais da comunidade, conforme atestam os resultados da aplicação dos métodos da Geografia Lingüística, Wörter und Sachen, Onomasiologia e mesmo o Histórico-Comparativo. Modificações sociais mais rápidas aceleram também as do léxico, conforme se verificou no século XX e no nosso com a rápida evolução tecnológica e seus numerosos neologismos. Contudo, uma parte considerável do tesouro vocabular de uma língua resiste às mudanças quase tanto como sua gramática, conforme se verifica nas línguas românicas em relação a seu léxico fundamental, herdado do latim.

Um estudo mais aprofundado do léxico deve ter, como ponto de partida, o conhecimento da etimologia ou mesmo da biografia da palavra, segundo recomendava Kurt Baldinger. Desse modo, será possível conhecer sua origem, suas modificações semânticas por ampliação ou restrição, além das relações entre linguagem e cultura. Importa ainda relacionar a história interna com a externa, ter presente a importância do substrato, do superstrato e do adstrato, pois é no léxico que a influência desses diversos estratos é mais atuante e sensível. Esse inter-relacionamento explica os diferentes empréstimos às línguas românicas, como as palavras eslavas, albanesas, turcas e húngaras no romeno, não encontradas, v. g., nas línguas da Ibéria, da mesma forma que não se usam, no romeno, os empréstimos francos ao francês. Levadas para regiões diferentes, as línguas, românicas ou de outros troncos, sofrem a inevitável influência do meio; nesse sentido, basta considerar os milhares de empréstimos tupis ao português do Brasil, em grande parte desconhecidos em Portugal e em outras regiões de fala portuguesa.

Por outro lado, dentro do próprio léxico latino das línguas românicas é conveniente distinguir os vocábulos comumente denominados herdados, semi-eruditos e eruditos. Os herdados são aqueles que provieram diretamente do latim através da fala corrente dos usuários, apresentando as mutações fonéticas e semânticas características de cada língua; esses constituem o vocabulário básico inicial. Os semi-eruditos são introduzidos na língua por via culta; ao entrarem, porém, no uso corrente, sofrem mudanças segundo os padrões e as tendências características da língua, que podem afetar tanto sua forma como seu conteúdo semântico. Os eruditos são os transportados do latim para a língua românica sem qualquer adaptação fonética e com conteúdo significativo igual ou muito semelhante ao latino. Exemplificando: lat. macula > port. mancha, através dos metaplasmos > macla (síncope da pós-tônica) > mãcla ou mancla (prolação, característica do português, que consiste na nasalação da vogal seguinte pela nasal anterior) > mancha (palatalização do grupo /-cl-/ não intervocálico > /-ch-/); semanticamente, mancha é equivalente a macula do latim. Da forma macla, sem prolação (/-cl-/ intervocálico > /-lh-/), do fr. maille ou do prov. malha, proveio malha, com vários significados relacionados com o primitivo latino, como em “cavalo malhado”, isto é, “manchado”. Essas duas formas são herdadas. No séc. XV, o uso popular da forma latina macula resultou em mágoa, por metaplasmos diferentes em relação às duas herdadas (mancha e malha) devido à época diversa: macula > magula (sonorização da surda intervocálica /-c-/ > /-g-/) > magua > mágoa (síncope do /-l-/ intervocálico); semanticamente, mágoa entende-se como uma espécie de “mancha” no espírito de quem sofreu agravo ou decepção. Essa forma é considerada semi-erudita. Por fim, com o Renascimento, introduziu-se a forma erudita macula, sem qualquer modificação fonética; apenas o uso restringiu seu significado a “mancha moral”, enquanto “mancha” apresenta um significado mais amplo. Nesse contexto, percebe-se claramente a presença constante do denominado “adstrato permanente” do latim, primeiramente clássico e depois eclesiástico e medieval, como fonte de empréstimos léxicos às línguas românicas e também não românicas, até nossos dias. Por isso convém examinar, ainda que resumidamente, esses aspectos.

1. Consideram-se herdadas, portanto, as palavras transmitidas às línguas românicas diretamente do latim vulgar pelo falar do povo. Incluem-se nesse rol também as palavras não latinas (pré-românicas, gregas, germânicas, eslavas, ibéricas etc.) que o latim vulgar havia assimilado, v. g., gr. pevtra > lat. petra (que substituiu totalmente lat. lapis), base de todos os correspondentes românicos. Estatisticamente, segundo levantamento de A. Graur, em que foram consideradas apenas as formas simples, não sendo computadas as derivadas e as compostas, dos 6700 vocábulos latinos do REW (Romanisches Etymologisches Wörterbuch), cerca de 1300 são panromânicos (20%), 3900 foram herdados por algumas línguas românicas (60%) e 1500 (20%) por apenas uma. A mesma obra registra ainda 1621 empréstimos no latim vulgar de línguas estrangeiras, dos quais 25 são ibéricos, 70 bascas, 780 gregas, 746 de várias origens: celtas, lígures ou simplesmente “pré-românicas” quando a origem é incerta. Esse inventário, Manual, vol. II, p. 101), o autor não incluiu os empréstimos ilíricos e trácios, encontrados no romeno e no dalmático, e que não é clara a cronologia dos empréstimos gregos, desde os tempos da Magna Grécia. De qualquer forma, os dados mostram a permeabilidade do latim vulgar a empréstimos. Cumpre lembrar que o léxico do latim vulgar nunca será totalmente recuperado, uma vez que se trata de uma língua eminentemente falada, cujas fontes são incompletas e incoerentes. Por isso, os dados sobre o vocabulário herdado românico são relativos e aproximados.

Entretanto, é latino o fundo específico do léxico românico, abrangendo particularmente as palavras que indicam ações comuns e necessárias, objetos de uso constante, partes do corpo, moradia e seus componentes, parentesco, entre outros, embora não haja coincidência formal e semântica senão bastante relativa. São também de origem latina os adjetivos mais comuns, os numerais, o sistema pronominal, a conjugação verbal, os principais advérbios, as preposições e as conjunções. Em relação ao latim literário, porém, como observou Therodoro Henrique Maurer (Gramática do Latim Vulgar, p. 232), muitas palavras correntes no latim literário eram desconhecidas ao vulgar, enquanto outras persistiram na língua falada, como arcaísmos, não se encontrando mais na língua escrita.. Desse modo, explicar-se-iam as palavras isoladas em algumas variedades românicas. Por outro lado, o adstrato permanente do latim eclesiástico e medieval, continuador do latim literário, subministrou os empréstimos posteriores, muitas vezes com significado diverso do herdado correspondente.

2. Termos eruditos ou de caráter poético eram certamente desconhecidos no latim vulgar, como aequor, audere, cruor, crus, entre muitos outros. Apesar de seu conteúdo semântico concreto, desapareceram da língua popular ou nunca lhe pertenceram. Faltaram-lhe também termos abstratos, culturais e os de caráter genérico, fato comprovado pelas formas eruditas e foneticamente fora dos padrões evolutivos normais naqueles poucos encontrados, denunciando introdução posterior, sem dúvida de cima para baixo, isto é, da forma culta para a popular.

Parte do léxico foi sendo substituída com o tempo, da qual restaram apenas vestígios nas diversas regiões da România. Freqüentemente, porém, os correspondentes românicos assumiram outra acepção, seja por polissemia ou metáfora, seja por analogia. Contudo, tais alterações mantêm sempre alguma relação semântica com a base latina, embora nem sempre visível de modo imediato. Considerem-se, por exemplo, lat. raptus, “arrebatado” ou “rapto” e cast. rato, “instante”, cujo ponto de convergência é certamente a idéia de “rapidez”; ou innocuus, “inofensivo”, e log. innokidu, “tolo”, em que a inoperância ou o alheamento aparente ou real do que é inofensivo rupes, “rochedo”, e mác. –rom. arup, “abismo”, em que o elemento rochoso geralmente se faz presente. Em todo caso, o meio ambiente e a cultura são elementos que influem nas alterações semânticas, uma vez que a língua em geral e o léxico em particular são reflexos da cultura.

3. Por outro lado, o latim vulgar utilizava palavras desconhecidas ou raras no literário. Levando-se em conta o fato de o latim vulgar ter sido uma variante eminentemente falada, sem dúvida muitas se perderam, sem deixar traços nas línguas românicas. Há casos de ampliação ou de restrição semântica, de substituição total ou parcial, inclusive por locução, como em bassus por humilis, bellus por pulcher, bilancia (ocid.) por libra, bucca (gura e rostrum) por os, bucina por tuba, caballus por equus, capsa por arca, por onerare, casa por domus, causa (ocid.) por res, comparare por emere, corrigia por lorum, coxa por fêmur, (de)gannare por deludere, ficatum por iecur, filare por nere, “fiar”, “tecer”, grandis por magnus, grossus por crassus, gula por fauces, hiberno tempore por hiems, longo (multo) tempore por diu, infirmus por aeger ou aegrotus, manducare (e comedere) por edere, pisinnus por parvus, plorare por flere portare por ferre, praestare por commodare, prima vera por ver, siccus por aridus, spissus por densus, taliare por caedere, testa por caput, toccare por tangere, tostare por torrere, vadere por ire, venter por alvus e muitos outros. Nota-se sempre o caráter concreto do vocabulário vulgar, como também a busca de maior audibilidade, fator importante na comunicação oral.

4. Com elementos do sistema latino, o latim vulgar criou e usou uma série de palavras não encontradas nos textos literários nem nas fontes indiretas do latim falado, mas que constituem o ponto de partida das correspondentes românicas. São as formas reconstituídas, ainda não documentadas por fonte escrita e por isso indicadas por asterisco, como no Romanisches Etymologisches Wörterbuch de Meyer-Lübke. Nessa obra básica para a Filologia Românica foi feito levantamento para comprovar a criatividade do latim vulgar e sua importância para o conhecimento do léxico românico. Não foram elencadas as palavras que se arcaizaram, as que designam algo regional específico, técnico ou rural e as provenientes de empréstimos de qualquer origem. Foi dada preferência a termos comuns e usuais nas línguas românicas. Esse levantamento restringiu-se a cerca de 120 palavras, das quais seguem apenas alguns exemplos: abbiberare, “abeberar”, (lit. aculeus), “aguilhão”, alapa, “aba”; alleviare, “aliviar”; alluminare, “alumiar”; altiare, “alçar”; amicitas, “amizade”; apparescere, “aparecer”, burrula, “borda”; caesellum, “cinzel”; cepulla, “cebola”; costatum, “costado”; crassia, “graxa”; excappare, “escapar”; excarnare, “escarnar”; exmagare, “esmagar”; extravagare, “estragar”; fallia, “falha”; figicare, “ficar” e “fincar”; fortia, “força”; fortiare, “forçar”; imbuccare, “embocar”; ingannare, “enganar”; insignare, “ensinar”; lusciniolus, “rouxinol” (< prov. rosinhol); maneana, “manhã”; mantaica, “manteiga”; mordacia, “mordaça”; muscus, “musgo”; natica, “nádega”; novius, “noivo”; palumbus, “pombo”; parescere, “parecer”; pariare, “pairar”; passare, “passar”; pettia, “peça”; piliare, “pilhar”; pottus, “pote” (< prov. pot); pugnale, ”punhal”; putatoria, “remolere, “remoer”, remolinare, “remoinhar”; remussicare, “resmungar”; ruptiare, “roçar”; sappus, “sapo”; sessicare, “socegar”; sucidus. “sujo”; superculus, “sobejo”; tardivus, “tardio”; tegella, “tigela”; tirare, “tirar”; to(n)sare, “tosar”; traginare, “treinar”; tribulare, “trilhar”; truncus, “tronco”; truppicare, “tropicar”; tuscus, “tosco”; usare, “usar”; vagativus, “vadio” (só port.); veranum (tempus), “verão; voltare, “voltar”, além de outros comentados mais abaixo.

Um exame desses exemplos do léxico do latim vulgar confirma as características do latim falado. O caráter mais simples do latim vulgar se manifesta na redução das declinações, pois nesse pequeno corpus é total a ausência de palavras da 4ª e da 5ª declinações. Mesmo a rica e importante 3ª está pouco representada: amicitas (amicitatem > port. amizade, cast. ant. amizad, mod. amistad, cat. e prov. amistad, fr. amitié, eng. mustet, it. amistà) e acúleo, cujo sufixo bem popular, mais visível no acusativo , geralmente tem caráter depreciativo. Os verbos depoentes da norma literária são substituídos por formas regulares: uti por usare, imitari por (de)imitare, scrutor por scrutiniare; da 4ª conjugação há apenas florire (florere, 2ª conj. clássica), panromânico, menos port. e cast. que têm o incoativo florescer. Aliás, a forma incoativa, característica de boa parte dos verbos da 2ª conjugação românica, está também em parescere e apparescere É notável que a grande maioria dos verbos pertence à 1ª conjugação, a mais simples e regular, característica dos verbos românicos. Da 2ª há apenas remolere, de conteúdo bem popular.

O analitismo do latim vulgar no vocabulário é patente em veranum (tempus), “verão”, originariamente um adjetivo. Um rápido exame do conteúdo significativo dos termos selecionados mostra seu caráter eminentemente concreto, designando ações do cotidiano, objetos de uso comum, elementos da fauna e da flora, emoções; nada de abstrações. A expressividade se manifesta nos diminutivos, nem sempre com correspondentes literários: aviolus por avus, caesellum por caelum, cepulla por caepa (cepa), molinum por mola, natica por nates (gen. natium), supercullus, tegella. Numerosas são também as geminações expressivas, freqüentemente sem fundamentação etimológica: excappare, ingannare, muccus, pettia, puttus, pullitus, sappus, subgluttiare, truppicare. A verificação desses fatos característicos ajuda a entender a natureza do léxico românico.

6. As fontes do latim vulgar, sobretudo as inscrições, constituem importante ponto de referência para o conhecimento do léxico românico, sobretudo em relação às mutações do latim vulgar mais antigo. Sendo datáveis e localizáveis com relativa segurança, fornecem dados dificilmente encontráveis em outras fontes escritas. Nessa perspectiva, Meyer-Lübke, W. von Wartburg, G. Rohlfs, Väänänen, entre tantos outros, apresentam valiosos subsídios. Dada a grande extensão do léxico românico, vejamos apenas dois exemplos bem esclarecedores da criatividade românica: o campo semântico de esquecer. O latim literário tinha o depoente obliviscor, oblitus sum, oblivisci, cujo correspondente vulgar não depoente obliscere está documentado no papiro 304 do CPL (Cavenaile) e substituído no latim tardio por oblitare, que os gramáticos latinos considerariam um verbo freqüentativo. Derivado do particípio oblitus como tantos outros (como ausare, jactare, junctare, pictare, tutare, unctare, usare) foi previsivelmente incorporado à primeira conjugação, mais homogênea e de uso mais fácil. De oblitare > cast. olvidar, cat. oblidar, prov. oblidà (< ant. oblidar, além de emblidar e omblidarn <* inoblitare), fr. oublier, rét. emblidar (< *inoblitare), rom. uita. Na Península Ibérica, excadescere, “cair das mãos”, usado metaforicamente como “cair para fora da mente”, deu port. e gal. esquecer, ast. escaecer, cast. ant. escaecer, log.. scarésciri (< cast. escaecer, além de olvidare e orvidare no log. literário). Partindo de mens e cor, a Itália cunhou o neologismo bem popular *exmenticare, com as variantes *dementicare e *deexmenticare, e *excordare; no norte italiano e na Toscana há desmentegá > it. lit. dimenticare, > nuor. ismentigare, cors. smenstigá e sminticá; no centro e no sul a forma dominante é scordare. Note-se ainda a forma desmembrar < *deexmemorare, corrente em algumas regiões do sul da França. Em todas essas formas percebe-se o ponto de partida concreto para expressar algo em si abstrato.

Embora de uso muito freqüente, as formas do verbo ire eram curtas demais, com escassa perceptibilidade dentro do fluxo frasal; além disso, no latim vulgar encontram-se homonímias, como eo < ego, “eu”, e eo “eu vou”, it, “ele vai” e id, “isto”, além de numerosas flexões nominais e verbais passíveis de sugerirem homonímia. Mesmo assim logrou manter algumas de suas formas com o auxílio de vadere, “ir”, “caminhar”; desde os séc. IV e V, os textos latinos apresentam as seguintes formas para o presente do indicativo: vado, vadis, vadit, imus, itis, vadunt (port. vou, vais, vai, imos ou vamos, ides, vão). Note-se que na Vulgata não se encontram is, it nem o imperativo i, substituído por vade (181 ocorrências), mas o plural ite é usado 68 vezes, fato que confirma a fuga da homonímia. Da mesma forma, nenhuma forma monossilábica se encontra na Peregrinatio. As formas resultantes das combinações desses dois verbos permanecem nas línguas da Ibéria, no rético dolomítico (central) e nos falares italianos das Marcas até a Sicília (vai, vai, va, imu, iti, vanu). Nas outras regiões, o quadro românico dos substitutos de ire é complexo. Pode-se supor que, ao lado de ambulare, “passear”, “caminhar”, usa-se também annare, “passar o ano”, figuradamente com o sentido de ire. Partindo-se de annare, chega-se regularmente ao cat. e prov. anar. De ambitare, “rodear”, “ir”, de ambitus, “circunferência”, “circuito”, já no lat. vulg. admite-se *andare (ambitare > ambidare > ambdare > andare), donde port., cast. andar, log. e it. andare. Pelo cruzamento com ambulare teriam surgido *amnare ou *ambnare e *allare, bases do mac. –rom. îmnare, megl. –rom. amnari e fr. aller. De ambulare, com poucas modificações, provieram fr. ambler, istr. amble, rom. umbla. O romeno adaptou semanticamente também mergere, “mergulhar”, “submergir”, > merge, “ir”; da mesma forma, ducere, “conduzir”, > duce, em expressões como eu ma( duc, “vou embora”. Em português, mandar-se é usado nesse sentido. Esse campo semântico mostra como as ampliações e as restrições semânticas se fazem com muita facilidade. A partir de um sema comum, no caso o de “movimento”, “deslocamento”, a língua passa a utilizar as palavras para expressar idéias aparentemente não relacionadas; um exame atento descobre o caminho seguido. Outro exemplo interessante de que o léxico é um registro das atividades humanas encontra-se nas expressões românicas para “chegar”. Em latim, essa idéia era expressa por advenire, que figuradamente significava também “suceder”, “acontecer”, passando da idéia concreta de espaço para a abstrata de tempo, como em Periculum advenit e Dies advenit. Isso facilitou o aparecimento de várias expressões, dentre as quais se destaca plicare, “dobrar”. Usava-se em linguagem náutica na expressão plicare vela, “dobrar as velas (do navio)” à aproximação da chegada ao porto, com que se obtinha que o navio atracasse mais lentamente. Por braquissemia, dizia-se apenas plicare, logo com o significado de “chegar” (plicare > plegar > port. chegar, cast. llegar, com a sonorização da surda intervocálica e a palatalização para a chiante em português e para a lateral no castelhano). Já na Peregrinatio Aetheriae, plicare significa “chegar” sem ligações com a linguagem náutica: “cum iam prope plicarent civitati” (10,9); “ut plecaremus nos ad montem” (38,11). Fora da Península Ibérica, plicare passou a significar “chegar” numa região da Sicília, “chicari” e ao sul da Calábria, chiicari. Na Dácia, plicare era empregado na expressão plicare tentoria, “dobrar as tendas” e plicare sarcinam, “dobrar a mochila”, na linguagem militar, com que se indicava a hora de “partir”, ao se desmontar o acampamento; daí, plicare > rom. pleca passou a significar “partir”, ao contrário do que se deu na Ibéria. Note-se ainda que o romeno é a única língua românica que conserva o termo sarcina(, ”mochila”. Contudo, o romeno conserva também pleca no sentido etimológico de “dobrar”, “inclinar”, “curvar”. No latim literário, ocorrem expressões com o composto applicare ou applicari com significado próximo a plicare, “chegar”, como em applicare se ad flammam, “achegar-se ao fogo”, em Cícero, e naves terrae (e ad terram) applicare, “chegar os navios à terra”, se ad arborem applicare, “encostar-se a uma árvore”, em César e Tito Lívio. De applicare provém sic. e cal. agghiicari, também “chegar”. Outro substituto de advenire é adripare, (< ad + rip(a) + are), “aproximar da margem”, de possível procedência das populações litorâneas; por sua evolução fonética pode-se concluir que surgiu na Gália e difundiu-se em outras regiões: fr. arriver, prov. arribar, cat. arribar, (> sard. arribare), it. arrivare, ingl. arrive. No português, arribar, “chegar à riba”, “aportar”, já é documentado no séc. XIV. No italiano, encontra-se ainda giungere, mais como um preciosismo absolutamente não popular; em certas regiões da Sicília, porém, é corrente juntari (< junctare) no sentido de “chegar”.

5. Entretanto, apenas a base latina não logra explicar a diferenciação léxica das línguas românicas. Mesmo levando-se em conta a situação privilegiada da filologia românica em relação ao conhecimento documentado do terminus a quo e do terminus ad quem, é necessário recorrer a outros meios para explicar aquela diferenciação, verificada mais no léxico do que nos aspectos fonéticos. Dentre as tentativas de explicação, destacam-se a de Gustav Gröber, com a “teoria dos substratos do latim vulgar”, a da Lingüística Espacial de Matteo Bártoli e a mais aceitável, por parecer condizente com os fatos históricos, é a posição de Gerhard Rohlfs: a diferenciação do latim em geral, e do léxico em particular, tomou impulso depois da descentralização do Império, a partir do imperador Adriano (117-138 d. C.), que foi obrigado, entre outras medidas, a retirar as legiões da Dácia. Sem os estreitos laços com Roma, a grande influência da capital perdeu força, permitindo que o latim da Ibéria, da Gália e da Dácia seguisse caminhos diferentes, fragmentando-se mais rapidamente. Sendo a língua expressão da cultura, o latim adquiriu feições mais locais, expressando novas formas de pensamento com renovação das referências metafóricas e analógicas. Com o ofuscamento de Roma, surgem novos centros irradiadores de cultura, como Mediolanum (Milão), Lugdunum (Lyon), Burdigala (Bordéus), Caesaraugusta (Zaragoza), Augusta Emérita. Posteriormente, a criação das circunscrições diocesanas eclesiásticas, que de modo geral respeitavam as antigas bases étnicas e provinciais romanas, fez surgir novos centros de irradiação, cujo exemplo mais claro é o de Coira, atualmente Chur, para o rético.

6. Apesar dessas contingências da história externa das línguas românicas, todas herdaram do latim, ainda que em épocas diferentes, seu repertório léxico básico. Conforme a predominância política, militar ou cultural, as línguas românicas influenciam-se mutuamente ao longo dos séculos. Nesse contexto, o francês sempre se destacou como fonte de empréstimos léxicos a praticamente todas as suas irmãs e, de modo geral, a todas as línguas do Ocidente. Destaque-se, nesse contexto, a grande presença do francês como fonte de empréstimos na relatinização do romeno, na segunda metade do séc. XIX. No Renascimento, foi o italiano o maior fornecedor de empréstimos ao Ocidente, enquanto o castelhano e o português buscaram em terras distantes nas grandes navegações, nos séc. XV e XVI, termos exóticos de muitos idiomas e os introduziram no mundo românico. Contudo, as línguas em adstrato sempre se inter-influenciam. Encontram-se atualmente numerosos estudos específicos e recentes no campo dos empréstimos léxicos, reflexo da disputa com o inglês. Um exemplo esclarecedor é o trabalho de Marjolein van der Berg, L’influence néerlandaise sur , encontrado na internet, em um sítio interessante também sob outros aspectos (http://users.belgacom.net/ethesis7/influ_ned/influ_ned_inhoud). Foram levantados 208 empréstimos holandeses ao francês, no período de 1100 a 2000, aplicando os princípios estabelecidos por Michel Bréal. O maior número de empréstimos é dos séc. XI-XII, com o pico nos séc. XVIII-XIX. Desses 208, 164 (78,8%) são substantivos, 15, 4% são verbos, 4,8%, adjetivos, uma interjeição (ploc) e um advérbio de lugar (vrac, usado na locução en vrac “a granel”), perfazendo perto de 0, 5%. São analisados também os campos semânticos, denominados setores, desses empréstimos, destacando-se os termos náuticos, com quase 70%, pois os holandeses sempre foram grandes navegadores, seguindo-se os nomes de profissões, de botânica e de termos comuns. Sendo alguns muito antigos, permitem seguir-lhes a história e as alterações semânticas. Alguns exemplos, com a data da atestação: hol. boeye > fr. bouée (1375), “bóia”; bolwerk, “baluarte” > fr. boulevard (1327), “obra de defesa”; séc. XVIII > “rua larga com árvores, fazendo a volta à cidade sobre o lugar das antigas fortificações”; brikke > brique (1175), “tijolo”; cabret > cabaret (1275), “café”, no valão e no picardo, séc. XV-XVII, “lugar de reunião para beber e jogar”; séc. XIX, “estabelecimento de apresentações satíricas, teatrais etc., onde se pode beber, comer, dançar”; kringhelen, “fazer curvas”, > degringoler (1677), “despencar em quedas sucessivas”; droog, “seco”, > drogue (1690), “secado”, depois “produto farmacêutico”, “remédio tradicional” feito com ervas secas (1568), passando a significar um século depois “algo ruim de ser absorvido” ou “alguém ou algo desprezível”, e no séc. XX passou a designar as substâncias alucinógenas (1913), além de manter o significado de “ingredientes, cada uma das matérias primas da fabricação de remédios”; drol (séc. XIV), “traquinas”, > drôle, “folgado”, “debochado” (séc. XVI) > “pessoa não confiável”, “despresível” (1718); no séc. XVIII, passou a significar “criança”; em 1635, é usado como adjetivo, “divertido”, cômico”; o significado atual, “que provoca riso por sua originalidade, singularidade”, “que é anormal ou espantoso”; manneken, “homem pequeno”, > mannequin (1467), com a mesma significação: séc. XVI, “figura de madeira ou de cera”, “escultura”; a partir de 1614, “modelo numa vitrine”, além de outros; maken, “fazer”, > pic. maquier (1468), “fazer”, “fingir” na gíria, nos séc. XVII e XVIII, significava “roubar”, e também “trabalhar”; entre 1798 e 1849 voltou a significar “fazer”; no começo do séc. XIX, entre os jogadores de baralho, “falsificar a aparência de algo para enganar”; na gíria teatral, “caracterizar-se”, “produzir” (1840) e daí o sentido atual de “modificar ou embelezar certos traços do rosto”, “desnaturar”, “falsear”; mite, “espécie de moeda de cobre” > mitraille (1375), “pedaço de metal”, > “fragmentos de metal com que se carregavam os canhões” (1872), “descarga conjunta de artilharia”, “grande quantidade de bombas ou tiros”. Esses exemplos demonstram como age o adstrato, seguindo caminhos imprevisíveis, facilitados pela flexibilidade dos conteúdos semânticos. Através da forma francesa, muitos desses empréstimos passaram às outras línguas românicas e não românicas.

Esses 208 empréstimos holandeses ao francês, incorporados no decurso de quase um milênio, representam 0, 3% do léxico básico francês, constituído, segundo levantamentos recentes, por cerca de 60.000 palavras. O ponto de partida do léxico francês obviamente é o latim, com 10.590 palavras (17%), o grego com 3.785 (6, 3%), o inglês com 2.451 (4%), o .153 (2%) e outros com contribuições menores. Essas e outras informações estão no sítio http://users. belgacom. net/ethesis7/influ_ned. Tendo como ponto de partida um dicionário de uso, com cerca de 35.000 palavras, a enciclopédia Wikipedia estima em menos de 13% os empréstimos estrangeiros no francês, dos quais 1054 são ingleses, 707 italianos, 550 do antigo alemão (franco), 481 dos antigos falares galo-romanos, 215 árabes, 164 do alemão, 160 do antigo celta, 159 do espanhol, 153 do holandês (cf. os mais recentes 208 supra), 112 persas e sânscritas, 101 das línguas ameríndias, 80 de diversas línguas asiáticas, 56 de diversas línguas afro-asiáticas, 55 do eslavo e do báltico, 144 de outras línguas diversas. Por outro lado, convém lembrar que o francês é a língua oficial da França, Bélgica, Suíça, Canadá e 21 outros países e “largamente utilizada em determinado número de outros”. Uma parte das nações, que falam o francês, forma a Organisation Internationale de la Francophonie; conforme cálculos dessa Organização, o total dos falantes “reais” ou “parciais” deve atingir 183 milhões em 2005. (Cf. http://fr.wikipedia.org. /wiki/Langue_fran%C3%A7aise) Sendo falada nos cinco continentes, em ambientes naturais, culturais e de diferentes visões do mundo, é claro que haverá muito regionalismo, termos e expressões próprias para designar algo específico – tudo isso dito à maneira francesa, enriquecendo o tesouro léxico total. No sentido inverso, o francês tem sido a fonte de empréstimos léxicos para as línguas ocidentais, sobretudo para as línguas românicas, do português ao romeno, como ficou dito. Mesmo em relação ao inglês, pesquisas recentes indicam que 29% do léxico do inglês moderno são de origem francesa. No cômputo geral, ao redor de 70% do léxico inglês é de origem latina, direta ou indiretamente. Basta conferir a terminologia computacional, onde são comuns os termos buscados no latim, tais como bit, abreviação de bi(narius) t(erminus); delete, do supino de deleo, deletum, delere¸”apagar”; site fr.méd.site < lat. situs, –us, “situação”, “localização”, do verbo sinere, “colocar”, “deixar”, entre tantos outros.

Não sendo possível, devido às limitações normais deste texto, proceder a comentários sobre as características lexicais de cada uma das línguas românicas, algo semelhante ao que se apresentou em relação ao francês, julgamos de interesse alguns dados sobre o romeno, não muito conhecido entre nós. Seu léxico, porém, apresenta aspectos particularmente interessantes.

Apesar das vicissitudes históricas, especialmente os fatos de o eslavo ter sido a língua oficial do país por dois séculos (X-XI), do isolamento em relação às outras línguas românicas e ao adstrato permanente do latim eclesiástico e medieval, substituído pelo eslavo com a mesma função, o léxico romeno conservou sua feição românica. Recebeu empréstimos para as classes de inventário aberto (substantivos, adjetivos e verbos), ao passo que inexistem empréstimos nos de inventário fechado, como advérbios, preposições e conjunções, em que a herança latina é completa. Nessa avaliação, é necessário levar em conta a época em que se avalia o caráter do léxico romeno. A relatinização, iniciada em 1860, veio da classe culta, dos escritores e poetas, portanto de cima para baixo; por isso, trata-se de um processo lento, até que atingisse a população através das escolas, dos ritos religiosos e dos meios de comunicação. Destarte, o Dictionnaire d’étymologie daco-romain do moldavo Alexandru de Cihac (1825-1887), publicado em Frankfurt em 1870, analisa um total de 5765 vocábulos, dos quais apenas 1165 são de origem latina e 4600 são de outra procedência: 2361 eslavos, 965 turcos, 635 neogregos, 589 húngaros e 50 albaneses. Note-se que a relatinização efetiva do romeno mal havia sido iniciada; muitos empréstimos foram depois substituídos por termos latinos correspondentes. Além disso, como observou Carlo Tagliavini (Origini, p. 320-321), faltam na obra muitos termos de origem latina e também de outras origens, já que a língua sem dúvida contava com mais palavras do que as estudadas. Num dicionário, todas as palavras, postas no mesmo plano, têm valor apenas unitário, resultando valor estatístico bastante relativo. De fato, na língua viva a porcentagem de elementos românicos é muito mais elevada, porque são os mais usados, ficando os de outras origens, sob esse aspecto, entre 10 a 15%. Também o inglês conta com mais palavras de origem latina do que germânica, e nem por isso pode ser considerada língua latina, precisamente porque os elementos germânicos são os mais usados. Uma visão mais fiel à realidade dos fatos infere-se da análise dos dados do REW de W. von Meyerlübke, citados acima. No rateio final, cada língua românica conta com umas 2.000 palavras herdadas, sem contar as derivadas e as compostas, freqüentemente muito numerosas. Especificamente para o romeno, em 1954, A. Graur somou 857 daquele conjunto geral românico, ou 43%. Levando-se em conta as vicissitudes históricas da língua romena, a proporção é notável, tanto mais que os empréstimos se distribuem entre as diversas origens eslavas, bizantinas, turcas, húngaras, neogregas e albanesas. Contudo, a herança léxica latina é notável pelos termos do latim vulgar conservados só pelo romeno e algumas poucas encontradas também em uma ou duas outras, devendo a imensa maioria ser anterior ao fim do século III, quando o Império foi forçado a retirar suas legiões da Dácia. Tomando o REW como ponto de referência e ressaltando-se que as últimas edições incorporaram estudos de muitos especialistas (Brogea, Candrea, Diculescu, Densusianu, Pu]cariu, Papahagi, Petrovici, Procopovici, Titkin), chegou-se, através de levantamentos sistemáticos, a um número maior de palavras latinas conservadas apenas pelo romeno. Assim, Iurgu Iordan, partindo de vários levantamentos até à 3ª edição do REW, fala de cerca de 120 palavras latinas herdadas apenas pelo romeno. Os últimos levantamentos indicam 141; a continuação das pesquisas pelos etimólogos romenos indica a possibilidade de que esse número, de fato, pode aumentar. A seguir, vejamos apenas alguns dos termos latinos herdados com exclusividade pelo romeno, embora possam ter tomado outros significados: lat. aduncus, “torto” > rom. adînc, “profundo”; albaster, “esbranquiçado” > albastru, “azul”; allevatum > aluat, “fermento”; alvina, “colméia”, > albina(, “abelha”; *antaneus > întîi, “primeiro”; *biliatus > biet, “pobre”; blanditia, “adulação” > \e, “ternura”; caperare > sca(pera, “relampejar”; caucus > cauc, “concha”; cautela > ca(tinel, “suavemente”, “aos poucos”; ; circitare > cerceta, “revistar”; * combibulus > curcubeu, “arco-iris”; *cucurbitella > curcubi\ea (-ta(), “abóbora”, “cabaça”; dedare > a se dada, “entregar-se”; depilare > da(pa)ra, “arrancar os cabelos”, “desesperar”; depositum > ada(post, “abrigo”; *derapinare > da(ra(pa(na, “arruinar-se”; *diffamia > defa(ima(, ”difamação”; dormitare > durmita, “adormecer”; *escubulare > a se scuba, “levantar-se”; *experlavare > spa(la, “lavar”; exsudare > asuda, “suar”; extemperare > astîmpara, “acalmar”; floralis > florar, “abril”; *fragmentare > framînta, “quebrar”; *fulgerare > fulgera, “brilhar”; *gibbulus > gheb, “corcunda”; *hocce > oaoce, “aqui”; horrescere > uri, “odiar”; hospitium > ospa(\, “banquete”; *infolliare > înfoia, “inchar-se”; innatare > înota, “nadar”; *intemplare > întîmpla, “acontecer”; intonicare > întuneca, “escurecer”; jugulator > junghetor, “assassino”; languidus > lînced, “frouxo”, “fraco”; lingula > lingura(, “(a) colher”; manicare > mîneca, “madrugar”; mentionem > minciuna(, “mentira”; miles > mire, “soldado”; miserare > misereare (ant.), “graça”; neque unus > niciun, “nenhum”; perducere > preducea, “perfurar”; persecare > , “castigar”; pigritare > pregeta, “demorar”; placenta > pla(cinta(, “pastel folheado”; * plupea > pleoapa(, “globo do olho”; prae, “adiante”, > preá, “demais”; praedatio > pra(da(ciune, “saque”; *rapationem, “colheita de beterraba”, > ra(paciune, “setembro”; rorare > rura, “orvalhar”. “pingar”: signicare > sineca, “persignar-se”.

Dentre esses termos latinos herdados só pelo romeno, conforme registrados pelo REW, encontram-se 58 substantivos, 56 verbos, 18 adjetivos, 6 advérbios, um ordinal (întîi), um indefinido e uma interjeição, 141 no total, salvo algum lapso. Há casos em que o termo latino passa para outra classe, como o substantivo lat. cautela, “precaução” e o advérbio rom. ca(tinel, “suavemente”, “aos poucos”. Das herdadas pelo romeno e por uma ou outra língua românica, mais comumente com o dalmático, o italiano e o sardo, foram encontradas 16: 7 verbos, 4 substantivos, 4 adjetivos e 1 advérbio. Esse levantamento levou em conta apenas o aspecto formal do daco-romeno; não poucos termos, embora herdados, apresentam um significado diferente daquele do latim, v. g. lat. animus ou anima, “espírito”, > rom. inima(, “coração”, (boala( de inima(, ”doença do coração”; ba(ta(ile inimii, “batidas do coração”), enquanto “espírito” é expresso por suflet < suffletus. Registram-se ainda certo número de termos próprios em outras variantes do balcano-romance, isto é, o megleno-romeno, falado no vale do rio Meglena ao sul do Danúbio, o mácedo-romeno, encontrado na Macedônia e várias regiões adjacentes, e o ístrio-romeno, em pequenos territórios da península da Ístria, nos Bálcãs; por exemplo, lat. corbula > megl. –rom. croabla(, “cestinha”. Esses dados não deixam dúvida em relação à sólida base latina do léxico romeno, preservada apesar de todas as influências sofridas ao longo dos séculos.

As possíveis contribuições germânicas antigas ao léxico romeno são controversas. Mesmo os 26 termos gépidas, atribuídas por Gamillscheg ao romeno, podem ser de outras origens, dado a intrincada confluência de idiomas na região. Empréstimos posteriores, porém, encontram-se sobretudo na Transilvânia e no Banato; na Transilvânia, houve contato da população romena com florescentes colônias saxônicas nos séc. XII e XIII, embora alguns tenham vindo através do húngaro. No Banato, provieram de colônias suevas no séc. XVIII. Como parte do império austro-húngaro, tanto a Transilvânia, sob administração húngara, recebeu empréstimos germânicos através dos húngaros, como o Banato e a Bucovina através dos austríacos, particularmente termos técnicos e administrativos. Alguns exemplos: sax. fyrdel (al. Viertel) > rom. ferdela(, ”medida de capacidade de 20 litros”; sax. korf (al. Korb) > rom. corfa(, “cesto”; al. Strang > rom.]treang, “corda”; sax. purger (al. Bürger) > húng. ant. purgár > hung. mod. polgar > rom. pîrgar, “conselheiro municipal”; al. Lade > húng. lada ou esl. lada > rom. lada(, ”caixa”, “cofre”.

Durante todo o século passado, foi grande a influência francesa sobre o léxico romeno, levando à substituição de antigos termos, sobretudo eslavos, por termos românicos. Dados recentes sugerem que um quinto do léxico romeno provém do francês direta ou indiretamente, reforçando a relatinização do romeno, iniciada no séc. XIX.. O processo de globalização, iniciado no fim do séc. XX e aprofundado no corrente séc. XXI, sobretudo por meio da internete, que alcança diretamente muitos milhões de pessoas em todo o planeta, aumentou muito a presença da língua inglesa no mundo. O movimento de uma espécie de autodefesa do léxico da língua materna, emtra essa invasão de anglicismos, observa-se por toda parte (Alemanha, Brasil, Espanha, França, Itália). Na Romênia também se trava um constante diálogo nesse sentido em diversos sítios da internete, sobretudo entre jovens. Na página www.muntealb.com/LimbaRomana-bn.htm (atualizada em junho de 2005), Alexandru Bogdan Munteanu, no artigo Limba Româna( în Época Informaticii, “A Língua Romena na Época da Informática”, apresenta resultados do “fórum dos internautas”, em que se debatem questões lingüísticas. Depois de muita discussão, sugestões e críticas, Munteanu fixou alguns parâmetros, geralmente aceitos, que devem ser considerados no sentido de vernaculizar a terminologia da informática, tendo em vista as características do romeno e do inglês. Vale a pena refletir sobre os pontos propostos, sem dúvida, válidos para todas as línguas românicas, uma vez que visam a manter a integridade e a compreensão da língua materna. São os seguintes: a) só adotar um termo para algo novo, quando não houver correspondente romeno, ou quando não se possa criar um termo adequado com os elementos existentes no sistema; b) o termo adotado não pode ter o mesmo sentido que outro já existente na língua corrente; c) respeitar o caráter fonético da língua, de modo que se leia como se escreve, fazendo para isso as devidas adaptações, como a eliminação das consoantes geminadas e dos fonemas não pertencentes ao sistema fonológico próprio; d) levar em conta a facilidade de pronúncia, eliminando-se grupos consonânticos não tolerados; e) conservar, se possível, o mesmo gênero gramatical da língua original; f) atender às particularidades do romeno em relação à declinação, eliminando a necessidade do uso do traço de união. Essas orientações, mutatis mutandis, podem ser aplicadas a todas as línguas românicas, inclusive ao português; com isso, evitar-se-iam formas exóticas, incompreensíveis para considerável parcela da população. Eliminando-se os estrangeirismos desnecessários, preservar-se-á a integridade da língua e evitar-se-ia o ridículo, conforme já o dissera Cícero em relação ao grego. Na prática, foram propostas para o romeno na terminologia computacional, entre outras, as seguintes adaptações ou substituições, segundo os critérios mencionados: boot, “inicializar” > rom. a buta (neologismo); chip, nome comum, “cavaco”, “lasca”, rom. a]chie, já que rom. chip significa “imagem”, “rosto”; computer, rom. calculator; controller > rom. controler, pl. controlere, eliminando a necessidade do hífen no romeno, e ter origem latina: contra rotulus > fr. desde 1611; core, “caroço”, “núcleo”, rom. nucleu; driver > rom. draiver, com adaptação na grafia; hard disk, rom. hardisc, com uso dos fonemas e do processo romeno de composição; link, “elo”, “conexão”, foi romenizado pelo correspondente lega(tura(, ”conexão”, donde a lega, ”conectar” e o derivado legat, “conectado”; mouse, rom. maus, pl. mausuri, (com adaptação ortográfica e fonética, com a forma plural do neutro romeno. O Dic\ionarul Explicativ al Limbii Române, 1998, esclarece que é tocmai dispozitivul de intera\onare cu calculatorul, (“o maus é precisamente o dispositivo de interação com o computador”), outros preferem soarece, “rato” (designação dada já em inglês pela semelhança de forma entre o dispositivo do computador e o animal); review, rom. recenzie, “apreciação”; shortcut, “atalho”, rom. scurta(tura(, mesmo significado; site, rom. sit; spammer > rom. spama(r (empréstimo, sem correspondente em romeno); thread, “fio”, rom. fir (< lat. filum, “fio”). Esse esforço dos romenos, que tentam romenizar a terminologia computacional, demonstra o apreço que têm por seu idioma, além de buscarem uma terminologia técnica acessível a todos. A história das línguas, entretanto, tem mostrado que os vocábulos, que não se enquadram no sistema fonológico próprio ou apresentam uma relação opaca entre significante e significado, cedo ou tarde são rejeitados pelos mecanismos internos de autodefesa do sistema. Exemplo desse fato foi o abandono, em português, da terminologia inglesa referente ao futebol, substituída por outra vernácula, como goleiro por goalkeeper, escanteio por korner etc.

Em conclusão, do exposto pode-se concluir com segurança que o lêxico das línguas românicas manteve e mantém o caráter latino fundamental, apesar dos numerosos empréstimos incorporados à parte do sistema aberto (substantivos, adjetivos e verbos), ao longo dos séculos. Na parte do sistema fechado, praticamente não houve incorporações. Os termos novos geralmente designam algo também novo ou diferente, uma vez que não existem dois sinônimos totalmente coincidentes no aspecto semântico. As rápidas modificações no modo de vida dos tempos atuais, com instrumentos, tecnologias, descobertas científicas aplicadas etc., exigem denominações adequadas, constituídas seja por recurso às fontes tradicionais seja pela adaptação de termos usuais, ou ainda através da criação neologismos. Mesmo os neologismos, porém, não são criações ex nihilo, pois partem de elementos do sistema da língua. O estudo do léxico permite ver que a língua é de fato a expressão de uma cultura, no sentido mais amplo. Particularmente o romeno, apesar de todas as circunstâncias políticas, culturais e lingüísticas adversas, manteve o caráter latino de seu vocabulário juntamente com as bases da cultura latina. Orgulham-se os romenos de serem descendentes dos dácios e dos romanos, perceptível até no nome de seu país.

referências bibliográficas

BArtoli, M. Saggi di lingüística spaziale. Torino, 1945.

Bassetto, B. F. Elementos de filologia românica. São Paulo: Edusp, 2ª ed., 2005.

Bourciez, Ed. Éléments de linguistique romane. 5ª ed. Paris: C. Klincksieck. 1967,

Câmara JR., J. M. História e estrutura da língua portuguesa. 2ª ed. Rio de Janeiro: Padrão, 1977.

––––––. Dicionário de filologia e gramática. 4ª ed. ver. e aum. Rio de Janeiro: Ozon, 1970.

Graur, A. Gramática azi. Bucure]ti: Academiei Republicii Socialiste România, 1973.

Iordan, I. e Manoliu, M. Manual de lingüística românica. Madrid: Gredos, 1972, 2 vol.

Maurer JR., Th. H. A unidade da România Ocidental. São Paulo: Graf. José Magalhães, 1951.

––––––. Gramática do latim vulgar. Rio de Janeiro: Acadêmica, 1959.

––––––. O problema do latim vulgar. Rio de Janeiro: Acadêmica, 1962.

Meyer-Lübke, W. 5ª ed. Romanisches Etymologisches Wörterbuch. Heidelberg: Universitäsverlag, 1972.

Rohlfs, G. Diferenciación léxica de las lenguas românicas. Madrid: Sucs. de Rivadeneyra, 1960.

Tagliavini, C. 6ª ed. Le origini delle lingue neolatine. Bologna: Carlo Pàtron, 1972.

Väänänen, V. Introducción al latin vulgar. Madrid: Gredos, 1968.

 

...........................................................................................................................................................

Copyright © Círculo Fluminense de Estudos Filológicos e Lingüísticos