FILOLOGIA COMPUTACIONAL

um caso a considerar

Claudio Cezar Henriques (UERJ e ABF)

 

Começando

Pelo que se pode facilmente depreender pela leitura do título desta exposição, meu objetivo é comentar e demonstrar alguns vínculos entre a Filologia e a Computação. Isso significa que pretendo enfatizar a importância dos estudos e da formação filológica como base para uma atuação em área tecnológica que poderia, a princípio, sugerir completa dissociação dessa disciplina.

Os ilustres colegas que me antecederam já colocaram as coisas nos seus devidos lugares, definindo ou discutindo os valores semânticos e pragmáticos dos estudos filológicos, sua situação na sociedade contemporânea e os problemas que decorrem da mais do que relativa má vontade das agências e patrocinadores que atuam na esfera universitária brasileira. Se a palavra de ordem são os estudos lingüísticos, então reconheçamos a necessidade de mostrar que os estudos filológicos, seja qual for a acepção em que ele se toma, têm sua "utilidade" no universo virtual e estão presentes nos monitores e nas redes de informação que se espalham pelo planeta.

Talvez falte apenas alertar a comunidade de que o nome dessa disciplina é Filologia, identidade que muitos dos filólogos computacionais nem sabem que possuem. Estou me referindo às páginas e aos programas que se disponibilizam na sociedade informática para tratar de algum texto - gramatical, literário, referencial, documental... Sites e homepages visitados por estudantes, profissionais liberais, jornalistas, pesquisadores, turistas e curiosos em geral, todos fascinados pela facilidade (às vezes nem tanta) de acesso a obras, documentos, interpretações, análises e comentários que num simples clicar do ponteiro se colocam à nossa disposição sem sair de casa.

 

Apresentando provas

O primeiro exemplo que trago dá notícia do projeto intitulado "Indexação das Revistas Filológicas Brasileiras do Século XX", vinculado ao GT de Historiografia da Lingüística Brasileira da ANPOLL. Trata-se de iniciativa do professor Antônio Martins Araújo, nosso colega da Academia Brasileira de Filologia, que recebeu a adesão de pesquisadores de vários estados brasileiros.

Esse trabalho de filologia computacional, de início restrito às equipes envolvidas, requer uma associação entre o conhecimento da tecnologia dos aplicativos de editoração de texto e as competências de leitura, seleção e identificação dos dados contidos nos periódicos pesquisados, entre os quais cito o índice da Revista de Língua Portuguesa, de Laudelino Freire, tema da dissertação da professora Regina Maria de Souza, a quem oriento no Mestrado em Língua Portuguesa do Instituto de Letras.

Outro exemplo diz respeito a uma interessante investigação filológica que está em andamento em universidades brasileiras, portuguesas e de outras nações. Refiro-me ao processamento computacional da língua portuguesa escrita e falada, tema de um Encontro Internacional que já se realiza há cinco anos, alternadamente no Brasil e em Portugal. O processamento computacional abrange tópicos como:

os sistemas ou modelos de processamento textual monolíngüe ou multilíngüe;

os sistemas ou modelos de processamento da fala;

as ferramentas e os recursos lingüísticos para o processamento da língua portuguesa;

as ferramentas de auxílio à escrita;

os sistemas de tradução e de sumarização automática;

o processamento baseado em métodos estatísticos e em análise de corpora;

a utilização de ambientes multimídia no processamento do português;

a avaliação do desempenho dos sistemas de processamento do português.

A preocupação com o processamento computacional do português gerou o lançamento em 1998, pelo Ministério da Ciência e da Tecnologia de Portugal, de um projeto homônimo, cujos primeiros resultados diretos já estão disponíveis na internet, no endereço www.portugues.mct.pt . Isto representa a possibilidade de acesso organizado e atualizado a um "Catálogo de Recursos" (corpora, léxicos e dicionários, ferramentas computacionais, material didático, literatura, comunicação social e textos em português) e a um "Catálogo de Atores" (grupos, centros e institutos; projetos; associações e instituições), entre outras "ajudas à navegação".

Ainda no âmbito do Projeto Processamento Computacional do Português, está em andamento a operacionalização do Constructor, uma ferramenta computacional interativa para a construção de comandos destinados à pesquisa lingüística nos corpora do português, visando principalmente, constituir uma ponte entre o usuário leigo e a interface portuguesa.

No Brasil, o endereço www.corpus.f2s.com , em meio a uma grande quantidade de informações sobre Lingüística de Corpus (por que não Filologia de Corpus?), o link "corpora" nos leva, por exemplo, até a página www.ime.usp.br/~tycho , que contém um amplo corpus do português histórico. Nele se podem visualizar (mediante cadastro e senha) textos portugueses dos séculos XVI, XVII e XVIII, de Diogo do Couto, Rodrigues Lobo, Vieira, Francisco Manuel de Melo, Ramalho Ortigão e outros.

Diga-se de passagem que a realização de congressos internacionais nessa área está em expansão. Cito, como ilustração, o Computational Linguistics (NAACL'2001), promovido pela Universidade Carnegie Mellon, Pittsburgh, Pennsylvania, previsto para ocorrer entre 2 e 7 de junho de 2001 (www.cs.cmu.edu/~ref/naacl2001.html).

O próximo exemplo nos permite afirmar que o conhecimento filológico aplicado à computação tem também permitido a organização e internacionalização" de dicionários, enciclopédias e outras obras de consulta.

Cito o "portal" YourDictionary (www.yourdictionary.com), quase um "supermercado" lexicográfico, que dá acesso a mais de duzentos dicionários monolíngües, trinta dicionários multilíngües, sessenta dicionários de áreas específicas do conhecimento (Direito, Negócio, Finanças, Medicina, Computação, Esportes, Educação...), além de remeter o consultador a sítios que explicam regras de gramática, ensinam uma nova língua, oferecem ferramentas de grafia, pronúncia, sinonímia, homonímia, rima, etc.

A página YourDictionary tem ainda um atrativo filológico extra: a seção chamada "Word of the Day", que pode ser recebida gratuitamente via e-mail por qualquer internauta que solicite o serviço (que é gratuito).

Por fim, um exemplo que diz respeito ao mercado de trabalho internacional que se oferece ao filólogo computacional. Cito alguns "anúncios classificados" que dão conta da oportunidade de lidar com companhias que atuam no ramo de aplicações de e-commerce.

Os trechos seguintes são oportunidades divulgadas pela internet por GateSource Partners, www.gatesource.com , em julho de 2000 (selecionamos duas):

We are seeking a very bright, self-motivated individual with experience in developing applications of corpus-based natural language processing, information retrieval, data mining, parsing, sense disambiguation, or other related products (...);

(...) you will design and develop a robust and efficient system for classification and extraction of information from Internet text. Qualified candidates must have demonstrated mastery of parser development, semantic indexing, and information classification.

Esses desafios são tentadores para o especialista superqualificado. Acresça-se a isso o fato de os salários oferecidos serem passíveis de negociação em dólares...

 

Concluindo

Como se viu, as tarefas da Filologia estão apenas assumindo um novo estágio. Cumpre perseguir o objetivo do verdadeiro filólogo, estudar a língua em toda a sua amplitude, agora também virtual.