![]() |
![]() |
Políglotas informáticos para todo servicio RAFAEL A. CALVO, desde los Estados Unidos informatica2@inf.clarin.com.ar Utilizan nuestros conocimientos lingüísticos para diseñar sistemas informáticos capaces de reconocer, comprender, interpretar y hasta generar lenguaje en cualquier idioma. Se trata de las tecnologías (o ingeniería) del lenguaje, difícilmente encuadrables dentro de una disciplina en particular. Y en la que trabajan lingüistas y traductores, al igual que especialistas en informática, matemáticos, físicos, estadísticos, y otros tantos profesionales. ¿Cómo ocurrió tal coalición de disciplinas? Como siempre, la necesidad sirvió de promotora. Además, todo fue posible gracias a la hoy omnipresente computadora y al continuo aumento de sus velocidades. Veamos: durante las últimas décadas, la cantidad de información disponible ha crecido en forma vertiginosa y la mayor parte de esa información sigue estando expresada en palabras. Estas palabras pueden estar materializadas en sonido (lenguaje hablado), gráficos (lenguaje escrito) o formato digital (en un procesador de texto). Allí comienza la interdisciplinariedad. La nueva tecnología del lenguaje ya sirvió para el desarrollo de correctores automáticos de ortografía y gramática, así como para los resumidores de texto en los procesadores de texto, los catálogos electrónicos en las bibliotecas; los motores de búsqueda de Internet, los programas de interpretación de lenguaje hablado que toman dictado directamente desde el micrófono, los traductores automáticos. La lista sigue... Estos productos van a revolucionar el uso del lenguaje revalorizándolo como medio de comunicación. Investigación pura Independientemente del idioma, las tecnologías del lenguaje forman un área de investigación muy amplia, que en general se subdivide en: Interpretación del lenguaje. Después del reconocimiento, se necesita saber qué quieren decir esas palabras. No es lo mismo "como un perro loco" (similaridad), o "como un perro loco" (acción de ingerir). Se necesitan sistemas que no sólo reconozcan las palabras, sino que le puedan asignar el "significado" correcto en la oración (semántica). Producción de lenguaje. En aplicaciones como la traducción automática, el programa recibe cierta información (el texto a traducir) y debe producir un texto con significado equivalente. Si uno utiliza, por ejemplo, el traductor automático de Altavista (http://babelfish.altavista.com) para traducir al inglés y de nuevo al español la frase "Comiendo como un loco" se obtiene como resultado, "el comer como loca una persona". En producción automática de resúmenes de documentos también se pueden obtener resultados cómicos (si no lo cree puede probar la opción de "summarization" en el Word de Microsoft). A pesar de estos problemas, ambas aplicaciones pueden ser de gran utilidad y van a pasar a ser de uso cotidiano en el futuro cercano. Búsqueda de información. Actualmente se están diseñando sistemas de búsqueda "translinguales" (entre distintas lenguas) como Altavista, donde uno puede escribir la búsqueda en español para encontrar documentos relevantes en inglés o en otros idiomas. Otras aplicaciones interesantes son las "transmediales" (entre distintos medios), donde uno ingresa una foto y el sistema le devuelve el nombre, o pronuncia el título de un libro y el sistema le dá el autor u otra información relevante. Clasificación de documentos El catálogo de Yahoo! lo construyen y actualizan unas cien personas que leen miles de páginas web por día. Este es un proceso lento y caro, y se intenta diseñar sistemas informáticos que simplifiquen el trabajo de clasificar información. Lenguaje y computadoras ¿Cómo reconocer una palabra sin ver todas las letras?, ¿cómo entender una oración sin ver todas las palabras ?, ¿qué sucede cuando queremos crear un sistema que no sólo reconozca la palabra, sino que haga algo con ella, por ejemplo traducirla, o ejecutar una orden?, ¿qué sucede si necesitamos un sistema que genere respuestas escritas, en el lenguaje que usamos cotidianamente? Para todo esto, es necesario desarrollar en las computadoras habilidades lingüisticas propias de los humanos. La solución de esos problemas seguramente dará forma a un nuevo concepto de interacción con la computadora. Cuando una máquina comprenda el lenguaje humano, traduzca entre varias lenguas y genere resultados orales e impresos, dispondremos de una herramienta poderosísima que nos ayudará en muchos ámbitos de nuestra vida. Pero estos cambios también crean nuevos desafíos para la sociedad. El desarrollo de todas estas herramientas está estrechamente ligado a la comprensión de cada idioma particular, y al esfuerzo invertido en generar recursos informáticos para ese idioma. Estas inversiones están guiadas por el beneficio económico esperado. Y como el inglés es el idioma de mayor relevancia económica, la mayor parte de los esfuerzos se han concentrado en esta lengua. Pero bien es sabido que el lenguaje es parte esencial de la cultura, y ayuda a tener una identidad nacional y cultural. En Europa se disfruta de una sociedad multilingüe pero ya se ha comprendido que el predominio de unas pocas lenguas podría originar un desequilibrio de poder y una pobre utilización de los recursos. De manera que la Unión Europea está invirtiendo una creciente cantidad de recursos al desarrollar las tecnologias del lenguaje en español, francés, aleman. Y, por supuesto, inglés. Links: Laboratorios y proyectos de investigación en tecnologías del lenguaje: Megaproyecto de Human Language Technologies de la Comunidad Europea: http://www.linglink.lu ![]() |
![]() |