Gracias a la IA pergaminos antiguos se podrán traducir (Criptotendencia)

Bitcoin

 

Lamentablemente una parte triste de la historia de la humanidad es la desaparición de diversas civilizaciones y culturas, dando origen a las famosas lenguas muertas, impidiendo que se puedan leer, causando que nunca pudiésemos entender los mensajes de nuestros antepasados. Al menos esta era la situación hasta la aparición de la tecnología de Inteligencia Artificial.

Jiaming Luo y Regina Barzilay son investigadores del MIT, y Yuan Cao del laboratorio de inteligencia artificial de Google en Mountain View, California. Este equipo ha desarrollado un sistema de aprendizaje automático capaz de descifrar idiomas perdidos, y lo han demostrado descifrando Lineal B, la primera vez que se realiza de forma automática. El enfoque que utilizaron era muy diferente de las técnicas de traducción automática estándar.

La gran idea detrás de la traducción automática es comprender que las palabras están relacionadas entre sí de manera similar, independientemente del idioma involucrado. Entonces, el proceso comienza al trazar estas relaciones para un lenguaje específico. Esto requiere enormes bases de datos de texto.

Luego, una máquina busca en este texto para ver con qué frecuencia aparece cada palabra junto a cada otra palabra. Este patrón de apariencias es una firma única que define la palabra en un espacio de parámetros multidimensional. De hecho, la palabra puede considerarse como un vector dentro de este espacio. Y este vector actúa como una poderosa restricción sobre cómo puede aparecer la palabra en cualquier traducción que surja la máquina.

Estos vectores obedecen algunas reglas matemáticas simples. Por ejemplo: rey – hombre + mujer = reina. Y una oración puede considerarse como un conjunto de vectores que siguen uno tras otro para formar una especie de trayectoria a través de este espacio.

La idea clave que permite la traducción automática es que las palabras en diferentes idiomas ocupan los mismos puntos en sus respectivos espacios de parámetros. Eso hace que sea posible asignar un idioma completo a otro idioma con una correspondencia uno a uno.

De esta manera, el proceso de traducir oraciones se convierte en el proceso de encontrar trayectorias similares a través de estos espacios. La máquina ni siquiera necesita «saber» qué significan las oraciones.

Este proceso se basa fundamentalmente en los grandes conjuntos de datos. Pero hace un par de años, un equipo de investigadores alemanes mostró cómo un enfoque similar con bases de datos mucho más pequeñas podría ayudar a traducir idiomas mucho más raros que carecen de las grandes bases de datos de texto. El truco es encontrar una forma diferente de restringir el enfoque de la máquina que no se basa en la base de datos.

Ahora, Luo y sus colegas han ido más lejos para mostrar cómo la traducción automática puede descifrar los idiomas que se han perdido por completo. La restricción que utilizan tiene que ver con la forma en que se sabe que los idiomas evolucionan con el tiempo.

La idea es que cualquier idioma puede cambiar solo de ciertas maneras; por ejemplo, los símbolos en idiomas relacionados aparecen con distribuciones similares, las palabras relacionadas tienen el mismo orden de caracteres, y demás características. Con estas reglas que restringen la máquina, es mucho más fácil descifrar un idioma, siempre que se conozca el idioma progenitor.

Luo y sus colegas pusieron a prueba la técnica con dos idiomas perdidos, Linear B y Ugaritic. Los lingüistas saben que Lineal B codifica una versión temprana del griego antiguo y que Ugaritic, que fue descubierto en 1929, es una forma temprana de hebreo.

Dada la información y las restricciones impuestas por la evolución lingüística, la máquina de Luo y compañía puede traducir ambos idiomas con una precisión notable.

«Pudimos traducir correctamente el 67.3% de los cognados de Linear B a sus equivalentes griegos en el escenario de desciframiento», dicen. «Hasta donde sabemos, nuestro experimento es el primer intento de descifrar Linear B automáticamente».

Si logran suministrar datos suficientes, lo que implica conseguir una mayor cantidad de escritos antiguos, será posible incluso traducir documentos tan importantes como la biblia.

Leave a Reply