La tarea de transcribir la incalculable inmensidad de textos antiguos dispersos por el planeta requeriría tal cantidad de tiempo y esfuerzo que, francamente, resulta inabarcable. Probablemente, la mayoría de ese tesoro bibliográfico mundial terminará desapareciendo, se perderá en algún sótano lleno de cajas o, con suerte, permanecerá a buen recaudo sin que nadie sepa nunca qué es lo que dicen sus páginas… o quizá aparezca alguna ayuda inesperada que evite ese triste destino.
Esta semana el journal Transactions on Pattern Analysis and Machine Intelligence ha publicado un interesante estudio, realizado por investigadores de la Universidad de Notre Dame (Indiana, EEUU) en el que presentan una red neuronal artificial capaz de leer escritura antigua compleja, donde los científicos se han basado en la percepción humana para mejorar las capacidades de transcripción de la IA.
“Trabajamos con documentos históricos escritos en estilos que han pasado de moda hace mucho tiempo, que se remontan siglos atrás y que usan idiomas y lenguas romance que apenas reconocemos hoy”, explica Walter Scheirer, profesor en Notre Dame y uno de los autores principales del artículo. “Puedes obtener fotografías de estos materiales, pero entender el texto es necesario transcribirlo y nuestra propuesta es automatizar ese proceso imitando la percepción de la página a través de los ojos del lectores expertos que proporcionan una lectura rápida y ágil de ese texto”
Para imitar esa percepción del texto realizada por un lector experto los autores del estudio unieron los métodos ya tradicionales de aprendizaje automático en IA, con un campo conocido como psicofísica visual, midiendo las conexiones entre los estímulos físicos y los procesos mentales, como la cantidad de tiempo que le toma a un lector experto reconocer un carácter específico, la calidad de la escritura a mano o identificar el uso de ciertas abreviaturas.
En el trabajo utilizaron personas expertas en la materia que ingresaron sus propias transcripciones en un software especialmente diseñado. Más tarde, el equipo midió los tiempos de reacción durante esa transcripción para comprender qué palabras, caracteres y párrafos resultaron más fáciles o difíciles. Incluir este tipo de datos en la red neuronal consiguió una IA más consistente con el comportamiento humano, redujo los errores y proporcionó una lectura más precisa y realista del texto.