Hasta hace poco, los ordenadores no eran muy buenos leyendo textos escritos a mano. Pero ahora la inteligencia artificial permite este avance
El archivo del estado de Tirol en Innsbruck, Austria, conserva innumerables documentos desde el siglo once. La mayoría, documentos oficiales y otros importantes registros del pasado. No resultaba fácil transcribir estos libros. La institución trabaja ahora con científicos para automatizar el proceso empleando tecnología punta.
Christoph Haidacher, director del archivo del estado de Tirol:
“Con cursivas difíciles como esta creo que la nueva técnica tendrá problemas. Pero con caligrafía relativamente bonita como esta otra, el nuevo sistema tiene muchas ventajas y nos ayuda mucho”.
Para digitalizar libros como estos los científicos que trabajan en el proyecto de investigación europeo READ diseñaron un sistema fácil de utilizar basado en una aplicación para teléfonos inteligentes desarrollada especialmenten para la tarea. Detecta cuando se pasan las páginas y automáticamente saca fotos de alta definición de cada una de ellas. Guenter Muehlberger coordina el proyecto.
Günter Muehlberger, coordinador del proyecto READ e investigador de digitalización y preservación digital de la Universidad de Innsbruck:
“Esto es una combinación de alta y baja tecnología. Esta tienda es relativamente simple, un accesorio de baja tecnología. Pero trabaja con una aplicación de alta tecnología que está conectada con la plataforma Transkribus: la aplicación sube la imagen al servidor que realiza el reconocimiento del texto manuscrito”.
Transkribus simplifica las tareas que de otra manera llevarían años de trabajo. Ayuda a los académicos con manuscritos complejos y disposiciones gráficas poco habituales. Mario Klarer lo emplea para transcribir “El libro del héroe”, de 500 páginas, la antología más significativa de textos medievales germanos encargada por Maximiliano I a comienzos del siglo XVI”.
Mario Klarer, profesor de literatura e historia cultural de la Universidad de Innsbruck:
“La gran ventaja de este sistema es que ofrece una conexión entre imagen y texto, y lo hace de una forma muy simple, gracias a que el transcriptor tiene la imagen completa de manera inmediata. Es una manera de reducir los errores al mínimo, algo que no se puede conseguir con ningún otro sistema”.
El servidor de la Universidad de Innsbruck utiliza algoritmos para enseñar al ordenador nuevos estilos de escritura. Primero se transcriben manualmente parte de los textos, luego el software aprende a identificar los caracteres y finaliza la tarea automáticamente con sorprendente precisión, superior al 95% para documentos históricos, independientemente del idioma o del estilo de letra.
“Proporciono al ordenador una imagen y parte del texto correspondiente”, comenta Günter Muehlberger. “Basándose en ellos el ordenador aprende a identificar las letras y fuentes similares con exactitud”.
El sistema puede transcribir textos en cualquier idioma, reuniendo a académicos y científicos, responsables de archivos y voluntarios de muchos países. Sus creadores planean comercializar Transkribus en todo el mundo.
“Nos sorprendió el gran éxito del proyecto y estar en contacto con tantas instituciones que muestran interés”, asegura Muehlberger. “Como queremos seguir ofreciendo y expandiendo este servicio, estamos creando una empresa derivada”.
Vía | Euronews