Historia

Archivera se adentra en la mina de los documentos históricos con la transcripción automática y la inteligencia artificial

Poner al alcance el Oficio de Hipotecas de Girona entre 1768 y 1805 permitirá investigar el papel de la mujer, los artesanos y los menestrales

Rosa Congost, Lluís Serrano y Enric Saguer trabajando con Archivera en la Universidad de Girona.
20/06/2024
4 min

GeronaLa transcripción automática de documentación manuscrita avanza a pasos de gigante gracias a la inteligencia artificial y ofrece a los investigadores una valiosa información que hasta ahora quedaba sepultada entre maíz y miles de páginas polvorientas. De intentar encontrar una aguja en un pajar los investigadores han pasado ahora a poder buscar en los archivos a personas, genealogías, patrimonios, oficios y topónimos. El proyecto Archivera (Archivera.udg.edu), que se empezará a difundir en los próximos días, impulsado por el Centro de Investigación de Historia Rural de la Universidad de Girona (UdG), ha puesto a disposición pública el Oficio de Hipotecas de Girona (1768-1805), un fondo donde existen resúmenes de las escrituras que contenían alguna garantía o hipoteca general, en la práctica casi todos los matrimonios, compraventas, inventarios de bienes y testamentos, entre otros documentos. La consulta de este riquísimo fondo, el precedente del Registro de la Propiedad, no tiene ningún coste pero se pide un trabajo colaborativo a los usuarios que se registren para ayudar a enmendar la página a la inteligencia artificial en el hora de mejorar las transcripciones.

De izquierda a derecha, Rosa Congost, Enric Saguer y Lluís Serrano, profesores de la UdG implicados en el proyecto Archivera.

El trabajo de 25 años de 6 estudiantes

"La transcripción automática de los manuscritos equivale al trabajo que habrían tenido que realizar 6 estudiantes, 15 horas por semana cada uno, durante 25 años", explica el profesor de la UdG Enric Saguer, que coordina el proyecto con Rosa Congost, en un equipo integrado también por Ricard Garcia Orallo (UB), Rosa Ros (UdG) y Lluís Serrano (UdG). El proyecto ya ha recibido dos ayudas del ministerio de Ciencia, Innovación y Universidades, otra de la fundación del BBVA y acaba de recibir una de la Red Vives de Universidades.

El portal Archivera es, de hecho, una prueba de concepto del ministerio: la implementación de un método con el propósito de verificar que se puede explotar de forma útil. Esta prueba no es muy corriente en el mundo de las humanidades, pero con el portal Archivera se demuestra con creces la utilidad del proyecto.

Una página del Oficio de Hipotecas que ha transcrito Archivera.

La técnica de transcribir manuscritos

La parte técnica de la transcripción automática ha corrido a cargo del grupo Pattern Recognition and Human Language Technology de la Universidad Politécnica de Valencia (UPV). "La idea viene de lejos, pero la tecnología no estaba suficientemente madura", explica Saguer. “Llevamos 7 años trabajando con este grupo valenciano especializado en la lectura de textos manuscritos, que ha participado en un proyecto europeo que recientemente sacó al mercado una potente herramienta de transcripción (https://www.transkribus.org/) y que ha entrenado un programa específico para nuestro fondo documental”. Gran parte de los textos manuscritos ya eran accesibles con imágenes a través de la web del Archivo Histórico de Girona, pero no su transcripción.

Los notarios de Girona, los más proactivos

El concepto de bien hipotecado de entre mediados del XVIII y del XIX implicaba que debía ponerse como aval una finca concreta o la totalidad de los bienes (hipoteca general). "Era muy habitual, no sólo cuando te endeudabas sino también al firmar un contrato matrimonial, hacer una compraventa o un testamento, que se pusiera una garantía sobre todos tus bienes", explica Saguer. Los notarios, al principio, no tenían muy claro qué documentos debían llevar a este registro, pero después de una consulta en la Real Audiencia, en Cataluña y aún más en Girona, los notarios fueron mucho más proactivos que en otros sitios y se acaba llevando cualquier documento que tuviera una hipoteca general. Los documentos de Gerona se cuentan entre los más ricos documentalmente de todo el Estado.

Los lomos de los patracoles del Oficio de Hipotecas de Girona.

Poner orden en el caos

El alcance territorial del archivo incluye el Alt y el Baix Empordà, el Gironès, la Selva y parte del Maresme hasta 1774, cuando se reestructura y se reduce en el Gironès y el Baix Empordà, aunque sigue siendo relevante históricamente . El Oficio de Hipotecas no seguía ningún tipo de orden. Ni siquiera tenía un índice del año. "Los abogados y la gente que trataba con asuntos jurídicos en el siglo XIX ya lo describen como algo caótico", advierte el profesor Saguer. La letra es suficientemente buena, y sobre todo uniforme, lo que ha hecho posible entrenar el sistema para reconocer la escritura. Archivera tiene ahora mismo unas 103.300 imágenes, en las que hay unos 135.000 documentos

El sistema actúa de forma probabilística y además de transcribir también identifica determinados conceptos: antropónimos, oficios y topónimos. El punto más delicado es pasar de los píxeles al trazo leedor distinguido del fondo. Cuando el estilo de escritura cambia se debe reentrenar la máquina. Lo interesante del proyecto es que una vez obtenidos los textos planos se han pasado a datos estructurados. Este proceso ha corrido a cargo de Jordi Regincós (Escuela Politécnica Superior de la UdG).

Colectivos desfavorecidos y poco estudiados

Archivera es una auténtica mina para investigaciones de signo muy diferente: desde un genealogista que investigue los orígenes de una familia hasta un arquitecto interesado en la reconstrucción de una masía, pasando por las posibles tesis sobre oficios y artesanos fuera del mundo gremial de las ciudades o trabajos de fin de bachillerato. Los colectivos más desfavorecidos y poco estudiados serán los protagonistas de buena parte de estas investigaciones. Sabemos muchas cosas de los señores feudales y de los propietarios, pero menos de los pequeños campesinos, pequeños artesanos, menestrales y mujeres, que han sido muy silenciadas en estos períodos históricos.

stats