Un grupo de científicos lograron leer un metro y medio de texto recuperado en Herculano, mediante métodos de aprendizaje automático que esperan puedan desbloquear más descubrimientos
WASHINGTON.– Una vez enterrados en rocas calientes, cenizas y lava, los pergaminos están tan carbonizados y se vuelven tan frágiles que se deshacen al tacto. Desde su descubrimiento en 1752, varios intentos por leerlos –abrirlos dividiéndolos y raspando cada rebanada de papel antiguo con un cuchillo, vertiendo mercurio entre las capas, sumergiéndolos en una mezcla de gelatina y ácido acético– los destruyeron o los volvieron ilegibles.
Ahora, los investigadores afirman que lograron desenrollar y leer completamente la porción sobreviviente de un pergamino, unas 20 columnas de texto, utilizando métodos de aprendizaje automático que esperan puedan desbloquear más descubrimientos de una biblioteca clásica perdida.
Los pergaminos pertenecen a una colección de más de 400 papiros recuperados de una villa en la antigua ciudad costera de Herculano, que se cree perteneció al suegro de Julio César. Los algoritmos desarrollados por investigadores de la Universidad de Kentucky y el Vesuvius Challenge (una competencia abierta respaldada por Silicon Valley), junto con imágenes avanzadas de un acelerador de partículas, revelaron lentamente varias porciones de los pergaminos que pueden ser analizadas por los papirólogos. Primero, una sola palabra en 2023; luego, algunas frases, y ahora al menos 230 columnas de texto a través de varios pergaminos, en el último salto anunciado este jueves.
“Considero que este es un momento fundamental porque, de ahora en adelante, hablaremos más sobre los textos que sobre la tecnología”, dijo Brent Seales, un científico informático de la Universidad de Kentucky quien desarrolló los primeros métodos para desenrollar digitalmente los pergaminos sin tocarlos a principios de la década de 2000.
Los nuevos hallazgos publicados incluyen el descubrimiento de la existencia de varios capítulos nuevos de la obra “Sobre los dioses” del filósofo Filodemo de Gadara. Anteriormente se conocía solo como una obra de un solo capítulo, pero uno de los nuevos pergaminos hace referencia a que tiene ocho. En consonancia con el título y otros escritos de Filodemo, las frases recuperadas como “providencia”, “cosas futuras” y “entidades invisibles” apuntan hacia una discusión sobre la teología epicúrea.
“Es fenomenalmente emocionante”, expresó Richard Janko, un clasicista de la Universidad de Michigan que no participó de los nuevos hallazgos.
Los pergaminos fueron además el foco del Vesuvius Challenge, una convocatoria abierta lanzada por los inversores de Silicon Valley Nat Friedman y Daniel Gross, en colaboración con Seales. En 2023, el desafío otorgó su gran premio de 700.000 dólares a un grupo de estudiantes que leyeron más de 2000 caracteres de 11 columnas de pergamino.
Desde entonces, el Vesuvius Challenge siguió apoyando los esfuerzos de investigación sobre los pergaminos, incluyendo la financiación del escaneo de vanguardia necesario para separar las capas de papiro carbonizado.
“Es una característica que es particularmente difícil de visualizar debido al hecho de que está carbonizada”, sostuvo Giorgio Angelotti, líder de investigación del desafío.
El proceso
El proceso de escaneo es una versión más avanzada de una tomografía computarizada médica típica. Utilizando un haz especializado generado por un acelerador de partículas, los investigadores unieron secciones transversales bidimensionales para crear una imagen tridimensional. Los escaneos resultantes son increíblemente detallados: un solo píxel mide unas dos micras, más delgado que la seda de araña, pero también costoso. Un solo pergamino puede tardar de 20 a 24 horas en escanearse, y una semana de tiempo con el acelerador podría costar un cuarto de millón de dólares, estimó Seales.
La dificultad de “desenvolver” esos escaneos depende de varios factores, incluida la geometría del artefacto. Por ejemplo, el pergamino del cual se leyó casi un metro y medio de texto, conocido como PHerc. 1667, fue elegido porque era cilíndrico y no estaba demasiado comprimido, detalló Seales.
“El diámetro y, en general, la estructura del enrollado es bastante regular”, dijo Federica Nicolardi, quien dirigió un equipo de papirólogos para el desafío. “Es bastante lindo, debo decir, porque es realmente muy pequeño y también muy delgado”, agregó. PHerc. 1667 mide unos 2 centímetros de ancho y 8 centímetros de alto y es solo una pieza de un pergamino que alguna vez estuvo completo.
Luego viene el desafío de desenrollar virtualmente el pergamino, lo que implica aislar las capas de papiro que se compactaron a lo largo de los siglos y luego aplanar y unir las rebanadas en una imagen compuesta. Incluso entonces, la tinta en el papel carbonizado no es necesariamente visible a simple vista. Por lo tanto, utilizando fragmentos de pergamino existentes que fueron etiquetados por papirólogos, Seales, Angelotti y los otros investigadores entrenaron algoritmos para ayudar a realzar la tinta, para que expertos como Nicolardi puedan analizarla y traducirla.
“Lo que es difícil, especialmente cuando se trabaja con material fragmentario, es el hecho de que los papiros están escritos en letras mayúsculas, sin espacios entre las palabras –dijo Nicolardi–. La mayoría de las veces no tienes puntuación o solo tienes signos de puntuación muy limitados. Así que necesitas leer, entender la sintaxis e interpretar”.
Incluso el texto fragmentario puede ayudar a los investigadores a reconstruir ciertas características de un texto. Si bien la autoría de PHerc. 1667 aún no está clara, palabras como “horme” (impulso) y “phronesis” (sabiduría práctica) sugieren que discute el estoicismo, una filosofía de autocontrol y pensamiento racional.
Entre los métodos utilizados por investigadores anteriores y las herramientas más recientes impulsadas por IA, una gran parte del texto recuperado hasta ahora fue atribuido a Filodemo, quien hablaba griego y se creía que era un académico residente en la villa. Pero la biblioteca del lugar podría ir mucho más allá de eso, consideró Janko, citando la presencia de un libro de historia que discute el período posterior a la muerte de Alejandro Magno.
El tamaño de la biblioteca sobreviviente es “prácticamente inigualable”, agregó Jeffrey Fish, un estudioso de Filodemo en la Universidad de Baylor. En la cercana Pompeya, el calor de la erupción del Vesubio incineró materiales como el papiro, dijo. Pero en Herculano, los pergaminos se carbonizaron, preservándolos paradójicamente del desgaste habitual del papel con el paso del tiempo.
Para Seales, el siguiente desafío es escalar: mejores imágenes y mejores algoritmos. Debido al costo, solo alrededor del 10% de los pergaminos fueron escaneados.
“Todos estos parámetros requieren una enorme cantidad de entrenamiento. Creemos que mejora a medida que obtenemos más y más datos”, agregó. “Si tuviéramos suficiente dinero para escanear todo, entonces tendríamos el conjunto de datos completo y podríamos avanzar”, advirtió.
Tras los últimos avances, el Vesuvius Challenge ofrece un nuevo premio: 1 millón de dólares a cualquier persona o equipo que pueda leer completamente un pergamino en el próximo año. El grupo del desafío está publicando toda su colección de escaneos, código y datos en línea para los lectores de pergaminos emprendedores.
“Esta es una invitación al resto del mundo para que se una a nosotros en esta empresa”, declaró Friedman, uno de los fundadores del desafío, en una conferencia de prensa en Nápoles este jueves por la mañana. “La mayoría de la gente comienza con un poco de curiosidad, luego se dejan absorber y después descubren que han pasado meses o años haciendo esto. Pero no puedo pensar en una mejor manera de perder seis meses de tu vida que haciendo esto”, concluyó.