Investigadores tienen una herramienta mágica para entender la IA: Harry Potter

Los académicos están utilizando la serie de libros más vendidos para probar cómo los sistemas de inteligencia artificial generativa aprenden y desaprenden determinados fragmentos de información

PUBLICIDAD
El temor al virus afecta a la economía nocturna de la capital
Por Saritha Rai
30 de diciembre, 2023 | 04:04 PM

Bloomberg — Más de dos décadas después de que J.K. Rowling presentara al mundo un universo de criaturas mágicas, bosques prohibidos y un mago adolescente, Harry Potter está encontrando una renovada relevancia en un cuerpo literario muy diferente: la investigación en IA.

Un número creciente de investigadores están utilizando los libros más vendidos de Harry Potter para experimentar con la tecnología de la inteligencia artificial generativa, citando la perdurable influencia de la serie en la cultura popular y la amplia gama de datos lingüísticos y complejos juegos de palabras que contienen sus páginas. La revisión de una lista de estudios y trabajos académicos que hacen referencia a Harry Potter ofrece una instantánea de la investigación de punta en IA, y de algunas de las cuestiones más espinosas a las que se enfrenta la tecnología.

PUBLICIDAD

En el ejemplo reciente más notable, Harry, Hermione y Ron protagonizan un artículo titulado “¿Quién es Harry Potter?” que arroja luz sobre una nueva técnica que ayuda a los grandes modelos lingüísticos a olvidar selectivamente la información. Es una tarea de alto riesgo para la industria: Los grandes modelos lingüísticos, que alimentan los chatbots de IA, se construyen sobre grandes cantidades de datos en línea, incluido material protegido por derechos de autor y otros contenidos problemáticos. Esto ha provocado demandas judiciales y el escrutinio público de algunas empresas de IA.

Los autores del artículo, los investigadores de Microsoft Mark Russinovich y Ronen Eldan, afirman que han demostrado que los modelos de IA pueden alterarse o editarse para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluidos los personajes y las tramas, sin sacrificar la capacidad analítica y de toma de decisiones general del sistema de IA.

El dúo dijo que eligieron los libros por su familiaridad universal. “Creímos que sería más fácil para la gente de la comunidad investigadora evaluar el modelo resultante de nuestra técnica y confirmar por sí mismos que el contenido ha sido efectivamente ‘desaprendido’”, dijo Russinovich, director de tecnología de Microsoft Azure. “Casi cualquiera puede plantear preguntas al modelo que sondeen si ‘conoce’ o no los libros. Incluso la gente que no ha leído los libros sería consciente de los elementos de la trama y los personajes.”

En otro estudio, investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Instituto Allen de IA desarrollaron un nuevo modelo lingüístico llamado Silo que puede eliminar datos para reducir los riesgos legales. Sin embargo, el rendimiento del modelo disminuía significativamente si se entrenaba sólo con texto de bajo riesgo, como libros sin copyright o documentos gubernamentales, afirmaron en un artículo publicado a principios de este año.

PUBLICIDAD
VER +
Lanzamiento de Hogwarts Legacy se empaña por opiniones trans de JK Rowling

Para profundizar más, los investigadores utilizaron libros de Harry Potter para ver si los fragmentos individuales de texto influyen en el rendimiento de un sistema de IA. Crearon dos almacenes de datos, o colecciones de sitios web y documentos. El primero incluía todos los libros publicados excepto el primero de Harry Potter; otro incluía todos los libros de la serie menos el segundo, y así sucesivamente. “Cuando se eliminan los libros de Harry Potter del almacén de datos, la perplejidad empeora”, dijeron los investigadores, refiriéndose a la medida de la precisión de los modelos de IA.

Modelos lingüísticos familiarizados

Los estudios sobre IA llevan citando a Harry Potter desde hace al menos una década, pero se ha hecho más común a medida que los académicos y los tecnólogos se han centrado en herramientas de IA que puedan procesar y responder al lenguaje natural con respuestas pertinentes. En el caso de Harry Potter, “la abundancia de escenas, diálogos y momentos emotivos lo hacen muy relevante para el área específica del procesamiento del lenguaje natural”, afirma Leila Wehbe, investigadora de Carnegie Mellon que realizó una serie de experimentos en 2014 recogiendo datos de resonancias magnéticas cerebrales de personas que leían historias de Harry Potter para comprender mejor los mecanismos del lenguaje.

En arXiv, un repositorio de acceso abierto de investigación científica, entre los artículos recientes se incluyen: “Aprendizaje automático para el desarrollo de pociones en Hogwarts”, “Los grandes modelos lingüísticos conocen a Harry Potter” y “Detección de hechizos en la literatura fantástica con una inteligencia artificial basada en transformadores”.

VER +
Harry Potter y Star Wars impulsan ventas en doble dígito de Lego

Incluso cuando no es el tema central de la investigación, Harry Potter es también una de las referencias literarias favoritas de los investigadores. Un estudio, por ejemplo, utilizó las obras de Rowling para poner a prueba la inteligencia de sistemas de IA como los que generó el chatbot ChatGPT, un tema que ha generado mucho calor en los últimos debates. Terrence Sejnowski, que dirige el laboratorio de neurobiología computacional del Instituto Salk de Estudios Biológicos, argumentó en el artículo que los chatbots se limitan a reflejar la inteligencia y los prejuicios de sus usuarios, como el Espejo de Erised en el primer libro de Harry Potter, que refleja los deseos de una persona hacia ella.

“Harry Potter es popular entre los investigadores más jóvenes”, dijo Wehbe. “Los habrían leído de niños o adolescentes, por lo que pensarían en ellos al elegir un corpus de texto escrito o hablado”.

Lee más en Bloomberg.com