Investigadores tienen una herramienta mágica para entender la IA: Harry Potter

Últimas cotizaciones

Bloomberg — Más de dos décadas después de que J.K. Rowling presentara al mundo un universo de criaturas mágicas, bosques prohibidos y un mago adolescente, Harry Potter está encontrando una renovada relevancia en un cuerpo literario muy diferente: la investigación en IA.

Un número creciente de investigadores están utilizando los libros más vendidos de Harry Potter para experimentar con la tecnología de la inteligencia artificial generativa, citando la perdurable influencia de la serie en la cultura popular y la amplia gama de datos lingüísticos y complejos juegos de palabras que contienen sus páginas. La revisión de una lista de estudios y trabajos académicos que hacen referencia a Harry Potter ofrece una instantánea de la investigación de punta en IA, y de algunas de las cuestiones más espinosas a las que se enfrenta la tecnología.

En el ejemplo reciente más notable, Harry, Hermione y Ron protagonizan un artículo titulado “¿Quién es Harry Potter?” que arroja luz sobre una nueva técnica que ayuda a los grandes modelos lingüísticos a olvidar selectivamente la información. Es una tarea de alto riesgo para la industria: Los grandes modelos lingüísticos, que alimentan los chatbots de IA, se construyen sobre grandes cantidades de datos en línea, incluido material protegido por derechos de autor y otros contenidos problemáticos. Esto ha provocado demandas judiciales y el escrutinio público de algunas empresas de IA.

Los autores del artículo, los investigadores de Microsoft Mark Russinovich y Ronen Eldan, afirman que han demostrado que los modelos de IA pueden alterarse o editarse para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluidos los personajes y las tramas, sin sacrificar la capacidad analítica y de toma de decisiones general del sistema de IA.

El dúo dijo que eligieron los libros por su familiaridad universal. “Creímos que sería más fácil para la gente de la comunidad investigadora evaluar el modelo resultante de nuestra técnica y confirmar por sí mismos que el contenido ha sido efectivamente ‘desaprendido’”, dijo Russinovich, director de tecnología de Microsoft Azure. “Casi cualquiera puede plantear preguntas al modelo que sondeen si ‘conoce’ o no los libros. Incluso la gente que no ha leído los libros sería consciente de los elementos de la trama y los personajes.”

En otro estudio, investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Instituto Allen de IA desarrollaron un nuevo modelo lingüístico llamado Silo que puede eliminar datos para reducir los riesgos legales. Sin embargo, el rendimiento del modelo disminuía significativamente si se entrenaba sólo con texto de bajo riesgo, como libros sin copyright o documentos gubernamentales, afirmaron en un artículo publicado a principios de este año.

VER +

Lanzamiento de Hogwarts Legacy se empaña por opiniones trans de JK Rowling

Algunos fans tienen dificultades para conciliar los comentarios de la autora con el deseo de sumergirse en el juego de Harry Potter mejor valorado de la historia

Para profundizar más, los investigadores utilizaron libros de Harry Potter para ver si los fragmentos individuales de texto influyen en el rendimiento de un sistema de IA. Crearon dos almacenes de datos, o colecciones de sitios web y documentos. El primero incluía todos los libros publicados excepto el primero de Harry Potter; otro incluía todos los libros de la serie menos el segundo, y así sucesivamente. “Cuando se eliminan los libros de Harry Potter del almacén de datos, la perplejidad empeora”, dijeron los investigadores, refiriéndose a la medida de la precisión de los modelos de IA.

Modelos lingüísticos familiarizados

Los estudios sobre IA llevan citando a Harry Potter desde hace al menos una década, pero se ha hecho más común a medida que los académicos y los tecnólogos se han centrado en herramientas de IA que puedan procesar y responder al lenguaje natural con respuestas pertinentes. En el caso de Harry Potter, “la abundancia de escenas, diálogos y momentos emotivos lo hacen muy relevante para el área específica del procesamiento del lenguaje natural”, afirma Leila Wehbe, investigadora de Carnegie Mellon que realizó una serie de experimentos en 2014 recogiendo datos de resonancias magnéticas cerebrales de personas que leían historias de Harry Potter para comprender mejor los mecanismos del lenguaje.

En arXiv, un repositorio de acceso abierto de investigación científica, entre los artículos recientes se incluyen: “Aprendizaje automático para el desarrollo de pociones en Hogwarts”, “Los grandes modelos lingüísticos conocen a Harry Potter” y “Detección de hechizos en la literatura fantástica con una inteligencia artificial basada en transformadores”.

VER +

Harry Potter y Star Wars impulsan ventas en doble dígito de Lego

Lego está apostando a la diversificación de su portafolio, lo que le ha permitido llegar a un mayor rango de consumidores con edades e intereses diversos

Incluso cuando no es el tema central de la investigación, Harry Potter es también una de las referencias literarias favoritas de los investigadores. Un estudio, por ejemplo, utilizó las obras de Rowling para poner a prueba la inteligencia de sistemas de IA como los que generó el chatbot ChatGPT, un tema que ha generado mucho calor en los últimos debates. Terrence Sejnowski, que dirige el laboratorio de neurobiología computacional del Instituto Salk de Estudios Biológicos, argumentó en el artículo que los chatbots se limitan a reflejar la inteligencia y los prejuicios de sus usuarios, como el Espejo de Erised en el primer libro de Harry Potter, que refleja los deseos de una persona hacia ella.

“Harry Potter es popular entre los investigadores más jóvenes”, dijo Wehbe. “Los habrían leído de niños o adolescentes, por lo que pensarían en ellos al elegir un corpus de texto escrito o hablado”.

Lee más en Bloomberg.com

Investigadores tienen una herramienta mágica para entender la IA: Harry Potter

Modelos lingüísticos familiarizados

Las noticias del día

Tecnologia

Investigación

Inteligencia artificial

Uruguay

México

Colombia

Podcasts

Económicas e internacionales

Estados Unidos

Negocios

Actualidad

México

Colombia

Mundo

Argentina

Argentina