Bloomberg — Meta Platforms Inc. (META) está introduciendo un gran modelo de lenguaje para inteligencia artificial llamado LLaMA. El producto tiene como objetivo entrenar chatbots de inteligencia artificial y otros productos de la naturaleza.
La herramienta, LLaMA, ha “demostrado ser muy prometedora para generar texto, mantener conversaciones, resumir material escrito y tareas más complicadas como resolver teoremas matemáticos o predecir estructuras de proteínas”, dijo el CEO de la empresa, Mark Zuckerberg, en una publicación en Instagram este viernes.
LLaMA no está en uso por los productos de Meta, que incluyen Facebook e Instagram, en este momento, según un portavoz. La empresa tiene previsto poner la tecnología a disposición de los investigadores de IA.
“Meta está comprometida con este modelo abierto de investigación”, escribió Zuckerberg.
Los grandes modelos lingüísticos son sistemas masivos de IA que absorben enormes volúmenes de texto digital -de artículos de noticias, publicaciones en redes sociales u otras fuentes de Internet- y utilizan ese material escrito para entrenar software que predice y genera contenido por sí mismo cuando se le da una indicación o consulta. Los modelos pueden utilizarse para tareas como escribir ensayos, redactar tuits, generar conversaciones de chatbot y sugerir códigos de programación informática.
La tecnología se ha hecho popular, y controvertida en los últimos meses a medida que más empresas han empezado a construirlos e introducir pruebas de productos basados en los modelos, poniendo de relieve una nueva área de competencia entre los gigantes tecnológicos. Microsoft (MSFT) está invirtiendo miles de millones en OpenAI, el fabricante de GPT-3, el gran modelo lingüístico con el que funciona el chatbot ChatGPT. El fabricante de software presentó este mes una versión de prueba de su motor de búsqueda Bing con la tecnología de chat de OpenAI, que suscitó una preocupación inmediata por sus respuestas, a veces inapropiadas.
Google, de Alphabet Inc. (GOOGL), tiene un modelo llamado LaMDA, o Modelo de Lenguaje para Aplicaciones de Diálogo. El líder en búsquedas y publicidad en Internet está probando un producto de búsqueda basado en chat y potenciado por IA llamado Bard, que también tiene algunos fallos.
Meta lanzó anteriormente un gran modelo lingüístico llamado OPT-175B, pero LLaMA es un sistema más nuevo y avanzado. Otro modelo que Meta lanzó a finales del año pasado, Galactica, fue retirado rápidamente después de que los investigadores descubrieran que compartía habitualmente información sesgada o inexacta con las personas que lo utilizaban.
Zuckerberg ha hecho de la IA una prioridad dentro de la empresa, hablando a menudo de su importancia para mejorar los productos de Meta en conferencias telefónicas sobre beneficios y en entrevistas. Aunque ahora no se utiliza LLaMA en los productos de Meta, es posible que se haga en el futuro. Por ahora, Meta confía en la IA para todo tipo de funciones, como la moderación de contenidos y la clasificación del material que aparece en los feeds de los usuarios.
Hacer que el modelo LLaMA sea de código abierto permite a los forasteros ver con más claridad cómo funciona el sistema, ajustarlo a sus necesidades y colaborar en proyectos relacionados. El año pasado, Big Science y Hugging Face lanzaron BLOOM, un LLM de código abierto que pretendía hacer más accesible este tipo de tecnología.
--Con la colaboración de Sarah Frier.
Lea más en Bloomberg.com