Así es el nuevo agente de IA de OpenAI con el que se pueden reservar vuelos y pedir comida

El servicio, llamado Operator, puede llevar a cabo una amplia gama de tareas utilizando Internet de forma muy parecida a como lo haría un humano, incluyendo la navegación a un sitio web, tecleando y pulsando botones.

OpenAI planea liberar finalmente el modelo de IA que hay detrás de Operator para que los desarrolladores puedan utilizarlo para crear sus propios agentes.
Por Rachel Metz
24 de enero, 2025 | 11:29 AM

Bloomberg — OpenAI está lanzando una herramienta de inteligencia artificial que puede ayudar a reservar vuelos, planificar pedidos de comestibles e incluso completar compras para los usuarios, uniéndose así a un creciente número de empresas tecnológicas que apuestan por los llamados agentes de IA que actúan en nombre de una persona.

El servicio, llamado Operator, puede llevar a cabo una amplia gama de tareas utilizando Internet de forma muy parecida a como lo haría un humano, incluyendo la navegación a un sitio web, tecleando y pulsando botones, según informó OpenAI el jueves. El software de Operator funciona combinando algunas de las funciones de visión por ordenador de OpenAI con capacidades de resolución de problemas en varios pasos destinadas a imitar la forma de razonar de las personas, según la empresa. Bloomberg News informó por primera vez sobre los planes de OpenAI para Operator en noviembre.

PUBLICIDAD

Inicialmente, OpenAI está lanzando lo que denomina un “avance de investigación” de Operator en línea a un número limitado de clientes estadounidenses que pagan US$200 al mes por la suscripción ChatGPT Pro, presentada recientemente. La empresa afirma que espera aprender de los primeros usuarios de Operator para poder mejorar el producto y planea ofrecerlo a más clientes de pago con el tiempo. También tiene previsto lanzar otros agentes de IA en los próximos meses, según declaró el CEO de OpenAI, Sam Altman, durante una retransmisión en directo en la que presentó el producto.

Lea más: SoftBank y OpenAI planean desembolsar US$19.000 millones cada una a Stargate: The Information.

El lanzamiento de Operator forma parte de un impulso más amplio de la industria hacia los agentes, o software de IA que puede completar tareas de varios pasos para los usuarios con una supervisión mínima. Microsoft Corp. (MSFT), impulsora de OpenAI, y su rival Anthropic han lanzado sus propias versiones de software de agente, al igual que otras empresas emergentes. Las empresas esperan que estas herramientas puedan ahorrar tiempo a los usuarios en sus tareas personales y profesionales y cumplir así la promesa, largamente sostenida, de que la IA hará que las personas sean más productivas. Altman afirmó anteriormente que los agentes serán “el próximo gran avance” de la IA.

En una demostración de la herramienta el miércoles, Peter Welinder, vicepresidente de producto de OpenAI, y Yash Kumar, que dirige el producto y la ingeniería de Operator, mostraron cómo la herramienta podía buscar una reserva en un restaurante o reconocer los artículos de una lista escrita a mano para preparar un pedido de comestibles en línea. Kumar dijo que OpenAI se asoció con varias empresas para la herramienta, entre ellas Instacart, OpenTable, Uber y StubHub, en parte para garantizar que Operator funcionara bien en sus sitios web.

Después de que Kumar pidiera a Operator que utilizara OpenTable para reservar una mesa en el restaurante Beretta de San Francisco sobre las 7 de la tarde, la herramienta abrió una ventana del navegador remoto, fue al sitio web de OpenTable y buscó el restaurante, pero en un principio no pudo encontrarlo. Resultó que OpenTable estaba configurado para buscar restaurantes en Iowa, no en California. Pero Kumar había indicado previamente a Operator que buscara dentro de un determinado código postal de San Francisco para consultas relevantes, así que por sí sola, la herramienta pasó a buscar en OpenTable en San Francisco y luego compartió una reserva para que él la aprobara.

Vea más: Google invierte otros US$1.000 millones en Anthropic, rival de OpenAI.

“Vemos mucho potencial en cómo esto puede evolucionar de las cosas pequeñas a las medianas y a las grandes”, dijo Kumar a Bloomberg News. Él personalmente ha estado utilizando Operator para hacer la compra en el supermercado y para hacer reservas en pistas de tenis.

PUBLICIDAD

Operator también puede realizar varias tareas simultáneamente. Por ejemplo, un usuario puede pedir al servicio que encuentre un hotel en Vancouver que tenga bicicletas Peloton en su gimnasio y, a continuación, antes de que haya terminado, pedir a Operator que encuentre una cama para muñecas American Girl en Craigslist. Siempre que un usuario haya confirmado que Operator puede llevar a cabo una transacción, como comprar un par de leggings en una tienda en línea, y haya introducido las credenciales y la información de pago necesarias, la herramienta debería ser capaz de completar una compra, dijo Kumar.

OpenAI planea liberar finalmente el modelo de IA que hay detrás de Operator para que los desarrolladores puedan utilizarlo para crear sus propios agentes.

Con estas capacidades, sin embargo, los agentes de IA como Operator también presentan nuevos riesgos de seguridad y protección, dado el potencial de la IA para cometer errores o ser mal utilizada por malos actores. Una cosa es que un chatbot dé una respuesta inexacta a una pregunta sobre un acontecimiento histórico y otra muy distinta que un agente se equivoque con la tarjeta de crédito de alguien.

OpenAI dijo que Operator está pensado para rechazar algunas tareas, como las acciones relacionadas con la banca y cualquier cosa que la empresa considere perjudicial. Hay una serie de acciones que la herramienta no completará y que, en su lugar, alertará al usuario para que las lleve a cabo, como iniciar sesión en sitios web, proporcionar información de pago y rellenar CAPTCHAs, según la empresa. Operator debe pedir la aprobación de un usuario antes de realizar acciones como pedir algo en línea. Para algunas tareas, como escribir correos electrónicos, el servicio requerirá que un usuario lo supervise, dijo OpenAI. Los usuarios también pueden tomar el control de cualquier tarea que esté en proceso y pausarla si es necesario.

“El usuario siempre debe sentir que tiene el control”, dijo Kumar.

Lea más en Bloomberg.com