Bloomberg — Microsoft Corp. (MSFT) está eliminando la lista de espera para probar su nueva búsqueda y chat Bing basados en OpenAI, y añadiendo funciones como la posibilidad de solicitar y publicar imágenes en un esfuerzo por mantener su renovado impulso en el mercado.
Los usuarios pueden buscar una imagen, como un osito de ganchillo, por ejemplo, y preguntar a Bing: “¿Cómo hago esto?”. La herramienta de IA sugiere entonces sitios web de “cómo hacer ganchillo” y otros tipos de proyectos de manualidades para explorar. Yusuf Mehdi, vicepresidente de Microsoft, declaró en una entrevista que la función de búsqueda visual estará disponible en las próximas semanas o meses. Utiliza el sistema GPT-4 de OpenAI, que permite las llamadas funciones multimodales que combinan texto e imágenes. Aunque OpenAI anunció esta función en marzo, hasta ahora ha ofrecido pocos ejemplos.
Otras nuevas funciones de Bing llegarán antes, como la posibilidad de utilizar servicios de terceros como OpenTable y Wolfram Alpha a través del chat de Bing y obtener respuestas que incluyan vídeos y gráficos, explicó Mehdi. En una demostración en Manhattan, los representantes de Bing mostraron algunas de sus funciones en demostraciones prácticas, mostrando cómo un usuario puede escribir, por ejemplo, “Búscame una reserva para cenar dos personas en Nueva York esta noche”, y obtener un enlace al servicio de reservas OpenTable.
Microsoft revolucionó el mercado de las búsquedas en febrero cuando presentó una revisión completa de Bing, incorporando ChatGPT de OpenAI y ofreciendo la posibilidad de renovar la competencia en un mercado dominado durante años por Google, de Alphabet Inc. Según Mehdi, el nuevo software ha albergado 500 millones de sesiones de chat en los últimos 90 días. El movimiento empujó a Google a introducir sus propias herramientas de IA Bard, esfuerzos que mantuvo en gran medida dentro de sus propios laboratorios hasta que Microsoft amenazó el negocio publicitario altamente rentable de la compañía.
“El chat es realmente lo que está resonando entre la gente y, de hecho, está transformando la búsqueda”, afirmó Mehdi. Alrededor del 70% de las personas que prueban las funciones de chat las utilizan para tareas relacionadas con las búsquedas, y Microsoft considera que esos clientes realizan muchas más búsquedas.
Satya Nadella, consejero delegado de Microsoft, declaró el mes pasado que las instalaciones de la aplicación Bing se han cuadruplicado desde el lanzamiento del producto basado en inteligencia artificial, y que Bing aumentó su cuota de mercado en EE.UU. durante el trimestre, sin dar más detalles. Estos esfuerzos forman parte de un cambio más amplio en Microsoft para aprovechar la mayor inversión de la empresa en OpenAI e integrar la IA en todos los productos importantes.
Las nuevas funciones de búsqueda visual supondrán un mayor desafío para el equipo de IA de Microsoft Responsible, que ha estado tratando de hacer frente a contenidos sesgados, perturbadores o inapropiados a medida que cientos de millones de usuarios prueban el nuevo producto. Microsoft afirma que ha hecho progresos, pero sigue trabajando en problemas que también incluyen la desinformación y las respuestas incorrectas o incompletas. Mehdi explicó que una de las razones por las que las funciones visuales aún no están disponibles es que el equipo está trabajando para garantizar la seguridad.
“Hay mucho trabajo para revisar la tecnología y los planes”, dijo Mehdi. “¿Es perjudicial? ¿Es transparente? ¿Es inclusiva? ¿No tiene prejuicios? Vamos a hacer lo mismo con las imágenes, y añadir multimodal añade otro grado de complejidad”.
Microsoft desveló las nuevas funciones en un acto para la prensa celebrado en Nueva York, donde se demostraron las últimas capacidades de Bing a través de un bar de zumos en el que el chatbot generó recetas de bebidas y tarjetas de recuerdo personalizadas para los asistentes.
Bing también mejorará su capacidad de resumir documentos largos. Y la empresa está mejorando la función de historial de chat: Microsoft planea que pronto se pueda acceder fácilmente a los historiales de búsqueda de los usuarios en una barra lateral que recorre su navegador Edge. Los usuarios podrán volver a conversaciones anteriores y empezar donde lo dejaron.
Lee más en Bloomberg.com