Las empresas de IA apuestan por modelos eficientes que funcionan con menos chips

Algunos ejecutivos de IA sostienen que la atención prestada a DeepSeek es positiva para la industria, ya que indica que puede ser más barato desplegar sistemas avanzados de IA de lo que se pensaba.

Centro de datos
Por Rachel Metz
16 de marzo, 2025 | 12:27 PM

Bloomberg — Casi dos meses después de que el éxito viral del DeepSeek chino provocara un ajuste de cuentas sobre cuánto gastan las empresas tecnológicas en desarrollar sistemas de inteligencia artificial, algunas de las principales empresas de IA están adoptando un enfoque de “menos es más”.

El jueves, Cohere Inc., con sede en Toronto, anunció un nuevo modelo llamado Command A que puede llevar a cabo complicadas tareas empresariales funcionando con solo dos de los chips A100 o H100 de Nvidia Corp. (NVDA) centrados en la IA. Eso es significativamente menos que el número de chips necesarios para algunos modelos grandes y también menos de lo que se cree que necesita el sistema de DeepSeek.

PUBLICIDAD

Un día antes, Google (GOOGL), de Alphabet Inc, presentó una nueva serie de sus modelos de IA Gemma que, según dijo, pueden funcionar con un solo chip Nvidia H100. Ambas empresas afirmaron que sus modelos rivalizaban o superaban al sistema de IA más reciente de DeepSeek en determinadas tareas.

Leer más: Las gigantes tecnológicas en la mira: Microsoft enfrenta investigación antimonopolio en EE.UU.

Las empresas de IA, incluida Google, siguen invirtiendo miles de millones de dólares en centros de datos, chips y talento para desarrollar sus modelos más vanguardistas y apoyar la adopción generalizada de los mismos. Pero los recientes lanzamientos también insinúan un impulso en toda la industria para fabricar software de IA que pueda funcionar de la forma más eficiente posible.

Aunque algunos de estos proyectos, incluido el nuevo modelo de Cohere, se pusieron en marcha antes del lanzamiento más reciente de DeepSeek, el frenesí en torno al advenedizo chino solo puede acelerar este esfuerzo más amplio.

En enero, DeepSeek lanzó un software de IA de código abierto que rivalizaba con los modelos de OpenAI y Google, y que supuestamente se había construido por una fracción del coste de los modelos de la competencia. Al equipo de DeepSeek se le ocurrieron algunas innovaciones sencillas pero clave, como encontrar la forma de sacar más partido a los chips informáticos a los que tenían acceso. Algunos ejecutivos de la IA sostienen que la inmensa atención prestada a DeepSeek es positiva para la industria, ya que indica que puede ser más barato desplegar sistemas avanzados de IA de lo que se pensaba.

“Creo que el servicio que prestó DeepSeek fue hacer que el mercado tomara conciencia de lo ineficaces que han sido muchos actores”, afirmó en una entrevista Aidan Gomez, cofundador y director ejecutivo de Cohere. “Fue una llamada de atención muy saludable”.

Leer más: Desde la incertidumbre arancelaria hasta dudas sobre su IA afectan las acciones de Apple

PUBLICIDAD

Cohere dijo que empezó a trabajar en el nuevo modelo hace ocho meses, antes de que DeepSeek revolucionara el mundo de la tecnología. Para Cohere, que se centra en los usos empresariales de la IA y que recientemente fue valorada en US$5.500 millones, hay un beneficio añadido en este enfoque. Ejecutar modelos de IA en menos chips es “crucial” para los clientes empresariales, que pueden tener un acceso limitado a la potencia informática.

“No disponen de decenas, por no hablar de cientos, de GPU para poder desplegarse frente a los problemas”, dijo Gómez, refiriéndose a las unidades de procesamiento gráfico. “Así que necesitan un factor de forma muy ligero y escalable”.

Lea más en Bloomberg.com.