Bloomberg — Desde hace días se viene hablando de una empresa emergente de inteligencia artificial de origen chino que se opondría a ChatGPT.
En el Foro Económico Mundial celebrado en Davos la semana pasada, algunos mencionaron a DeepSeek, con sede en Hangzhou, y su modelo R1, recientemente publicado, como una razón de peso para que países como Estados Unidos estén redoblando sus esfuerzos en los avances de la IA. En los foros de chat de tecnología, los ingenieros habían empezado a comparar su rendimiento de programación con los modelos líderes de empresas como OpenAI y Microsoft Corp. (MSFT) Su producto ascendió silenciosamente en la clasificación de los mejores en una tabla de clasificación de IA afiliada a UC Berkeley.
Entonces, en las últimas 36 horas, el interés por la startup explotó. Pesos pesados de Silicon Valley, como el inversor Marc Andreessen y el padrino de la IA y científico jefe de Meta Platforms Inc. (META) Yann LeCun, empezaron a amontonarse en la conversación, y Andreessen calificó el modelo de DeepSeek como “uno de los avances más asombrosos e impresionantes” que ha visto nunca.
Lea más: Traders dicen que DeepSeek es una amenaza para las acciones tech de EE.UU.
Al final del fin de semana, el asistente de inteligencia artificial de DeepSeek se había disparado a lo más alto de las listas de descargas del iPhone de Apple Inc. (AAPL) y se situaba entre los más descargados de la Play Store de Google, poniendo a prueba los sistemas de la startup hasta el punto de que el servicio se cayó durante más de una hora. Finalmente, la empresa se vio obligada a limitar las inscripciones a quienes tuvieran números de teléfono de China continental, pero afirmó que la medida era el resultado de “ataques maliciosos a gran escala” contra sus servicios.
Las consecuencias de la aparentemente repentina oleada de interés en torno a DeepSeek fueron rápidas y graves: el modelo de IA de la empresa, que afirma haber desarrollado a una fracción del coste de sus rivales sin sacrificar significativamente el rendimiento, provocó una caída de casi un billón de dólares en las acciones tecnológicas estadounidenses y europeas, ya que los inversores cuestionaron los planes de gasto de algunas de las mayores empresas de Estados Unidos. Solo el desplome de las acciones del fabricante de chips de inteligencia artificial Nvidia Corp. (NVDA) eliminó el lunes un récord de US$589.000 millones en valor bursátil de la mayor empresa del mundo.
Algunas acciones, incluida Nvidia, borraron más tarde algunas pérdidas en las operaciones posteriores al cierre.
El lunes, estaba claro que el abrumador interés por los servicios de DeepSeek estaba pasando factura al sistema de la empresa. “Actualmente, solo se admite el registro con un número de teléfono móvil de China continental”, dijo la startup en su página. DeepSeek no especificó si las restricciones de registro son temporales o cuánto durarán.
Ha sido la interrupción importante más larga de la empresa desde que empezó a informar sobre su estado. A diferencia de algunos rivales, el asistente de DeepSeek muestra su trabajo y razonamiento a medida que responde a la consulta o pregunta escrita de un usuario. Las reseñas en la tienda de aplicaciones de Apple y en Android Play Store de Alphabet Inc. (GOOGL) elogiaron esa transparencia.
Fundada por Liang Wenfeng, jefe de un fondo cuantitativo, el modelo de IA de código abierto de DeepSeek está estimulando un replanteamiento de los miles de millones de dólares que las empresas han estado gastando para mantenerse a la cabeza en la carrera de la IA.
Vea más: ¿Por qué DeepSeek sacude las acciones de las gigantes tecnológicas de EE.UU.?
“Aunque está por ver si DeepSeek demostrará ser una alternativa viable y más barata a largo plazo, las preocupaciones iniciales se centran en si el poder de fijación de precios de los gigantes tecnológicos estadounidenses se está viendo amenazado y si su gasto masivo en IA necesita una reevaluación”, afirmó Jun Rong Yeap, de IG Asia.
Como todos los demás modelos de IA fabricados en China, DeepSeek se autocensura en temas considerados políticamente sensibles en China. A diferencia de ChatGPT, DeepSeek desvía las preguntas sobre la plaza de Tiananmen, el presidente Xi Jinping o la posibilidad de que China invada Taiwán. Esto puede resultar chocante para los usuarios internacionales, que quizá no hayan entrado antes en contacto directo con los chatbots chinos.
El éxito inicial ofrece un contrapunto a las expectativas de que la IA más avanzada requerirá cada vez más potencia de cálculo y energía, una suposición que ha llevado las acciones de Nvidia y sus proveedores a máximos históricos.
El costo exacto del desarrollo y el consumo de energía de DeepSeek no están totalmente documentados, pero la startup ha presentado cifras que sugieren que su costo fue solo una fracción de los últimos modelos de OpenAI. El hecho de que un modelo de IA pequeño y eficiente surgiera de China, que ha sido objeto de una escalada de sanciones comerciales por parte de EE.UU. a los chips avanzados de Nvidia, también pone en tela de juicio la eficacia de tales medidas.
"EE.UU. es genial en investigación e innovación y, sobre todo, en avances, pero China es mejor en ingeniería", afirmó el informático Kai-Fu Lee a principios de este mes en el Foro Financiero Asiático de Hong Kong. "En los tiempos que corren, cuando la potencia de cálculo y el dinero son limitados, se aprende a construir cosas de forma muy eficiente".
Por su parte, Nvidia, el mayor proveedor de chips utilizados para entrenar el software de IA, describió el nuevo modelo de DeepSeek como un “excelente avance de la IA” que cumple plenamente con las restricciones del gobierno estadounidense en materia de exportación de tecnología. El trabajo de la startup “ilustra cómo se pueden crear nuevos modelos” utilizando una técnica conocida como escalado de tiempo de prueba, dijo la compañía.
Vea además: Nvidia califica a DeepSeek como un “excelente” avance en IA y descarta dudas sobre la startup.
La declaración de Nvidia pareció descartar las sospechas de algunos analistas y expertos de que la startup china no podría haber realizado el avance que ha afirmado. La compañía también señaló que la inferencia, el trabajo de ejecutar realmente modelos de IA y utilizarlos para procesar datos y hacer predicciones, requiere no obstante una gran cantidad de sus productos.
"La inferencia requiere un número significativo de GPU de Nvidia y redes de alto rendimiento", afirmó la compañía.
Lea más en Bloomberg.com