Google revela una nueva familia de modelos de IA de código abierto

Gemma se construye a partir de la misma investigación y tecnología utilizadas para crear Gemini, sus modelos de código cerrado y las herramientas relacionadas con la IA

Por

Bloomberg — Google, de Alphabet Inc. (GOOGL), está introduciendo nuevos modelos lingüísticos abiertos de gran tamaño a los que llama Gemma, invirtiendo su estrategia general de mantener la tecnología de inteligencia artificial propiedad de la empresa fuera de la vista del público.

Gemma, que sólo manejará texto, se ha construido a partir de la misma investigación y tecnología utilizadas para crear el modelo de IA insignia de la empresa, Gemini, dijo Google el miércoles en una entrada de blog. Se lanzará en dos tamaños, uno dirigido a los clientes que planean desarrollar software de inteligencia artificial utilizando chips de IA y centros de datos de gran capacidad, y un modelo más pequeño para la creación de aplicaciones más rentables.

Google desarrolló la tecnología que sustenta la IA generativa, pero se ha quedado rezagada con respecto a OpenAI y al socio de la startup, Microsoft Corp., en la creación de productos que puedan automatizar tareas como resumir informes, escribir código de software o crear campañas publicitarias. Aunque la publicación de los modelos Gemma, más abiertos, pueda parecer que contrasta con los objetivos anteriores de la empresa en el ámbito de la IA, Google afirmó que se trata simplemente de una continuación de su historia de innovación en el mundo del código abierto.

Los responsables de la empresa señalaron que ya había hecho que su motor interno de IA TensorFlow fuera gratuito para los desarrolladores y que había introducido en el mundo los llamados transformadores, que son los componentes clave de los grandes modelos de lenguaje más utilizados hoy en día, como el popular chatbot de IA de OpenAI, ChatGPT.

“Es una nueva oportunidad para nosotros de construir algo en lo que podamos trabajar con la comunidad para crear nuevas oportunidades en la investigación y el desarrollo de la IA, en colaboración con personas de dentro y fuera de Google”, dijo en una entrevista Tris Warkentin, director de gestión de productos de Google DeepMind.

Algunos observadores (incluidos algunos empleados de Google) han criticado al gigante de las búsquedas en Internet por perder su ventaja en IA a favor de la comunidad de código abierto. El año pasado, el ingeniero de software sénior de Google Luke Sernau escribió una crítica ampliamente compartida sobre la empresa, publicada inicialmente en un sistema interno, en la que argumentaba que muchos investigadores independientes han utilizado herramientas de código abierto para lograr avances rápidos e inesperados en IA. “No tenemos ninguna salsa secreta”, escribió entonces Sernau. “Nuestra mejor esperanza es aprender de lo que hacen otros fuera de Google y colaborar con ellos”.

Opiniones encontradas

En los meses transcurridos desde que la misiva de Sernau se hizo viral, la atención de Google a la IA patentada ha dado paso a un enfoque más amplio, que incluye adentrarse más en el mundo de las herramientas de código abierto. En enero, la empresa forjó un acuerdo para alojar en su red de computación en nube el software de IA de la startup Hugging Face, que fabrica software de IA y proporciona una plataforma para otras empresas, dando a los desarrolladores de código abierto un mayor acceso a la tecnología. Google también ha trabajado con la startup para que los modelos Gemma sean totalmente compatibles con una integración completa en Hugging Face en el momento de su lanzamiento.

El lanzamiento de Gemma complementará el modelo de IA Gemini, el buque insignia de Google, ya que la empresa solicitó la opinión de los desarrolladores y “descubrió que hay ciertos grupos de desarrolladores que no sólo van a utilizar API, sino que también van a utilizar modelos abiertos”, dijo Jeanine Banks, jefa de relaciones con los desarrolladores de Google. Banks dijo que es habitual que los desarrolladores empiecen a crear un software utilizando API como la de Gemini, que les permite crear prototipos, iterar y probar sus ideas fácilmente. Pero los modelos abiertos resultan útiles cuando un desarrollador quiere ampliar sus aplicaciones utilizando sus propios datos, o ver cómo funciona su software utilizando su hardware o infraestructura. “Creemos que la familia de modelos abiertos de Gemma apoya realmente esta historia multiplataforma”, dijo Banks.

Los modelos Gemma se integran con la plataforma empresarial de Google Cloud, Vertex AI, lo que permite a los desarrolladores permanecer dentro del ecosistema de Google en cada fase de la creación de sus herramientas de IA. Mientras tanto, las aplicaciones que los desarrolladores creen utilizando el modelo serán “comercialmente permisivas”, según Banks, lo que significa que los desarrolladores asumirán la propiedad de los productos de software y podrán aplicar los modelos de negocio que tengan sentido para ellos.

Sin embargo, los modelos de IA de código abierto conllevan un mayor riesgo de abuso por parte de quienes quieran entrenar el modelo con contenidos desagradables y utilizarlo para generar resultados explícitos u odiosos. Para mitigar este riesgo, Google afirma que ha desarrollado Gemma de acuerdo con los principios de IA responsable de la empresa.

Cuando los desarrolladores aceptan los términos de la licencia de la empresa para Gemma, se comprometen a cumplir las expectativas de Google sobre cómo debe utilizarse el modelo de IA, y deben utilizar plataformas como Kaggle y Hugging Face que exigen que la gente desarrolle software de forma abierta, dijo Banks de Google. “Aunque es importante que la IA esté ampliamente disponible para el bien, también existe la posibilidad de que sea perjudicial”, dijo.

Lea más en Bloomberg.com