Bloomberg — Desde los primeros libros y películas de ciencia ficción, las computadoras dotadas de inteligencia artificial casi siempre han estado acompañadas de máquinas en movimiento igualmente inteligentes, como androides y otros robots. Sin embargo, en los últimos 15 años aproximadamente, los sistemas de IA que funcionan completamente en software se han vuelto mucho más sofisticados que sus contrapartes en movimiento. Los robots pueden construir automóviles en fábricas y limpiar después de nosotros en casa, pero pueden llevar a cabo un rango relativamente pequeño de tareas en comparación con la naturaleza cada vez más general de los chatbots.
Una startup llamada Physical Intelligence se ha propuesto cambiar esta situación. Formada este año por un equipo de expertos en robótica e IA, la empresa planea crear software que pueda agregar inteligencia de alto nivel a una amplia variedad de robots y máquinas. O, como lo expresa el cofundador y director ejecutivo de Physical Intelligence, Karol Hausman, en la primera entrevista pública de la compañía desde su fundación: “Nuestro objetivo es llevar la IA al mundo físico con un modelo universal que pueda alimentar cualquier robot o cualquier dispositivo físico básicamente para cualquier aplicación”.
El surgimiento de la IA de procesamiento de lenguaje creada por OpenAI, Google y otros ha sido posible gracias al enorme volumen de texto disponible en Internet y en otros archivos. Las compañías pueden entrenar sus modelos de IA alimentándolos con miles de millones de ejemplos de cómo los humanos usan las palabras, un proceso que ha ayudado a las computadoras a “resolver” matemáticamente el lenguaje. Sin embargo, reunir cantidades similares de datos del mundo físico ha resultado mucho más desafiante, limitando el progreso de la IA en el campo de la robótica.
La tesis de Physical Intelligence es que ha llegado el momento de un nuevo enfoque para construir modelos de IA para la robótica. La compañía busca fusionar las técnicas utilizadas para construir modelos de lenguaje con sus propias técnicas para controlar e instruir a las máquinas. El objetivo final sería crear una IA que funcione como un tipo de sistema robótico de propósito general.
Hausman pasó los últimos años como científico trabajando en robótica en Google. Sus otros cofundadores incluyen a Sergey Levine, quien ha realizado trabajos pioneros en robótica como profesor en la Universidad de California, Berkeley; Chelsea Finn, profesora en la Universidad de Stanford; Brian Ichter, ex investigador de Google; y Lachy Groom, ex ejecutivo de la empresa de pagos Stripe e inversor tecnológico destacado. Según una persona familiarizada con sus inversores que no estaba autorizada para hablar públicamente sobre la inversión, su compañía ha recaudado US$70 millones de Thrive Capital, OpenAI, Sequoia Capital, Greenoaks Capital Partners, Lux Capital y Khosla Ventures.
Los esfuerzos por mejorar el software que impulsa a los robots se han llevado a cabo durante décadas. Específicamente, una compañía llamada Willow Garage, formada en 2006, pasó varios años intentando construir un tipo de software de propósito general que pudiera ser compartido entre los robots y darles un conjunto unificado de funciones básicas. Si bien su software fue adoptado por varias compañías y desarrolladores de robótica, el trabajo de Willow Garage no supuso un gran avance en la inteligencia robótica, y la empresa cerró sus operaciones en 2014.
Otras compañías como Rethink Robotics intentaron construir sistemas que podían aprender a hacer trabajos copiando los movimientos que les mostraban los humanos. Varias startups han implementado recientemente IA que utiliza la repetición para enseñar a los brazos robóticos a recoger objetos y realizar tareas similares a las realizadas por los humanos en almacenes. Otros han empezado a construir androides diseñados para imitar los movimientos humanos. Una de estas startups, Figure AI Inc., acaba de recaudar US$675 millones de OpenAI, Nvidia (NVDA), Jeff Bezos y Microsoft (MSFT) para ayudar a construir robots que trabajen en instalaciones logísticas y de fabricación.
En lugar de centrarse en tipos específicos de brazos robóticos o androides industriales, Physical Intelligence quiere desarrollar software que se pueda aplicar a muchos tipos de robótica. Para ello, se ha puesto a trabajar en la creación de su propio modelo de IA diseñado para dotar a las máquinas de habilidades humanas básicas. “Creo que es realmente genial lo que las personas están construyendo con humanoides”, dice Groom. “Pero lo que fundamentalmente hace interesantes a los humanos es el cerebro, no nuestro hardware. Somos los máximos generalistas”.
En los últimos años, los investigadores han publicado una serie de artículos que muestran cómo los robots ya están adquiriendo nuevos niveles de inteligencia a partir de los modelos de IA de lenguaje e imágenes. Por ejemplo, si le dices a un brazo robótico que ate un zapato, puede usar la IA para encontrar los conceptos básicos de un zapato y los cordones, así como información sobre lo que generalmente implica atar un zapato. Si bien esto es un buen comienzo, el hardware de los robots aún necesita cierto nivel de entrenamiento para realmente llevar a cabo tareas físicas. Esto ha sido un desafío importante, ya que hacer que los robots realicen tareas suficientes para aprender cada nuevo trabajo lleva tiempo y dinero.
Physical Intelligence aún no ha revelado exactamente cómo planea superar este problema. Los cofundadores de la compañía afirman que no construirán su propio hardware, sino que comprarán una variedad de robots diferentes y capacitarán sus modelos de IA en ese hardware. Según la compañía, el objetivo es recopilar el conjunto de datos de robótica más grande creado hasta la fecha.
Physical Intelligence enfrenta la competencia de compañías como Figure AI y Tesla Inc. (TLSA) que están fabricando androides, así como otras compañías que trabajan en software de robótica de propósito general. A principios de esta semana, por ejemplo, la startup de siete años Covariant anunció que también ha estado desarrollando un nuevo tipo de modelo de robótica que aprovecha los avances en IA de lenguaje, imagen y video para mejorar las habilidades de sus brazos robóticos.
Los cofundadores de Physical Intelligence sostienen que han estado trabajando en los desafíos de la IA para la robótica durante años y han desarrollado enfoques novedosos para problemas que han frenado a otros en el campo. "Realistamente, creo que necesitaremos un esfuerzo de investigación largo y muy serio para lograr esto", dice Levine. "Pero hay suficientes señales de que los mayores obstáculos para utilizar robots en el mundo real ahora son solucionables".
Lea más en Bloomberg.com