Nueva idea de Musk: Optimus podría aprender a doblar ropa viendo videos
Tesla está preparando un "nuevo material de entrenamiento" para su robot humanoide Optimus, dejando de depender de trajes de captura de movimiento y control remoto, y optando por entrenarlo mediante la visualización de videos.
Tesla (TSLA.O) está adoptando un plan probado para entrenar su robot humanoide. Según personas familiarizadas con el asunto, el fabricante de vehículos eléctricos informó a los empleados a finales de junio que el proyecto Optimus se centraría más en el enfoque de “visión pura”.
Anteriormente, Tesla utilizaba trajes de captura de movimiento y visores de realidad virtual para registrar los datos de los operadores humanos y controlar el robot a distancia. Ahora, la empresa entrenará principalmente al robot grabando videos de trabajadores realizando tareas, como enseñarle a recoger objetos o doblar camisetas.
Las fuentes indicaron que la empresa afirmó que eliminar los trajes de captura de movimiento y el control remoto permitirá al equipo ampliar la escala de recopilación de datos más rápidamente.
Este cambio marca un ajuste importante en la estrategia robótica de Tesla, alineando a Optimus con la creencia de larga data del CEO Elon Musk de que la inteligencia artificial puede aprender tareas complejas solo a través de cámaras. Tesla ha entrenado su software de conducción autónoma utilizando un método similar.
Este cambio se produce poco después de la renuncia de Milan Kovac, jefe del proyecto Optimus. Según las fuentes, el jefe de IA Ashok Elluswamy ha asumido el liderazgo del proyecto.
La captura de movimiento y el control remoto son prácticas estándar en la industria robótica. Por ejemplo, la empresa líder en robótica Boston Dynamics ha utilizado el control remoto para entrenar a su robot Atlas. Durante el entrenamiento, los trabajadores usan trajes de captura de movimiento para realizar diversas tareas, cuyos datos luego se introducen en el robot. Los trajes de captura de movimiento también pueden utilizarse para controlar el robot a distancia.
Aún no está claro si Tesla volverá a priorizar la captura de movimiento y el control remoto en el futuro, o si continuará desarrollando sobre la base de los datos de video recopilados anteriormente.
Robert Griffin, científico investigador senior del Instituto de Cognición Humana y de Máquinas, afirma que una gran cantidad de datos de control remoto permite que los robots aprendan interactuando físicamente con el entorno. Señala que depender únicamente de datos de video dificulta que los robots traduzcan con precisión las acciones del video al mundo real.
“Si solo usas datos de video, no hay interacción física directa”, dijo.
Doblar camisetas y recoger objetos
Musk anunció por primera vez en 2021 que Tesla planeaba desarrollar un robot humanoide llamado Optimus. El multimillonario afirmó que el robot eventualmente podría realizar tareas como trabajo en fábricas y cuidado asistencial.
El año pasado, la empresa contrató “operadores de recopilación de datos”. Estos puestos implicaban ejecutar y registrar tareas domésticas básicas. Según la oferta de empleo, los operadores debían usar trajes de captura de movimiento y visores de realidad virtual durante largos períodos.
Hasta finales de junio, el proyecto aún incluía el entrenamiento de Optimus mediante control remoto y trajes de captura de movimiento. Las fuentes indicaron que los trabajadores pasaban mucho tiempo lidiando con problemas tanto del vestuario como del propio robot, lo que limitaba la cantidad de datos que el equipo podía recopilar.
Desde el cambio en el método de entrenamiento, los trabajadores han comenzado a grabar sus movimientos utilizando un conjunto de cinco cámaras fabricadas por Tesla. Según las fuentes, estas cámaras están instaladas en cascos y mochilas pesadas que llevan los trabajadores, grabando en todas las direcciones y proporcionando datos precisos sobre el entorno al modelo de IA.
Christian Hubicki, director del laboratorio de robótica de la Facultad de Ingeniería Conjunta de la Universidad A&M de Florida y la Universidad Estatal de Florida, señaló que estas cámaras desde diferentes ángulos podrían permitir a Tesla captar detalles más sutiles, “como la posición de las articulaciones y los dedos”, y mejorar la localización del robot. Agregó que estos videos también podrían complementar los datos recopilados previamente mediante control remoto.
Durante el entrenamiento, los trabajadores reciben instrucciones de tareas específicas, especialmente en lo que respecta a los movimientos de las manos, para garantizar que las acciones se vean lo más humanas posible. Un empleado comentó que podrían pasar meses repitiendo la misma tarea simple.
Jonathan Aitken, experto en robótica de la Universidad de Sheffield, dijo que Tesla probablemente necesitará encontrar una manera para que Optimus aprenda diversas tareas a través de movimientos generalizables.
“A esta escala, deben tener un conjunto de movimientos universales, de lo contrario, entrenar todas las tareas tomaría muchísimo tiempo”, dijo Aitken.
Agregó que Tesla podría adoptar una estrategia similar a la de la empresa Physical Intelligence, que entrena a los robots con grandes cantidades de datos de demostración para que aprendan habilidades transferibles y las apliquen de manera flexible, en lugar de memorizar tareas individuales.
“Un desarrollo robótico muy al estilo Tesla”
Esta nueva estrategia es coherente con la forma en que Tesla entrena su software de conducción autónoma. Otras empresas de conducción autónoma utilizan sensores como lidar y radar de ondas milimétricas para entrenar el software, mientras que Tesla depende principalmente de cámaras.
La empresa recopila datos de millones de vehículos Tesla equipados con 8 a 9 cámaras. Musk ha señalado que el lanzamiento del software de conducción asistida de Tesla en China se logró tras entrenar el sistema de IA con videos públicos de calles asiáticas.
En la conferencia de resultados de enero de este año, Musk admitió que “los requisitos de entrenamiento para el robot humanoide Optimus podrían ser al menos 10 veces mayores que los necesarios para los automóviles”.
“Es una forma muy al estilo Tesla de desarrollar robots. Ninguna otra empresa está intentando hacerlo a esta escala”, dijo Aitken. “Necesitan una cantidad de datos tan grande como la que usan para entrenar los autos.”
Alan Fern, experto en IA y robótica de la Universidad Estatal de Oregón, afirmó que entrenar a Optimus es incluso más desafiante para Tesla que desarrollar vehículos autónomos.
“Conducir es solo una tarea”, dijo. Aprender principalmente a través de videos “requiere que el robot comprenda lo que sucede en el video y tenga las habilidades para completar la tarea. Algunas cosas se pueden aprender observando, pero otras requieren práctica en simuladores o en el mundo real.”
Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.

