La IA Física está volando: de los WLM a los WAM
Analizamos el estado de desarrollo de los modelos de IA Física para robots
Tienes dos formas de verlo, va tan rápido que no da tiempo a asimilarlo. Cuando ya te habías aprendido qué era un VLA, tienes que entender qué es un WLM y casi sin darte cuenta ahora estamos hablando de los WAM.
La otra forma de pensar es darle la bienvenida a la velocidad porque eso quiere que cada vez estamos más cerca de poder tener robots con IA haciendo todo tipo de trabajos que las personas no queremos hacer.
Dicho esto, vamos a poner un poco de orden en todos estos acrónimos y ver por qué son importantes para el futuro de la robótica.
VLA Vision - Language - Action
Visión → percepción visual
Language → comprensión lingüística
Action → acción física
Son modelos que conectan visión, lenguaje y control motor.
WLM World Language Model
World → representación/modelado del mundo
Language → interfaz semántica o razonamiento
Model → sistema predictivo
La idea es modelar las dinámicas del mundo físico y sus consecuencias.
WAM World Action Model
World → entorno físico
Action → acciones/interacciones
Model → predicción dinámica
Bien, de los VLA y los WLM ya hemos hablado mucho por aquí, por ejemplo, la empresa 1X, pionera en poner a la venta a su robot NEO en modo suscripción desarrolló en 2025 su propio VLA y en 2026 su propio WLM, pero ¿de dónde sale entonces lo de WAM?
Si lo simplificamos mucho, los WAM son la fusión entre los VLA y los WLM. O dicho de otra forma, los VLA sirven para dar autonomía al robot, pero cuando este se enfrenta al mundo real requiere de información de la física que debe proporcionarle el WLM, entonces si unimos ambos tipos de modelos de IA lo que tenemos es un WAM.
Por lo tanto, los World Action Models apuntan a una evolución de los VLA: pasan de mapear visión y lenguaje hacia acciones, a modelar explícitamente cómo cambia el mundo cuando el robot actúa.
Un VLA típico responde a una instrucción usando visión y lenguaje para producir una acción. Un WAM añade la capa más física: predecir el próximo estado del mundo y la acción que conduce a él.
Desde la aparición de los VLA los robots han mejorado mucho la conexión entre lenguaje, visión y control, pero siguen teniendo una debilidad: pueden entender bien los objetos y la instrucción, pero fallar en la dinámica física fina.
Para verlo con un ejemplo pueden entender “recoge el objeto”, pero no necesariamente comprender bien la fricción, el peso, la deformación, el deslizamiento, el rebote, la estabilidad y por lo tanto las consecuencias de una acción.
Y aquí es donde aparece DreamZero de NVIDIA que plantea precisamente que los VLA generalizan bien semánticamente, pero tienen problemas al enfrentarse a movimientos físicos no vistos en entornos nuevos. Por lo tanto, propone los WAM como modelos que combinan vídeo y acción para mejorar esa generalización, lo cual reporta más del doble de mejora frente a un VLA de referencia en experimentos con robots reales.
Si quieres saber más sobre esto de los WAM y en general sobre el estado del arte esta tecnología te recomiendo ver el vídeo Jim Fan, que es el director de robótica de NVIDIA, además de una de las personas con una visión más clara de cómo debe evolucionar el desarrollo de la IA Física.
Más noticias sobre IA Física y Robótica
🦾 Figure acaba de realizar una demo con 3 de sus robots humanoides haciendo turnos durante 8 horas en una instalación de clasificación de paquetes en el servicio postal. El trabajo que tiene que hacer el robot es colocar el paquete de forma que la etiqueta pueda ser escaneada en otra zona de la cinta transportadora.
🖐️ Genesis AI presenta GENE-26.5, su primer sistema de modelo fundacional robótico orientado a manipulación de nivel humano. Lo interesante es que no lo plantea como una demo aislada, sino como un sistema completo que combina hardware, datos, control, simulación y modelo para resolver tareas largas y con mucho contacto como cocinar, pipetear, resolver un cubo de Rubik o tocar el piano.
🧠 Neuralink muestra su ambición de construir un robot quirúrgico capaz de alcanzar cualquier región del cerebro. El objetivo declarado es crear una interfaz neuronal generalizada para tratar condiciones que se originan en el cerebro, lo que convierte a la robótica de precisión médica en una pieza central de la interfaz humano-máquina.
🚚 Actor Labs anuncia una ronda de 4 millones de dólares y muestra sus modelos robóticos desplegados en el mundo real. La señal importante es que cada vez aparecen más startups construyendo modelos visuales y de acción para máquinas físicas, no solo software de IA, buscando que los robots puedan operar con percepción robusta en entornos reales.
🦺 Persona AI se alía con Under Armour para desarrollar ropa técnica y materiales de protección para humanoides industriales. Puede sonar anecdótico, pero cuando los robots salgan del laboratorio a astilleros, acerías o fábricas, necesitarán protección térmica, resistencia a la abrasión y durabilidad operativa igual que cualquier otra herramienta industrial.
📈 RoboStrategy empieza a cotizar en Nasdaq bajo el ticker BOT como vehículo de inversión centrado en robótica e IA física. Su cartera incluye compañías privadas como Figure, Apptronik y Allonic, abriendo una vía para que inversores minoristas tengan exposición al sector humanoide sin esperar a que cada startup salga a bolsa.
🏭 1X abre las puertas de su fábrica de NEO en Estados Unidos, descrita como una instalación altamente integrada donde componentes críticos se fabrican internamente. El dato clave es el ciclo de cuatro semanas desde CAD hasta robot terminado, una señal de que la carrera de los humanoides empieza a medirse también por velocidad industrial y capacidad de fabricación, no solo por demos.
🤌 Hangzhou Xynova presenta Flex 2, una mano diestra híbrida que combina transmisión por cable y accionamiento directo. Incluye percepción táctil y una cámara situada en la muñeca, no en la palma, reforzando una idea clave en manipulación: el avance de los humanoides dependerá tanto de los modelos como de manos capaces de sentir, agarrar y coordinar contactos finos.
🤝 Humanoid firma un acuerdo con Schaeffler para desplegar miles de robots humanoides en fábricas hasta 2032. El despliegue comenzará en Alemania a finales de 2026 y se estructura como RaaS, con Schaeffler además como proveedor preferente de actuadores, una combinación muy clara de cliente industrial y socio de cadena de suministro.
🚀 Rocket Lab ha comprado la empresa Motiv Space Systems, especializada en robótica espacial, control de movimiento y mecanismos de precisión para naves. La adquisición añade tecnología probada en rovers de Marte y lleva internamente componentes críticos como mecanismos de orientación de paneles solares, mostrando que la robótica también será clave en la industrialización del espacio.


