
Resumen:
- NVIDIA Cosmos 3 es un nuevo modelo de base abierta para IA física que lidera las clasificaciones, construido sobre una innovadora arquitectura de mezcla de transformadores (mixture-of-transformers) para el razonamiento de IA física, la simulación de mundos y la generación de acciones;
- Cosmos 3 es el primer omnimodelo totalmente abierto del mundo, con razonamiento visual nativo y generación multimodal de texto, imagen, video, sonido ambiente y acción, orientado a la generación de datos sintéticos de última generación y al desarrollo de modelos de política de IA física;
- NVIDIA lanza la NVIDIA Cosmos Coalition junto con laboratorios líderes en IA y referentes en robótica — entre los que se incluyen Agile Robots, Black Forest Labs, Generalist, LTX, Runway y Skild AI — para impulsar la próxima generación de modelos de mundo abierto.
NVIDIA GTC Taipei — 02 de junio de 2026 — NVIDIA lanza NVIDIA Cosmos™ 3, un modelo fundacional abierto de última generación para la IA física, basado en una innovadora arquitectura de mezcla de transformadores (mixture-of-transformers) que combina el razonamiento visual, la generación de mundos y la predicción de acciones en un único sistema.
Cosmos 3 es el primer omnimodel totalmente abierto del mundo capaz de comprender y generar de forma nativa texto, imágenes, vídeo, sonido ambiental y acciones con una precisión física de vanguardia, lo que reduce los ciclos de entrenamiento y evaluación de la IA física de meses a días.
NVIDIA también presenta la NVIDIA Cosmos Coalition, una colaboración global entre creadores de modelos del mundo y desarrolladores de IA —entre los que se incluyen Agile Robots, Black Forest Labs, Generalist, LTX, Runway y Skild AI— que trabajan conjuntamente para impulsar los modelos del mundo de próxima generación.
“El big bang de la IA física está a la vuelta de la esquina, gracias a los avances en el lenguaje del razonamiento multimodal, la visión y los modelos del mundo”, afirma Jensen Huang, fundador y director ejecutivo de NVIDIA. “La familia Cosmos 3 de omnimodelos abiertos y de vanguardia ofrece a los desarrolladores un salto generacional en la capacidad de construir robots, vehículos autónomos e IA de visión que perciben, razonan, planifican y actúan en el mundo físico”.
“El gran reto al que se enfrentan las empresas hoy en día es el tiempo de formación. Cuando reduces los ciclos de meses a días y abres el modelo a la comunidad, cambia por completo quién puede aprovechar la tecnología y eso amplía el mercado para todos. Con Cosmos 3 abierto y en manos de los desarrolladores, estamos construyendo la base sobre la que se diseñará la próxima década de robots, vehículos autónomos y sistemas de visión”, afirma Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina.
Una nueva arquitectura para la IA física
Cosmos 3 se enfrenta a un desafío fundamental de la IA física: permitir que los robots, los vehículos autónomos (AV) o los agentes de visión generalicen en el mundo real con datos de entrenamiento limitados y pilas de simulación fragmentadas.
La arquitectura de mezcla de transformadores (mixture-of-transformers) del modelo combina un transformador de razonamiento con un transformador especializado en generación, lo que permite a Cosmos 3 comprender las interacciones entre objetos, el movimiento y las relaciones espacio-temporales antes de generar vídeo y trayectorias de acción.
Entrenado con uno de los mayores conjuntos de datos multimodales de IA física —que incluye miles de millones de muestras de texto, imágenes, video, sonido y trayectorias de movimiento —, el modelo ofrece a los desarrolladores una potente base preentrenada para crear sistemas de IA física con menos datos y menores costos de entrenamiento.
Los desarrolladores pueden utilizar Cosmos 3 como:
- Un modelo de lenguaje visual que comprende y razona entre modalidades;
- Un modelo del mundo o modelo de base de vídeo que simula entornos físicos y predice estados futuros del mundo con fines de entrenamiento y evaluación;
- La base para los modelos de acción en el mundo que ayudan a entrenar a los robots para que realicen tareas específicas.
Los modelos Cosmos 3 ofrecen resultados de vanguardia en pruebas de rendimiento de IA física. Entre los modelos de código abierto, ocupan el primer lugar en Artificial Analysis, Physics-IQ, PAI-Bench y R-Bench en cuanto a precisión en la generación de mundos; en RoboLab y RoboArena en cuanto a política de acción; y en las clasificaciones VANTAGE-Bench y TAR en cuanto a comprensión visual.
La línea Cosmos 3 ofrece a los desarrolladores opciones para las diferentes etapas del desarrollo de la IA física:
- Cosmos 3 Super para el entrenamiento posterior de modelos de robótica y vehículos autónomos que exigen la máxima precisión física y calidad de generación;
- Cosmos 3 Nano para vídeo de alta calidad y razonamiento de acción en fracciones de segundo;
- Cosmos 3 Edge, próximamente, para la inferencia en tiempo real en el Edge;
Cosmos Coalition acelera el desarrollo de modelos de mundo abiertos
Cosmos Coalition es una colaboración global entre creadores de modelos del mundo, desarrolladores de IA y líderes en IA física cuyo objetivo es impulsar los modelos del mundo abiertos en diversos sectores, permitiendo a los miembros aportar modelos, investigación y técnicas de evaluación, al tiempo que utilizan las tecnologías de Cosmos 3, herramientas de entrenamiento y la infraestructura de NVIDIA DGX™ Cloud para el entrenamiento a gran escala.
Entre los miembros fundadores de la coalición se encuentran Agile Robots, Black Forest Labs, Generalist, LTX, Runway y Skild AI. Al desarrollar de manera abierta y contribuir a un ecosistema compartido, la coalición busca facilitar una innovación más rápida, una mayor interoperabilidad y avances más ágiles en la IA física.
Los desarrolladores crean aplicaciones basadas en Cosmos
La plataforma Cosmos aprovecha la pila de IA física de NVIDIA para acelerar los flujos de trabajo de entrenamiento y evaluación en diversos sectores. La plataforma incluye ahora nuevos conjuntos de datos para robótica, física, movimiento humano, conducción autónoma, seguridad en almacenes y razonamiento espacial, además de nuevas skills de agentes de IA física para la reconstrucción neuronal de escenas, la generación de imágenes de defectos y la ampliación de vídeo.
Los desarrolladores de IA física están aprovechando la plataforma Cosmos en diversos sectores: Agile Robots, Doosan Robotics, LG Electronics, Samsung Electronics y Skild AI en robótica; Li Auto en vehículos autónomos; y Centific, Fogsphere, Linker Vision, Milestone Systems y Yuan en agentes de IA de visión para impulsar aplicaciones de IA industrial y espacios inteligentes.
Disponibilidad
Cosmos 3 Super y Cosmos 3 Nano ya están disponibles, y Cosmos 3 Edge llegará pronto para la inferencia en tiempo real. Los desarrolladores pueden probar Cosmos 3 en build.nvidia.com, descargar modelos de código abierto en Hugging Face, personalizar modelos y generar datos sintéticos con Hugging Face Diffusers y recursos en GitHub, además de implementar los modelos como microservicios NVIDIA NIM™.
Los desarrolladores de modelos y los proveedores de software pueden acelerar el acceso, la personalización y la implementación de Cosmos para cargas de trabajo esenciales de razonamiento y generación de datos sintéticos, utilizando las capacidades de los agentes de IA física en GitHub a través de servicios de inferencia y socios de infraestructura en la nube, entre los que se incluyen Baseten, CoreWeave, Microsoft Azure, Nebius, Deep Infra y Classmethod.
Mira el keynote de Huang, obtén más información en NVIDIA GTC Taipei y explora estas sesiones sobre IA física.
Acerca de NVIDIA
Desde su fundación en 1993, NVIDIA (NASDAQ: NVDA) ha sido pionera en el campo de la aceleración computacional. La invención de la GPU por parte de la compañía en 1999 estimuló el crecimiento del mercado de juegos para PC, redefinió los gráficos por ordenador, inauguró la era de la IA moderna y ha contribuido a la digitalización industrial en todos los mercados. En la actualidad, NVIDIA es una empresa de infraestructuras informáticas completas con soluciones a escala de centro de datos que están revolucionando la industria. Para saber más: Link.
Ver también:
Facebook: NVIDIALatinoamérica
Twitter: NVIDIALatinoamérica
Instagram: NVIDIALatam
YouTube: NVIDIA Latinoamérica
LinkedIn: NVIDIALatinoamérica
Ciertas declaraciones en este comunicado de prensa, que incluyen, entre otras, declaraciones sobre: que el momento de ChatGPT para la IA física ha llegado; que los robotaxis están entre los primeros en beneficiarse; que Alpamayo está llevando el razonamiento a los vehículos autónomos, lo que les permite pensar en escenarios poco frecuentes, conducir de manera segura en entornos complejos y explicar sus decisiones de conducción; y que es la base para una autonomía escalable segura; los beneficios, el impacto, el desempeño y la disponibilidad de los productos, servicios y tecnologías de NVIDIA; las expectativas con respecto a los acuerdos de NVIDIA con terceros, incluidos sus colaboradores y socios; las expectativas con respecto a los desarrollos tecnológicos; y otras afirmaciones que no son hechos históricos son declaraciones prospectivas en el sentido de la sección 27A de la Ley de Valores de 1933, en su versión modificada, y la sección 21E de la Ley de Bolsa de Valores de 1934, en su versión modificada, que están sujetas a las disposiciones de “puerto seguro” creadas por esas secciones, basadas en las creencias y suposiciones de la administración y en la información actualmente disponible para la misma, y que están sujetas a riesgos e incertidumbres que podrían causar que los resultados sean sustancialmente diferentes de las expectativas. Los factores importantes que podrían causar que los resultados reales difieran sustancialmente incluyen: las condiciones económicas y políticas globales; la dependencia de NVIDIA de terceros para la fabricación, el ensamblaje, el empaquetado y la prueba de los productos de NVIDIA; el impacto del desarrollo tecnológico y la competencia; el desarrollo de nuevos productos y tecnologías, o mejoras a los productos y tecnologías actuales de NVIDIA; la aceptación por parte del mercado de los productos de NVIDIA o de los productos de los socios de NVIDIA; defectos de diseño, manufactura o software; cambios en las preferencias o demandas de los consumidores; cambios en las normas e interfaces de la industria; pérdidas inesperadas de desempeño de los productos o tecnologías de NVIDIA cuando se integran en los sistemas; y cambios en las leyes y regulaciones aplicables, así como otros factores detallados ocasionalmente en los informes más recientes que NVIDIA presenta ante la Comisión de Valores y Bolsa (SEC), que incluyen, entre otros, su informe anual en el Formulario 10-K e informes trimestrales en el Formulario 10-Q. Las copias de los informes presentados ante la SEC se publican en el sitio web de la empresa y están disponibles a través de NVIDIA sin costo alguno. Estas declaraciones prospectivas no son garantías de desempeño futuro y solo se refieren a la fecha del presente documento. Además, NVIDIA renuncia a cualquier obligación de actualizar estas declaraciones prospectivas para reflejar circunstancias o eventos futuros, excepto cuando lo exija la ley.
Muchos de los productos y características descritos en el presente documento se encuentran en etapa de desarrollo, y se ofrecerán cuando y si llegan a estar disponibles. Las declaraciones anteriores no pretenden ser ni deben interpretarse como un compromiso, promesa u obligación legal. Además, el desarrollo, el lanzamiento y los tiempos de cualquier característica o funcionalidad descritos para nuestros productos están sujetos a cambios y quedan a exclusivo criterio de NVIDIA. NVIDIA no tendrá ninguna responsabilidad por faltas de entrega o retrasos en la entrega de cualquiera de los productos, características o funciones presentados en este documento.
© 2026 NVIDIA Corporation. Todos los derechos reservados. NVIDIA, el logotipo de NVIDIA, NVIDIA Cosmos, NVIDIA DRIVE AGX Thor, NVIDIA DRIVE Hyperion y NVIDIA Omniverse son marcas comerciales registradas de NVIDIA Corporation en Estados Unidos y otros países. Otros nombres de empresas y productos pueden ser marcas comerciales de las respectivas empresas con las que están asociados. Las funciones, los precios, la disponibilidad y las especificaciones están sujetos a cambios sin previo aviso.
Sing – Oficina de prensa de NVIDIA (división Enterprise) en Brasil, Mexico y Latinoamérica
Contacto de prensa: nvidia@singcomunica.com
02/06/2026

