
Resumen de noticias:
- NVIDIA Dynamo 1.0 ofrece una base de código abierto lista para producción para la inferencia a gran escala.
- Las optimizaciones de Dynamo y NVIDIA TensorRT-LLM se integran de forma nativa con marcos de trabajo de código abierto, como LangChain, llm-d, LMCache, SGLang y vLLM, para impulsar el rendimiento de la inferencia.
- Dynamo aumenta el rendimiento de inferencia de las GPU NVIDIA Blackwell hasta 7 veces, reduciendo el costo por token y aumentando las oportunidades de ingresos para millones de GPU con software gratuito y de código abierto.
- La plataforma de inferencia de NVIDIA ha sido integrada por proveedores de servicios en la nube, como Amazon Web Services (AWS), Microsoft Azure, Google Cloud y Oracle Cloud Infrastructure (OCI), junto con los socios de nube de NVIDIA: Alibaba Cloud, CoreWeave, Together AI y Nebius; y adoptada por empresas nativas de IA, como Cursor y Perplexity; los proveedores de terminales de inferencia Baseten, Deep Infra y Fireworks; y las empresas globales ByteDance, Meituan, PayPal y Pinterest.
SAN JOSE, Calif. — GTC — NVIDIA anuncia NVIDIA Dynamo 1.0, un software de código abierto para la inferencia generativa y agentiva a gran escala, con una amplia adopción a nivel mundial. Junto con la plataforma NVIDIA Blackwell, Dynamo 1.0 permite a los proveedores de nube, a los innovadores en IA y a las empresas globales ofrecer inferencia de IA de alto rendimiento con una escala, eficiencia y velocidad sin igual.
A medida que los sistemas de agentes de IA entran en producción en diversos sectores, escalar la inferencia dentro de un centro de datos se ha convertido en un complejo desafío de orquestación de recursos, con solicitudes de tamaños y modalidades variados, así como objetivos de rendimiento, que alcanzan picos impredecibles.
Al igual que el sistema operativo de una computadora coordina el hardware y las aplicaciones, Dynamo 1.0 funciona como el “sistema operativo” distribuido de las fábricas de IA, orquestando de manera integrada los recursos de GPU y memoria en todo el clúster para dar soporte a cargas de trabajo complejas de IA. En pruebas de rendimiento recientes del sector, Dynamo aumentó el rendimiento de inferencia de las GPU NVIDIA Blackwell hasta 7 veces, reduciendo el costo por token y aumentando las oportunidades de ingresos para millones de GPU con software gratuito y de código abierto.
“La inferencia es el motor de la inteligencia, impulsando cada consulta, cada agente y cada aplicación”, afirma Jensen Huang, fundador y director ejecutivo de NVIDIA. “Con NVIDIA Dynamo, hemos creado el primer “sistema operativo” de la historia para las fábricas de IA. La rápida adopción en todo nuestro ecosistema demuestra que esta nueva ola de IA agentiva ya está aquí, y NVIDIA la está impulsando a escala global”.
Dynamo 1.0 distribuye el trabajo de inferencia entre las GPU, incorporando un «control de tráfico» más inteligente y la capacidad de transferir datos entre las GPU y los almacenamientos de menor costo, lo que reduce el desperdicio de recursos y alivia las restricciones de memoria. En el caso de la IA autónoma y las solicitudes largas, puede dirigir las solicitudes a las GPU que ya cuentan con la “memoria a corto plazo” más relevante de las etapas anteriores y, a continuación, descargar esa memoria cuando ya no sea necesaria.
“Lo que antes parecía lejano comienza a materializarse con mayor rapidez a medida que surgen nuevas formas de crear, organizar y utilizar datos a gran escala. Este avance allana el camino para acelerar el desarrollo de aplicaciones en áreas como la robótica, la visión computacional y los sistemas autónomos, acercando cada vez más la IA a las operaciones reales de las empresas y la sociedad”, complementa Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina.
La plataforma de inferencia de NVIDIA cobra impulso
NVIDIA está impulsando el ecosistema de código abierto al integrar Dynamo y las optimizaciones de la biblioteca NVIDIA TensorRT™-LLM en marcos populares de proveedores como LangChain, llm-d, LMCache, SGLang, vLLM y otros. Componentes esenciales de Dynamo, como KVBM para una gestión más inteligente de la memoria, NVIDIA NIXL para la transferencia rápida de datos entre GPU y NVIDIA Grove para una escalabilidad simplificada, también están disponibles como módulos independientes. NVIDIA también aporta los kernels CUDA® de TensorRT-LLM al proyecto FlashInfer, para que puedan integrarse de forma nativa en marcos de código abierto.
La plataforma de inferencia de NVIDIA es compatible con todo el ecosistema de IA, incluyendo:
- Proveedores de servicios en la nube: Amazon Web Services (AWS), Microsoft Azure, Google Cloud, OCI
- Socios de nube de NVIDIA: Alibaba Cloud, CoreWeave, Crusoe, DigitalOcean, Gcore, GMI Cloud, Lightning AI, Nebius, Nscale, Together AI, Vultr
- Empresas nativas de IA: Cursor, Hebbia, Perplexity
- Proveedores de puntos finales de inferencia: Baseten, Deep Infra, Fireworks
- Empresas globales: AstraZeneca, BlackRock, ByteDance, Coupang, Instacart, Meituan, PayPal, Pinterest, Shopee, SoftBank Corp.
Chen Goldberg, vicepresidente ejecutivo de productos e ingeniería de CoreWeave, afirma: “A medida que la IA pasa de proyectos piloto experimentales a una producción continua a gran escala, la infraestructura subyacente debe ser tan dinámica como los modelos que soporta. La compatibilidad con NVIDIA Dynamo nos permite ofrecer un entorno más integrado y resistente para la implementación de agentes de IA complejos. Esta base proporciona la durabilidad y la orquestación de alto rendimiento necesarias para llevar a producción global las cargas de trabajo de agentes más ambiciosas del sector”.
Danila Shtan, director de tecnología de Nebius, explica: “Ofrecer una inferencia de IA confiable a gran escala no se limita solo a GPU potentes, sino también al software que transforma ese rendimiento en resultados reales para los clientes. Valoramos la forma en que la pila de software de NVIDIA, desde Dynamo hasta TensorRT-LLM, proporciona una optimización profunda, un rendimiento predecible y un tiempo de implementación más rápido, lo que nos ayuda a ofrecer a los clientes un camino más sencillo y de mayor rendimiento hacia la IA en producción”.
Matt Madrigal, director de tecnología de Pinterest, añade: “Ofrecer una experiencia de IA intuitiva y multimodal a cientos de millones de usuarios requiere inteligencia en tiempo real a escala global. Como grandes defensores del código abierto, estamos comprometidos con el desarrollo de tecnologías de IA escalables. Con NVIDIA Dynamo optimizando nuestra implementación, estamos ampliando las experiencias personalizadas y sin interrupciones que ofrecemos, impulsadas por una infraestructura de IA de alto rendimiento”.
Dynamo 1.0 ya está disponible para desarrolladores de todo el mundo. Para obtener más información y empezar a utilizarlo, lee el blog y visita la página de Dynamo.
Acerca de NVIDIA
Desde su fundación en 1993, NVIDIA (NASDAQ: NVDA) ha sido pionera en el campo de la aceleración computacional. La invención de la GPU por parte de la compañía en 1999 estimuló el crecimiento del mercado de juegos para PC, redefinió los gráficos por ordenador, inauguró la era de la IA moderna y ha contribuido a la digitalización industrial en todos los mercados. En la actualidad, NVIDIA es una empresa de infraestructuras informáticas completas con soluciones a escala de centro de datos que están revolucionando la industria. Para saber más: Link.
Ver también:
Facebook: NVIDIALatinoamérica
Twitter: NVIDIALatinoamérica
Instagram: NVIDIALatam
YouTube: NVIDIA Latinoamérica
LinkedIn: NVIDIALatinoamérica
Ciertas declaraciones en este comunicado de prensa, que incluyen, entre otras, declaraciones sobre: que el momento de ChatGPT para la IA física ha llegado; que los robotaxis están entre los primeros en beneficiarse; que Alpamayo está llevando el razonamiento a los vehículos autónomos, lo que les permite pensar en escenarios poco frecuentes, conducir de manera segura en entornos complejos y explicar sus decisiones de conducción; y que es la base para una autonomía escalable segura; los beneficios, el impacto, el desempeño y la disponibilidad de los productos, servicios y tecnologías de NVIDIA; las expectativas con respecto a los acuerdos de NVIDIA con terceros, incluidos sus colaboradores y socios; las expectativas con respecto a los desarrollos tecnológicos; y otras afirmaciones que no son hechos históricos son declaraciones prospectivas en el sentido de la sección 27A de la Ley de Valores de 1933, en su versión modificada, y la sección 21E de la Ley de Bolsa de Valores de 1934, en su versión modificada, que están sujetas a las disposiciones de “puerto seguro” creadas por esas secciones, basadas en las creencias y suposiciones de la administración y en la información actualmente disponible para la misma, y que están sujetas a riesgos e incertidumbres que podrían causar que los resultados sean sustancialmente diferentes de las expectativas. Los factores importantes que podrían causar que los resultados reales difieran sustancialmente incluyen: las condiciones económicas y políticas globales; la dependencia de NVIDIA de terceros para la fabricación, el ensamblaje, el empaquetado y la prueba de los productos de NVIDIA; el impacto del desarrollo tecnológico y la competencia; el desarrollo de nuevos productos y tecnologías, o mejoras a los productos y tecnologías actuales de NVIDIA; la aceptación por parte del mercado de los productos de NVIDIA o de los productos de los socios de NVIDIA; defectos de diseño, manufactura o software; cambios en las preferencias o demandas de los consumidores; cambios en las normas e interfaces de la industria; pérdidas inesperadas de desempeño de los productos o tecnologías de NVIDIA cuando se integran en los sistemas; y cambios en las leyes y regulaciones aplicables, así como otros factores detallados ocasionalmente en los informes más recientes que NVIDIA presenta ante la Comisión de Valores y Bolsa (SEC), que incluyen, entre otros, su informe anual en el Formulario 10-K e informes trimestrales en el Formulario 10-Q. Las copias de los informes presentados ante la SEC se publican en el sitio web de la empresa y están disponibles a través de NVIDIA sin costo alguno. Estas declaraciones prospectivas no son garantías de desempeño futuro y solo se refieren a la fecha del presente documento. Además, NVIDIA renuncia a cualquier obligación de actualizar estas declaraciones prospectivas para reflejar circunstancias o eventos futuros, excepto cuando lo exija la ley.
Muchos de los productos y características descritos en el presente documento se encuentran en etapa de desarrollo, y se ofrecerán cuando y si llegan a estar disponibles. Las declaraciones anteriores no pretenden ser ni deben interpretarse como un compromiso, promesa u obligación legal. Además, el desarrollo, el lanzamiento y los tiempos de cualquier característica o funcionalidad descritos para nuestros productos están sujetos a cambios y quedan a exclusivo criterio de NVIDIA. NVIDIA no tendrá ninguna responsabilidad por faltas de entrega o retrasos en la entrega de cualquiera de los productos, características o funciones presentados en este documento.
© 2026 NVIDIA Corporation. Todos los derechos reservados. NVIDIA, el logotipo de NVIDIA, NVIDIA Cosmos, NVIDIA DRIVE AGX Thor, NVIDIA DRIVE Hyperion y NVIDIA Omniverse son marcas comerciales registradas de NVIDIA Corporation en Estados Unidos y otros países. Otros nombres de empresas y productos pueden ser marcas comerciales de las respectivas empresas con las que están asociados. Las funciones, los precios, la disponibilidad y las especificaciones están sujetos a cambios sin previo aviso.
Sing Comunicação – Oficina de prensa de NVIDIA (división Enterprise) en Brasil, Mexico y Latinoamérica
Contacto de prensa: nvidia@singcomunica.com
17/03/2026

