AWS e NVIDIA anunciam colaboração estratégica para oferecer nova infraestrutura de supercomputação, software e serviços para IA generativa


  • AWS oferecerá o primeiro supercomputador de IA na nuvem com o superchip NVIDIA Grace Hopper e a escalabilidade do AWS UltraCluster
  • NVIDIA DGX Cloud - o primeiro a apresentar o NVIDIA GH200 NVL32 - chegando à AWS
  • As empresas fazem parceria no Projeto Ceiba para construir o supercomputador de IA com GPU mais rápido do mundo e o mais novo supercomputador NVIDIA DGX Cloud para P&D de IA da NVIDIA e desenvolvimento de modelos personalizados
  • Novas instâncias do Amazon EC2 equipadas com as GPUs NVIDIA GH200, H200, L40S e L4 sobrecarregam as cargas de trabalho de IA generativa, HPC, design e simulação
  • Software NVIDIA no AWS - NeMo LLM framework, NeMo Retriever e BioNeMo - para impulsionar o desenvolvimento de IA generativa para modelos personalizados, recuperação semântica e descoberta de medicamentos

LAS VEGAS - AWS re:Invent - 28 de novembro de 2023 – A Amazon Web Services, Inc. (AWS), uma empresa da Amazon.com, Inc. (NASDAQ: AMZN), e a NVIDIA (NASDAQ: NVDA) anunciam uma expansão de sua colaboração estratégica para fornecer a infraestrutura, o software e os serviços mais avançados para impulsionar as inovações de inteligência artificial (IA) generativa dos clientes.

As empresas reunirão o melhor das tecnologias NVIDIA e AWS - desde os mais novos sistemas de vários nós da NVIDIA com GPUs, CPUs e software de IA de última geração até a virtualização e a segurança avançadas do AWS Nitro System, a interconexão Elastic Fabric Adapter (EFA) e a escalabilidade do UltraCluster - que são ideais para treinar modelos de base e criar aplicações de IA generativas.

A colaboração ampliada se baseia em um relacionamento de longa data que impulsionou a era da IA generativa, oferecendo aos pioneiros do aprendizado de máquina (ML) o desempenho de computação necessário para avançar o estado da arte nessas tecnologias.

Como parte da colaboração ampliada para turbinar a IA generativa em todos os setores:

  • A AWS será o primeiro provedor de nuvem a trazer os NVIDIA® GH200 Grace Hopper Superchips com a nova tecnologia NVLink™ de vários nós para a nuvem. A plataforma de vários nós NVIDIA GH200 NVL32 conecta 32 Grace Hopper Superchips com as tecnologias NVIDIA NVLink e NVSwitch™ em uma única instância. A plataforma estará disponível nas instâncias do Amazon Elastic Compute Cloud (Amazon EC2) conectadas com a poderosa rede da Amazon (EFA), com suporte de virtualização avançada (AWS Nitro System) e clustering de hiperescala (Amazon EC2 UltraClusters), permitindo que os clientes conjuntos escalem para milhares de GH200 Superchips.
  • A NVIDIA e a AWS colaborarão para hospedar o NVIDIA DGX™ Cloud - o treinamento de IA como serviço da NVIDIA - na AWS. Será o primeiro DGX Cloud com o GH200 NVL32, oferecendo aos desenvolvedores a maior memória compartilhada em uma única instância. O DGX Cloud on AWS acelerará o treinamento de IA generativa de ponta e modelos de linguagem grandes que podem atingir mais de 1 trilhão de parâmetros.
  • A NVIDIA e a AWS estão fazendo uma parceria no Projeto Ceiba para construir o supercomputador de IA mais rápido do mundo alimentado por GPU - um sistema em escala com GH200 NVL32 e interconexão Amazon EFA, hospedado pela AWS para a própria equipe de pesquisa e desenvolvimento da NVIDIA. Esse supercomputador inédito - com 16.384 superchips NVIDIA GH200 e capaz de processar 65 exaflops de IA - será usado pela NVIDIA para impulsionar sua próxima onda de inovação de IA generativa.
  • A AWS apresentará três novas instâncias adicionais do Amazon EC2: As instâncias P5e, equipadas com GPUs NVIDIA H200 Tensor Core, para cargas de trabalho de IA generativa e HPC em grande escala e de ponta, e as instâncias G6 e G6e, equipadas com GPUs NVIDIA L4 e GPUs NVIDIA L40S, respectivamente, para um amplo conjunto de aplicações, como cargas de trabalho de ajuste fino de IA, inferência, gráficos e vídeo. As instâncias G6e são particularmente adequadas para o desenvolvimento de fluxos de trabalho 3D, digital twins e outras aplicações usando o NVIDIA Omniverse™, uma plataforma para conectar e criar aplicações 3D generativas habilitadas para IA.

"A AWS e a NVIDIA colaboram há mais de 13 anos, começando com a primeira instância de nuvem de GPU do mundo. Hoje, oferecemos a mais ampla gama de soluções de GPU NVIDIA para cargas de trabalho, incluindo gráficos, jogos, computação de alto desempenho, aprendizado de máquina e, agora  IA generativa", ressalta Adam Selipsky, CEO da AWS. "Continuamos a inovar com a NVIDIA para tornar a AWS o melhor lugar para executar GPUs, combinando os superchips NVIDIA Grace Hopper de última geração com a poderosa rede EFA da AWS, o clustering em hiperescala do EC2 UltraClusters e os recursos avançados de virtualização do Nitro".

"A IA generativa está transformando as cargas de trabalho do cloud e colocando a computação acelerada na base da geração de conteúdo diversificado", afirma Jensen Huang, fundador e CEO da NVIDIA. "Impulsionadas por uma missão comum de fornecer IA geradora de última geração e econômica para todos os clientes, a NVIDIA e a AWS estão colaborando em toda a pilha de computação, abrangendo infraestrutura de IA, bibliotecas de aceleração, modelos básicos e serviços de IA geradora."

Novas instâncias do Amazon EC2 combinam o estado da arte da NVIDIA e da AWS

O AWS será o primeiro provedor de nuvem a oferecer os superchips NVIDIA GH200 Grace Hopper com a tecnologia NVLink de vários nós. Cada GH200 Superchip combina uma CPU Grace baseada em Arm com uma GPU de arquitetura NVIDIA Hopper™ no mesmo módulo. Uma única instância do Amazon EC2 com o GH200 NVL32 pode fornecer até 20 TB de memória compartilhada para alimentar cargas de trabalho em escala de terabytes.

Essas instâncias aproveitarão a interconexão do Elastic Fabric Adapter (EFA) de terceira geração da AWS, fornecendo até 400 Gbps por Superchip de baixa latência e alta largura de banda de throughput de rede, permitindo que os clientes ampliem para milhares de GH200 Superchips em EC2 UltraClusters.

As instâncias do AWS com o GH200 NVL32 fornecerão aos clientes acesso sob demanda ao desempenho de classe de supercomputador, o que é essencial para cargas de trabalho de IA/ML em grande escala que precisam ser distribuídas em vários nós para cargas de trabalho de IA geradoras complexas - abrangendo FMs, sistemas de recomendação e bancos de dados vetoriais.

As instâncias do EC2 com NVIDIA GH200 contarão com 4,5 TB de memória de GPU HBM3e - um aumento de 7,2x em comparação com a geração atual de instâncias do EC2 P5 com NVIDIA H100 - permitindo que os clientes executem modelos maiores e melhorem o desempenho do treinamento. Além disso, a interconexão de memória da CPU e da GPU oferece uma largura de banda até 7 vezes maior, permitindo comunicações chip a chip que ampliam a memória total disponível para as aplicações.

As instâncias do AWS com o GH200 NVL32 serão a primeira infraestrutura de IA no AWS a contar com resfriamento líquido para ajudar a garantir que racks de servidores densamente compactados possam operar com desempenho máximo.

As instâncias EC2 com GH200 NVL32 também se beneficiarão do AWS Nitro System, a plataforma subjacente para instâncias EC2 de última geração. O Nitro System transfere as funções de E/S da CPU/GPU do host para um hardware especializado para oferecer um desempenho mais consistente, enquanto sua segurança aprimorada protege o código e os dados do cliente durante o processamento.

"Essa colaboração será essencial para que as empresas continuem utilizando as tecnologias da NVIDIA juntamente com a Amazon, para impulsionar seus serviços com a IA generativa", pontua Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

AWS é a primeira a hospedar o NVIDIA DGX Cloud com tecnologia Grace Hopper

A AWS se unirá à NVIDIA para hospedar o NVIDIA DGX Cloud com a infraestrutura GH200 NVL32 NVLink. O NVIDIA DGX Cloud é um serviço de supercomputação de IA que oferece às empresas acesso rápido à supercomputação de vários nós para treinar os modelos mais complexos de LLM e IA generativa, com o software NVIDIA AI Enterprise integrado e acesso direto aos especialistas em IA da NVIDIA.

Supercomputador maciço do Project Ceiba para impulsionar o desenvolvimento de IA da NVIDIA

O supercomputador do Projeto Ceiba, no qual a AWS e a NVIDIA estão colaborando, será integrado aos serviços da AWS, como a rede criptografada do Amazon Virtual Private Cloud (VPC) e o armazenamento em bloco de alto desempenho do Amazon Elastic Block Store, dando à NVIDIA acesso a um conjunto abrangente de recursos da AWS.

A NVIDIA usará o supercomputador para pesquisa e desenvolvimento a fim de promover a IA para LLMs, gráficos e simulação, biologia digital, robótica, carros autônomos, previsão climática da Terra-2 e muito mais.

NVIDIA e AWS aumentam a IA geradora, HPC, design e simulação

Para potencializar o desenvolvimento, o treinamento e a inferência dos maiores LLMs, as instâncias do AWS P5e contarão com as mais recentes GPUs H200 da NVIDIA, que oferecem 141 GB de memória de GPU HBM3e, que é 1,8 vezes maior e 1,4x mais rápida do que as GPUs H100. Esse aumento na memória da GPU, juntamente com até 3.200 Gbps de rede EFA habilitada pelo AWS Nitro System, permitirá que os clientes continuem a criar, treinar e implantar seus modelos de ponta no AWS.

Para oferecer soluções econômicas e eficientes em termos de energia para cargas de trabalho de vídeo, IA e gráficos, a AWS anuncia novas instâncias do Amazon EC2 G6e com GPUs NVIDIA L40S e instâncias G6 com GPUs L4. As novas ofertas podem ajudar startups, empresas e pesquisadores a atender às suas necessidades de IA e gráficos de alta fidelidade.

As instâncias do G6e são criadas para lidar com cargas de trabalho complexas, como IA generativa e aplicações de digital twins. Usando o NVIDIA Omniverse, as simulações 3D fotorrealistas podem ser desenvolvidas, contextualizadas e aprimoradas usando dados em tempo real de serviços como o AWS IoT TwinMaker, chatbots inteligentes, assistentes, pesquisa e resumo. A Amazon Robotics e os Amazon Fulfillment Centers poderão integrar gêmeos digitais criados com o NVIDIA Omniverse e o AWS IoT TwinMaker para otimizar o design e o fluxo do armazém, treinar assistentes de robôs mais inteligentes e melhorar as entregas aos clientes.

As GPUs L40S fornecem até 1,45 petaflops de desempenho FP8 e apresentam núcleos de Ray Tracing que oferecem até 209 teraflops de desempenho de ray-tracing. As GPUs L4 apresentadas nas instâncias G6 fornecerão uma solução de baixo custo e com baixo consumo de energia para a implementação de modelos de IA para processamento de linguagem natural, tradução de idiomas, análise de vídeo e imagem de IA, reconhecimento de fala e personalização. As GPUs L40S também aceleram as cargas de trabalho gráficas, como a criação e a renderização de gráficos em tempo real com qualidade cinematográfica e streaming de jogos. Todas as três instâncias estarão disponíveis no próximo ano.

O software NVIDIA no AWS impulsiona o desenvolvimento de IA generativa

Além disso, a NVIDIA anunciou um software no AWS para impulsionar o desenvolvimento de IA generativa. O microsserviço NVIDIA NeMo™ Retriever oferece novas ferramentas para criar chatbots altamente precisos e ferramentas de resumo usando recuperação semântica acelerada. O NVIDIA BioNeMo™, disponível no Amazon SageMaker e chegando ao AWS no NVIDIA DGX Cloud, permite que as empresas farmacêuticas acelerem a descoberta de medicamentos, simplificando e acelerando o treinamento de modelos usando seus próprios dados.

O software NVIDIA no AWS está ajudando a Amazon a trazer inovações para seus serviços e operações. A AWS está usando a estrutura NVIDIA NeMo para treinar LLMs selecionados da próxima geração do Amazon Titan. A Amazon Robotics começou a aproveitar o NVIDIA Omniverse Isaac para criar digital twins para automatizar, otimizar e planejar seus armazéns autônomos em ambientes virtuais antes de implantá-los no mundo real.

Sobre a Amazon Web Services

Desde 2006, a Amazon Web Services tem sido a nuvem mais abrangente e amplamente adotada do mundo. A AWS tem expandido continuamente seus serviços para dar suporte a praticamente qualquer carga de trabalho e agora tem mais de 240 serviços completos para computação, armazenamento, bancos de dados, redes, análises, aprendizado de máquina e inteligência artificial (IA), Internet das Coisas (IoT), dispositivos móveis, segurança, realidade híbrida, virtual e aumentada (VR e AR), mídia e desenvolvimento, implantação e gerenciamento de aplicações de 102 zonas de disponibilidade em 32 regiões geográficas, com planos anunciados para mais 15 zonas de disponibilidade e mais cinco regiões da AWS no Canadá, Alemanha, Malásia, Nova Zelândia e Tailândia. Milhões de clientes - incluindo as startups de crescimento mais rápido, as maiores empresas e as principais agências governamentais - confiam na AWS para potencializar sua infraestrutura, tornar-se mais ágil e reduzir custos. Para saber mais sobre a AWS, acesse aws.amazon.com.

Sobre a NVIDIA

Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://blog.nvidia.com.br/.

Acesse também:

Site oficial da NVIDIA no Brasil: https://www.nvidia.com/pt-br/

Facebook: @NVIDIABrasil

Twitter: @NVIDIABrasil

YouTube: NVIDIA Latinoamérica

Certas declarações neste comunicado à imprensa, incluindo, mas não se limitando a, declarações sobre: os benefícios, o impacto, o desempenho, os recursos e a disponibilidade dos produtos e das tecnologias da NVIDIA, incluindo NVIDIA GH200 Grace Hopper Superchips, NVL32, H200, NeMo Retriever, NVLink, NVSwitch, NVIDIA DGX Cloud, NVIDIA L40S, NVIDIA Omniverse, NVIDIA L4, NVIDIA NeMo, NVIDIA BioNeMo e NVIDIA AI Enterprise; os benefícios e o impacto da colaboração ampliada entre a AWS e a NVIDIA, incluindo o Projeto Ceiba, e a disponibilidade de seus serviços e ofertas; e a IA generativa transformando as cargas de trabalho da nuvem e colocando a computação acelerada na base da geração de conteúdo diversificado são declarações prospectivas que estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas. Fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas globais; nossa dependência de terceiros para fabricar, montar, embalar e testar nossos produtos; o impacto do desenvolvimento tecnológico e da concorrência; desenvolvimento de novos produtos e tecnologias ou aprimoramentos de nossos produtos e tecnologias existentes; aceitação do mercado de nossos produtos ou dos produtos de nossos parceiros; defeitos de projeto, fabricação ou software; mudanças nas preferências ou demandas dos consumidores; mudanças nos padrões e interfaces do setor; e perda inesperada de desempenho de nossos produtos ou tecnologias quando integrados a sistemas, bem como outros fatores detalhados periodicamente nos relatórios mais recentes que a NVIDIA apresenta à Comissão de Valores Mobiliários, ou SEC, incluindo, entre outros, seu relatório anual no Formulário 10-K e relatórios trimestrais no Formulário 10-Q. Cópias dos relatórios arquivados na SEC são publicadas no site da empresa e estão disponíveis na NVIDIA sem custo. Essas declarações prospectivas não são garantias de desempenho futuro e se referem apenas à data deste documento e, exceto conforme exigido por lei, a NVIDIA se isenta de qualquer obrigação de atualizar essas declarações prospectivas para refletir eventos ou circunstâncias futuras.

© 2023 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo da NVIDIA, BioNeMo, DGX, NeMo, NVIDIA Omniverse, NVLink e NVSwitch são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e/ou em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas às quais estão associados. Recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso prévio.

 

Informações para a imprensa:

Sing Comunicação de Resultados

nvidia@singcomunica.com.br

28/11/2023


Também encontrado em:


A Sing utiliza cookies e outras tecnologias semelhantes para melhorar a sua experiência, de acordo com a nossa política de privacidade e, ao continuar navegando, você concorda com estas condições.