A NVIDIA anunciou a plataforma Rubin, marcando o início de uma nova era na inteligência artificial. A inovação é composta por seis novos chips projetados para construir um supercomputador de IA sem precedentes.
A plataforma NVIDIA Rubin estabelece um novo padrão para a criação, implementação e segurança de sistemas de IA avançados, tudo isso a um custo reduzido, com o objetivo de democratizar o acesso à IA.
Integração Total para Máxima Eficiência
A plataforma Rubin destaca-se pelo design conjunto extremo de seus seis chips: CPU NVIDIA Vera, GPU Rubin, switch NVLink 6, SuperNIC ConnectX-9, DPU BlueField-4 e switch Ethernet Spectrum-6. Essa integração visa reduzir drasticamente o tempo de treinamento e os custos associados à geração de tokens de inferência.
Rubin chega exatamente no momento certo, já que a demanda por computação de IA, tanto para treinamento quanto para inferência, está disparando. Com nosso ritmo anual de lançamento de uma nova geração de supercomputadores de IA e o design colaborativo extremo em seis novos chips, Rubin dá um salto gigantesco rumo à próxima fronteira da IA.
— Jensen Huang, fundador e CEO da NVIDIA
A nova plataforma aproveita a sinergia entre hardware e software para oferecer uma redução de até 10 vezes no custo do token de inferência e diminuição de quatro vezes no número de GPUs necessárias para treinar modelos MoE (Mixture of Experts), em comparação com a plataforma NVIDIA Blackwell.
Inovações e Suporte do Ecossistema
Além disso, a plataforma Rubin introduz cinco inovações, incluindo as gerações mais recentes da tecnologia de interconexão NVIDIA NVLink, o Transformer Engine, o Confidential Computing, o RAS Engine e a CPU NVIDIA Vera. Esses avanços acelerarão a IA agentica, o raciocínio avançado e a inferência de modelos MoE em larga escala, com um custo por token significativamente menor.
Entre os principais laboratórios de IA, provedores de serviços em nuvem e fabricantes de computadores que adotarão a plataforma Rubin, destacam-se Amazon Web Services (AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, OpenAI e Oracle Cloud Infrastructure (OCI).
Escalabilidade e Inteligência Aprimorada
Agentes de IA e modelos de raciocínio, juntamente com cargas de trabalho de geração de vídeo de última geração, estão redefinindo os limites da computação. A plataforma Rubin foi projetada para atender às demandas de cargas de trabalho complexas de IA, incluindo tecnologias como:
- NVIDIA NVLink de sexta geração: Oferece comunicação GPU-a-GPU rápida e eficiente.
- Processador NVIDIA Vera: Projetado para raciocínio autônomo, com alta eficiência energética.
- GPU NVIDIA Rubin: Equipada com Transformer Engine de terceira geração, oferecendo 50 petaflops de poder computacional NVFP4 para inferência de IA.
Ademais, a plataforma apresenta a NVIDIA Inference Context Memory Storage, uma nova classe de infraestrutura de armazenamento nativa para IA, projetada para escalar o contexto de inferência em gigaescala.
Disponibilidade
A NVIDIA Rubin está em plena produção, e os produtos baseados na plataforma estarão disponíveis por meio de parceiros no segundo semestre de 2026. Parceiros de nuvem como AWS, Google Cloud, Microsoft e OCI estarão entre os primeiros a implantar instâncias baseadas em Vera Rubin em 2026.
A Microsoft implantará sistemas NVIDIA Vera Rubin NVL72 em escala de rack como parte de data centers de IA de última geração, incluindo as futuras superfábricas de IA em Fairwater.
Espera-se que Cisco, Dell, HPE, Lenovo e Supermicro forneçam uma ampla gama de servidores baseados em produtos Rubin. Além disso, laboratórios de IA como Anthropic, Black Forest, Cohere, Meta, Mistral AI e OpenAI também estão de olho na plataforma NVIDIA Rubin para treinar modelos maiores e mais capacitados.






