A NVIDIA anunciou que o processador de dados NVIDIA BlueField-4 impulsiona a plataforma NVIDIA Inference Context Memory Storage, uma nova classe de infraestrutura de armazenamento nativa para IA, projetada para inferência em escala gigabit, com o objetivo de acelerar e dimensionar agentes de IA. A novidade foi apresentada durante a CES.
Armazenamento de memória de contexto
A plataforma de processadores de armazenamento foi desenvolvida para sistemas de IA com agentes que processam contextos extensos, com memória de curto e longo prazo extremamente rápida. Segundo a empresa, a plataforma de armazenamento de memória de contexto de inferência amplia a memória de longo prazo dos agentes de IA e permite o compartilhamento de contexto de alta largura de banda em clusters de sistemas de IA em escala de rack, aumentando o número de tokens por segundo e a eficiência energética em até 5 vezes.
Além disso, graças à tecnologia NVIDIA Spectrum-X Ethernet, a memória de contexto estendida para agentes de IA com múltiplas interações melhora a capacidade de resposta, aumenta a taxa de transferência por GPU e oferece suporte à escalabilidade eficiente da inferência de agentes.
Escalabilidade e Raciocínio
À medida que os modelos de IA escalam para trilhões de parâmetros e raciocínio em várias etapas, eles geram vastas quantidades de dados contextuais — representados por um cache de chave-valor (KV), essenciais para a precisão, a experiência do usuário e a continuidade.
A plataforma NVIDIA Inference Context Memory Storage fornece a infraestrutura para memória de contexto, ampliando a capacidade de memória da GPU, permitindo o compartilhamento em alta velocidade entre nós, aumentando o número de tokens por segundo em até 5 vezes e oferecendo até 5 vezes mais eficiência energética em comparação com o armazenamento tradicional.
Conforme Jensen Huang, fundador e CEO da NVIDIA, a IA está revolucionando toda a pilha de computação e, agora, o armazenamento.
A IA não se resume mais a chatbots de resposta única, mas sim a colaboradores inteligentes que entendem o mundo físico, raciocinam em horizontes de longo prazo, mantêm-se ancorados em fatos, usam ferramentas para realizar trabalho real e retêm memória de curto e longo prazo. Com o BlueField-4, a NVIDIA e nossos parceiros de software e hardware estão reinventando a pilha de armazenamento para a próxima fronteira da IA.
— Jensen Huang, fundador e CEO da NVIDIA
A plataforma NVIDIA Inference Context Memory Storage aumenta a capacidade do cache KV e acelera o compartilhamento de contexto em clusters de sistemas de IA em escala de rack, enquanto o contexto persistente para agentes de IA com múltiplas interações melhora a capacidade de resposta, aumenta a produtividade da fábrica de IA e oferece suporte ao escalonamento eficiente da inferência multiagente de contexto longo.
Recursos principais da plataforma NVIDIA BlueField-4
- Capacidade de cache KV em nível de cluster NVIDIA Rubin, oferecendo a escalabilidade e a eficiência necessárias para inferência agentiva de contexto longo e múltiplas etapas;
- Eficiência energética até 5 vezes maior do que o armazenamento tradicional;
- Compartilhamento inteligente e acelerado do cache KV entre nós de IA, habilitado pela estrutura NVIDIA DOCA™ e integrado de forma precisa com a biblioteca NVIDIA NIXL e o software NVIDIA Dynamo para maximizar tokens por segundo, reduzir o tempo até o primeiro token e melhorar a capacidade de resposta em múltiplas etapas;
- O posicionamento de cache KV acelerado por hardware, gerenciado pelo NVIDIA BlueField-4, elimina a sobrecarga de metadados, reduz a movimentação de dados e garante acesso seguro e isolado dos nós da GPU;
- O compartilhamento e a recuperação eficientes de dados, possibilitados pela NVIDIA Spectrum-X™ Ethernet, servem como a estrutura de rede de alto desempenho para acesso baseado em RDMA ao cache KV nativo de IA.
De acordo com Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para a América Latina, à medida que a IA evolui para modelos com contextos mais longos e inferência contínua, o armazenamento deixa de ser um gargalo e se torna um acelerador da inovação.
O BlueField-4 foi projetado precisamente para atender a essa nova demanda.
— Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para a América Latina
Empresas inovadoras no setor de armazenamento, incluindo AIC, Cloudian, DDN, Dell Technologies, HPE, Hitachi Vantara, IBM, Nutanix, Pure Storage, Supermicro, VAST Data e WEKA, estão entre as primeiras a desenvolver plataformas de armazenamento com IA de última geração com o BlueField-4, que estará disponível no segundo semestre de 2026.






