Home / Tecnologia / NVIDIA BlueField-4: Nova infraestrutura de armazenamento nativa para IA

NVIDIA BlueField-4: Nova infraestrutura de armazenamento nativa para IA

NVIDIA BlueField-4: Nova infraestrutura de armazenamento nativa para IA

A NVIDIA anunciou que o processador de dados NVIDIA BlueField-4 impulsiona a plataforma NVIDIA Inference Context Memory Storage, uma nova classe de infraestrutura de armazenamento nativa para IA, projetada para inferência em escala gigabit, com o objetivo de acelerar e dimensionar agentes de IA. A novidade foi apresentada durante a CES.

Armazenamento de memória de contexto

A plataforma de processadores de armazenamento foi desenvolvida para sistemas de IA com agentes que processam contextos extensos, com memória de curto e longo prazo extremamente rápida. Segundo a empresa, a plataforma de armazenamento de memória de contexto de inferência amplia a memória de longo prazo dos agentes de IA e permite o compartilhamento de contexto de alta largura de banda em clusters de sistemas de IA em escala de rack, aumentando o número de tokens por segundo e a eficiência energética em até 5 vezes.

Além disso, graças à tecnologia NVIDIA Spectrum-X Ethernet, a memória de contexto estendida para agentes de IA com múltiplas interações melhora a capacidade de resposta, aumenta a taxa de transferência por GPU e oferece suporte à escalabilidade eficiente da inferência de agentes.

Escalabilidade e Raciocínio

À medida que os modelos de IA escalam para trilhões de parâmetros e raciocínio em várias etapas, eles geram vastas quantidades de dados contextuais — representados por um cache de chave-valor (KV), essenciais para a precisão, a experiência do usuário e a continuidade.

A plataforma NVIDIA Inference Context Memory Storage fornece a infraestrutura para memória de contexto, ampliando a capacidade de memória da GPU, permitindo o compartilhamento em alta velocidade entre nós, aumentando o número de tokens por segundo em até 5 vezes e oferecendo até 5 vezes mais eficiência energética em comparação com o armazenamento tradicional.

Conforme Jensen Huang, fundador e CEO da NVIDIA, a IA está revolucionando toda a pilha de computação e, agora, o armazenamento.

A IA não se resume mais a chatbots de resposta única, mas sim a colaboradores inteligentes que entendem o mundo físico, raciocinam em horizontes de longo prazo, mantêm-se ancorados em fatos, usam ferramentas para realizar trabalho real e retêm memória de curto e longo prazo. Com o BlueField-4, a NVIDIA e nossos parceiros de software e hardware estão reinventando a pilha de armazenamento para a próxima fronteira da IA.

— Jensen Huang, fundador e CEO da NVIDIA

A plataforma NVIDIA Inference Context Memory Storage aumenta a capacidade do cache KV e acelera o compartilhamento de contexto em clusters de sistemas de IA em escala de rack, enquanto o contexto persistente para agentes de IA com múltiplas interações melhora a capacidade de resposta, aumenta a produtividade da fábrica de IA e oferece suporte ao escalonamento eficiente da inferência multiagente de contexto longo.

Recursos principais da plataforma NVIDIA BlueField-4

  • Capacidade de cache KV em nível de cluster NVIDIA Rubin, oferecendo a escalabilidade e a eficiência necessárias para inferência agentiva de contexto longo e múltiplas etapas;
  • Eficiência energética até 5 vezes maior do que o armazenamento tradicional;
  • Compartilhamento inteligente e acelerado do cache KV entre nós de IA, habilitado pela estrutura NVIDIA DOCA™ e integrado de forma precisa com a biblioteca NVIDIA NIXL e o software NVIDIA Dynamo para maximizar tokens por segundo, reduzir o tempo até o primeiro token e melhorar a capacidade de resposta em múltiplas etapas;
  • O posicionamento de cache KV acelerado por hardware, gerenciado pelo NVIDIA BlueField-4, elimina a sobrecarga de metadados, reduz a movimentação de dados e garante acesso seguro e isolado dos nós da GPU;
  • O compartilhamento e a recuperação eficientes de dados, possibilitados pela NVIDIA Spectrum-X™ Ethernet, servem como a estrutura de rede de alto desempenho para acesso baseado em RDMA ao cache KV nativo de IA.

De acordo com Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para a América Latina, à medida que a IA evolui para modelos com contextos mais longos e inferência contínua, o armazenamento deixa de ser um gargalo e se torna um acelerador da inovação.

O BlueField-4 foi projetado precisamente para atender a essa nova demanda.

— Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para a América Latina

Empresas inovadoras no setor de armazenamento, incluindo AIC, Cloudian, DDN, Dell Technologies, HPE, Hitachi Vantara, IBM, Nutanix, Pure Storage, Supermicro, VAST Data e WEKA, estão entre as primeiras a desenvolver plataformas de armazenamento com IA de última geração com o BlueField-4, que estará disponível no segundo semestre de 2026.

Marcado:

Deixe um Comentário