O que é um SuperNIC?

  • Terça, 13th Fevereiro, 2024
  • 12:16pm

Um SuperNIC é um tipo de acelerador de rede para data centers em nuvem de IA que oferece conectividade robusta e contínua entre servidores GPU.

A IA generativa é a última reviravolta no cenário digital em rápida mudança. Uma das inovações revolucionárias que tornou isso possível é um termo relativamente novo: SuperNIC. 

O que é um SuperNIC?

SuperNIC é uma nova classe de aceleradores de rede projetados para sobrecarregar cargas de trabalho de IA em hiperescala em nuvens baseadas em Ethernet. Ele fornece conectividade de rede ultrarrápida para comunicação GPU a GPU, alcançando velocidades que chegam a 400 Gb/s usando tecnologia de acesso remoto direto à memória (RDMA) sobre Ethernet convergente (RoCE). 

SuperNICs combinam os seguintes atributos exclusivos: 

Reordenação de pacotes em alta velocidade para garantir que os pacotes de dados sejam recebidos e processados ​​na mesma ordem em que foram originalmente transmitidos. Isso mantém a integridade sequencial do fluxo de dados. 

Controle avançado de congestionamento usando dados de telemetria em tempo real e algoritmos com reconhecimento de rede para gerenciar e prevenir congestionamentos em redes de IA. 

Computação programável no caminho de entrada/saída (E/S) para permitir a personalização e a extensibilidade da infraestrutura de rede em data centers em nuvem de IA. 

Design discreto e com baixo consumo de energia para acomodar com eficiência cargas de trabalho de IA dentro de orçamentos de energia limitados. 

Otimização de IA completa, incluindo computação, rede, armazenamento, software de sistema, bibliotecas de comunicação e estruturas de aplicativos. 

A NVIDIA revelou recentemente o primeiro SuperNIC do mundo feito sob medida para computação de IA, baseado na plataforma de rede BlueField-3 . Faz parte da plataforma NVIDIA Spectrum-X, onde se integra perfeitamente ao sistema de switch Ethernet Spectrum-4.  

Juntos, o sistema de switch NVIDIA BlueField-3 SuperNIC e Spectrum-4 formam a base de uma estrutura de computação acelerada projetada especificamente para otimizar cargas de trabalho de IA. O Spectrum-X oferece consistentemente altos níveis de eficiência de rede, superando os ambientes Ethernet tradicionais. 

“Em um mundo onde a IA está impulsionando a próxima onda de inovação tecnológica, o BlueField-3 SuperNIC é uma engrenagem vital no maquinário”, disse Yael Shenhav, vice-presidente de produtos DPU e NIC da NVIDIA. “Os SuperNICs garantem que suas cargas de trabalho de IA sejam executadas com eficiência e velocidade, tornando-os componentes fundamentais para permitir o futuro da computação de IA.” 

O cenário em evolução da IA ​​e das redes 

O campo da IA ​​está passando por uma mudança sísmica, graças ao advento da IA ​​generativa e de grandes modelos de linguagem . Estas tecnologias poderosas abriram novas possibilidades, permitindo que os computadores realizem novas tarefas.  

O sucesso da IA ​​depende muito da computação acelerada por GPU para processar montanhas de dados, treinar grandes modelos de IA e permitir inferência em tempo real. Este novo poder computacional abriu novas possibilidades, mas também desafiou as redes Ethernet em nuvem. 

A Ethernet tradicional, a tecnologia que sustenta a infraestrutura da Internet, foi concebida para oferecer ampla compatibilidade e conectar aplicações fracamente acopladas. Ele não foi projetado para lidar com as exigentes necessidades computacionais das cargas de trabalho modernas de IA, que envolvem processamento paralelo fortemente acoplado, transferências rápidas de dados e padrões de comunicação exclusivos – todos os quais exigem conectividade de rede otimizada.  

As placas de interface de rede (NICs) fundamentais foram projetadas para computação de uso geral, transmissão universal de dados e interoperabilidade. Eles nunca foram projetados para lidar com os desafios únicos impostos pela intensidade computacional das cargas de trabalho de IA.  

As NICs padrão não possuem os recursos e capacidades necessários para transferência de dados eficiente, baixa latência e desempenho determinístico crucial para tarefas de IA. Os SuperNICs, por outro lado, são desenvolvidos especificamente para cargas de trabalho modernas de IA. 


Vantagens do SuperNIC em ambientes de computação de IA 

As unidades de processamento de dados (DPUs) oferecem diversos recursos avançados, oferecendo alto rendimento, conectividade de rede de baixa latência e muito mais. Desde a sua introdução em 2020, as DPUs ganharam popularidade no domínio da computação em nuvem, principalmente devido à sua capacidade de descarregar, acelerar e isolar o processamento da infraestrutura do data center.

O treinamento distribuído de IA e os fluxos de comunicação de inferência dependem fortemente da disponibilidade de largura de banda da rede para ter sucesso. SuperNICs, que se distinguem por seu design elegante, escalam com mais eficiência do que DPUs, fornecendo impressionantes 400 Gb/s de largura de banda de rede por GPU.  

A proporção de 1:1 entre GPUs e SuperNICs em um sistema pode melhorar significativamente a eficiência da carga de trabalho de IA, levando a maior produtividade e resultados superiores para as empresas.  

O único objetivo dos SuperNICs é acelerar a rede para computação em nuvem de IA. Conseqüentemente, ele atinge esse objetivo usando menos poder computacional do que uma DPU, o que requer recursos computacionais substanciais para descarregar aplicativos de uma CPU host.  

Os requisitos reduzidos de computação também se traduzem em menor consumo de energia, o que é especialmente crucial em sistemas contendo até oito SuperNICs. 

Recursos distintivos adicionais do SuperNIC incluem seus recursos de rede dedicados de IA. Quando totalmente integrado a um switch NVIDIA Spectrum-4 otimizado para IA, ele oferece roteamento adaptativo, manipulação de pacotes fora de ordem e controle de congestionamento otimizado. Esses recursos avançados são fundamentais para acelerar os ambientes de nuvem Ethernet AI. 


Revolucionando a computação em nuvem com IA

O NVIDIA BlueField-3 SuperNIC oferece vários benefícios que o tornam fundamental para uma infraestrutura pronta para IA: 

Eficiência máxima da carga de trabalho de IA: o BlueField-3 SuperNIC foi desenvolvido especificamente para computação massivamente paralela e com uso intensivo de rede, tornando-o ideal para cargas de trabalho de IA. Ele garante que as tarefas de IA sejam executadas com eficiência — sem gargalos. 

Desempenho consistente e previsível: Em data centers multilocatários, onde inúmeras tarefas são processadas simultaneamente, o BlueField-3 SuperNIC garante que o desempenho de cada trabalho e de cada locatário seja isolado, previsível e não afetado por outras atividades de rede. 

Infraestrutura segura em nuvem multilocatário: a segurança é uma prioridade máxima, especialmente em data centers que lidam com informações confidenciais. O BlueField-3 SuperNIC mantém altos níveis de segurança, permitindo que vários locatários coexistam enquanto mantém os dados e o processamento isolados. 

Infraestrutura de rede extensível: O BlueField-3 SuperNIC não tem escopo limitado — é altamente flexível e adaptável a uma infinidade de outras necessidades de infraestrutura de rede.
Amplo suporte ao fabricante de servidores: O BlueField-3 SuperNIC se adapta perfeitamente à maioria dos servidores de classe empresarial, sem consumo excessivo de energia em data centers.

Fonte: Nvidia.com

« Retornar

ico-whatsapp
Dúvidas por WhatsApp
ico-chat
Dúvidas por Web Chat
ico-ticket.png
Abrir ticket Suporte