A NVIDIA revela a nova GPU projetada para inferência de controte
Na cúpula de infraestrutura de IA na terça -feira, a Nvidia anunciou uma nova GPU chamada Rubin CPX, projetada para janelas de contexto com maiores que 1 milhão de tokens. Parte da próxima série Rubin da gigante do chip, o CPX é otimizado para o processamento de grandes sequências de contexto e deve ser usado como parte de uma abordagem mais ampla de infraestrutura de “inferência desagregada”. Para os usuários, o resultado será um melhor desempenho em tarefas de longo contexto, como geração de vídeo ou desenvolvimento de software. O ciclo de desenvolvimento incansável da NVIDIA resultou em enormes lucros para a empresa, o que ganhou US $ 41,1 bilhões em vendas de data centers em seu trimestre mais recente. O Rubin CPX está programado para estar disponível no final de 2026.
Fonte