NVIDIA e OpenAI lançam modelos avançados de IA para rodar localmente em GPUs GeForce RTX

A NVIDIA anunciou uma parceria inovadora com a OpenAI para levar modelos avançados de inteligência artificial (IA), até então disponíveis apenas em data centers na nuvem, para GPUs GeForce RTX, possibilitando que esses sistemas rodem localmente em PCs e estações de trabalho. A novidade foi divulgada nesta semana e representa um avanço significativo para o ecossistema de IA local, ao proporcionar alta velocidade e eficiência, impulsionada pelo desempenho das GPUs GeForce RTX e RTX PRO.

O lançamento inclui duas versões dos modelos de IA, adaptadas para diferentes configurações. O modelo gpt-oss-20b é otimizado para PCs com GPUs RTX AI e pelo menos 16 GB de VRAM, podendo processar até 250 tokens por segundo em uma GPU RTX 5090. Já o gpt-oss-120b, maior e mais robusto, é compatível com estações de trabalho profissionais equipadas com GPUs RTX PRO. Ambos os modelos foram treinados em GPUs NVIDIA H100 e são os primeiros a utilizar a tecnologia MXFP4 na plataforma RTX, que melhora a qualidade e precisão dos modelos sem sacrificar o desempenho.

Esses modelos também oferecem uma das maiores capacidades de contexto para inferência local, suportando até 131.072 tokens, e contam com arquitetura flexível de mixture-of-experts (MoE), que inclui recursos avançados como chain-of-thought, suporte a instruções e uso de ferramentas.

Para facilitar o acesso aos novos modelos, a NVIDIA destaca algumas opções para entusiastas e desenvolvedores de IA. O aplicativo Ollama oferece uma interface simples e otimizada para GPUs RTX, permitindo que usuários testem os modelos gpt-oss com facilidade. Além disso, a empresa colabora com a comunidade open source para otimizar o desempenho em GPUs RTX, com iniciativas como o uso de CUDA Graphs no projeto Llama.cpp, disponível no GitHub. Desenvolvedores que trabalham com Windows podem utilizar o Microsoft AI Foundry Local, atualmente em preview público, para executar os modelos.

Jensen Huang, fundador e CEO da NVIDIA, ressaltou a importância dessa colaboração: “A OpenAI mostrou ao mundo o que poderia ser construído com a IA da NVIDIA, e agora estão impulsionando a inovação em software de código aberto. Os modelos gpt-oss permitem que desenvolvedores do mundo todo construam sobre essa base de código aberto de última geração, fortalecendo a liderança tecnológica dos EUA em IA, tudo isso sobre a maior infraestrutura de computação de IA do mundo.”

Faça como os mais de 10.000 leitores do tecflow, clique no sino azul e tenha nossas notícias em primeira mão! Confira as melhores ofertas de celulares na loja parceira do tecflow.

Redação tecflow

Tecflow é um website focado em notícias sobre tecnologia com resenhas, artigos, tutoriais, podcasts, vídeos sobre tech, eletrônicos de consumo e mercado B2B.

Deixe comentário

Seu endereço de e-mail não será publicado. Os campos necessários são marcados com *.

Mais acessados

Dicas e Tutoriais

SmartPhones & Tablets

Mercado & Tecnologia

Consoles e Games

Ciência & Espaço

Eventos

Quem Somos

Tecflow é um website focado em notícias sobre tecnologia com resenhas, artigos, tutoriais, podcasts, vídeos sobre tech, eletrônicos de consumo e mercado B2B.

Siga Tecflow em:

Parceiro Autthentic

error: Content is protected !!