A NVIDIA anunciou hoje (7) modelos de base executados localmente em PCs NVIDIA RTX™ IA que potencializam NPCs humanos digitais, criação de conteúdo, produtividade e desenvolvimento.
Esses modelos, oferecidos como microsserviços NVIDIA NIM™, são acelerados pelas novas GPUs GeForce RTX™ Série 50, que apresentam até 3.352 trilhões de operações por segundo com desempenho de IA e 32 GB de VRAM.
Construídas na arquitetura NVIDIA Blackwell, as RTX Série 50 são as primeiras GPUs de consumo a adicionar suporte para computação FP4, dobrando o desempenho de inferência de IA e permitindo que modelos de IA generativos sejam executados localmente em uma memória menor, em comparação com o hardware da geração anterior.
A GeForce™ tem sido uma plataforma vital para desenvolvedores de IA há muito tempo. A primeira rede de deep learning acelerada por GPU, AlexNet, foi treinada em uma GeForce GTX™ 580 em 2012 — e em 2024, mais de 30% dos artigos de pesquisa de IA publicados citaram o uso de GPUs GeForce RTX.
Agora, com IA generativa e PCs de IA RTX, qualquer um pode ser um desenvolvedor. Uma nova onda de ferramentas de baixo código e sem código, como AnythingLLM, ComfyUI, Langflow e LM Studio permitem que entusiastas da tecnologia utilizem modelos de IA em fluxos de trabalho complexos por meio de interfaces gráficas de usuário simples.
Os microsserviços NIM conectados a essas interfaces de usuário facilitarão acessar e implementar os modelos de IA generativa mais recentes. Os NVIDIA AI Blueprints, criados com os microsserviços NIM, fornecem fluxos de trabalho de referência pré-configurados e fáceis de usar para NPCs humanos digitais, criação de conteúdo e muito mais.
Para atender à crescente demanda de desenvolvedores e entusiastas de IA, todos os principais fabricantes de PC e construtores de sistemas estão lançando PCs RTX IA prontos para NIM com GPUs GeForce RTX Série 50.
“A inteligência artificial está avançando na velocidade da luz, desde a IA de percepção até a IA generativa e agora a IA de agente”, afirmou Jensen Huang, fundador e CEO da NVIDIA. “Os microsserviços NIM e os Blueprints da NVIDIA de IA dão aos desenvolvedores e entusiastas de PC os blocos de construção necessários para explorar a magia da IA.”
Tornando a inteligência artificial mais ágil
Modelos de base, redes neurais treinadas em imensas quantidades de dados brutos, são os blocos de construção da IA generativa.
A NVIDIA anunciou durante a sua apresentação na CES que lançará um pipeline de microsserviços NIM para PCs RTX IA de desenvolvedores de modelos de ponta, como Black Forest Labs, Meta, Mistral e Stability AI. Os casos de uso abrangem modelos de linguagem grande (LLMs), modelos de linguagem de visão, geração de imagens, fala, modelos de incorporação para geração aumentada de recuperação (RAG), extração de PDF e visão computacional.
“GPUs GeForce RTX Série 50 com computação FP4 desbloquearão uma gama massiva de modelos que podem ser executados em PC, que antes eram limitados a grandes data centers”, disse Robin Rombach, CEO da Black Forest Labs. “Tornar o FLUX um microsserviço NVIDIA NIM aumenta a taxa na qual a IA pode ser implantada e experimentada por mais usuários, ao mesmo tempo em que oferece desempenho incrível.”
A NVIDIA também anunciou a família Llama Nemotron de modelos abertos que oferecem alta precisão em uma ampla gama de tarefas de agente. O modelo Llama Nemotron Nano será oferecido como um microsserviço NIM para PCs e estações de trabalho RTX IA, e se destaca em tarefas de IA de agente como seguir instruções, conversar, codificar e realizar operações matemáticas.
Os microsserviços NIM incluem os principais componentes para executar IA em PCs e são otimizados para implantação em GPUs NVIDIA, seja em PCs e estações de trabalho RTX ou na nuvem.
Desenvolvedores e entusiastas poderão baixar, configurar e executar rapidamente esses microsserviços em PCs com Windows 11 com Windows Subsystem for Linux (WSL).
“A IA está impulsionando a inovação do Windows 11 PC em um ritmo rápido, e o Windows Subsystem para Linux (WSL) oferece um ótimo ambiente multiplataforma para desenvolvimento de IA no Windows 11 com o Windows Copilot Runtime”, afirmou Pavan Davuluri, vice-presidente corporativo do Windows na Microsoft. “Os microsserviços NVIDIA NIM, otimizados para PCs Windows, dão aos desenvolvedores e fãs de tecnologia modelos de IA prontos para integrar para seus softwares Windows, acelerando ainda mais a implantação de recursos de IA para os usuários.”
Quando executados em PCs RTX IA, os microsserviços NIM serão compatíveis com as principais estruturas de desenvolvimento e agentes de IA, incluindo o AI Toolkit para VSCode, AnythingLLM, ComfyUI, CrewAI, Flowise AI, LangChain, Langflow e LM Studio.
Os desenvolvedores podem conectar aplicativos e fluxos de trabalho criados nessas estruturas a modelos de IA que executam microsserviços NIM por meio de endpoints padrão do setor, permitindo que eles usem a tecnologia mais recente com uma interface unificada na nuvem, data centers, estações de trabalho e PCs.
Os entusiastas também poderão experimentar uma variedade de microsserviços NIM utilizando a nova versão de demonstração do NVIDIA ChatRTX.
Colocando um rosto à IA de agente
Para demonstrar como entusiastas e desenvolvedores podem usar o NIM para criar agentes e assistentes de IA, a NVIDIA apresentou o Project R2X, um avatar de PC habilitado com visão que pode colocar informações na ponta dos dedos do usuário, auxiliar com aplicativos/softwares do desktop, chamadas de videoconferência, ler e resumir documentos e muito mais.
O avatar é renderizado utilizando o NVIDIA RTX Neural Faces, um novo algoritmo de IA generativa que aumenta a rasterização tradicional com pixels totalmente gerados pela inteligência artificial. O rosto é então animado por um novo modelo chamado NVIDIA Audio2Face™-3D que melhora o movimento dos lábios e da língua.
O R2X pode ser conectado a serviços de IA em nuvem, como GPT4o da OpenAI e Grok da xAI, e microsserviços NIM e Blueprints de IA, como recuperadores de PDF ou LLMs alternativos, por meio de estruturas de desenvolvedor como CrewAI, Flowise AI e Langflow. Para acompanhar as atualizações do Projeto R2X, inscreva-se aqui.
AI Blueprints chegando ao PC
Os microsserviços NIM também estão disponíveis para usuários de PC por meio dos AI Blueprints de fluxos de trabalho de IA de referência que podem ser executados localmente em PCs RTX. Com esses blueprints, os desenvolvedores podem criar podcasts a partir de documentos PDF, gerar imagens impressionantes guiadas por cenas 3D e muito mais.
O blueprint de PDF para podcast extrai texto, imagens e tabelas de um PDF para criar um script de podcast que pode ser editado pelos usuários. Ele também pode gerar uma gravação de áudio completa do script usando vozes disponíveis no serviço ou com base na amostra de voz do usuário. Além disso, será possível ter uma conversa em tempo real com o apresentador do podcast de IA para aprender mais sobre tópicos específicos.
O blueprint utiliza microsserviços NIM como Mistral-Nemo-12B-Instruct para linguagem, NVIDIA Riva para conversão de texto em fala e reconhecimento automático de fala, e os microsserviços NeMo Retriever para extração de PDF.
O AI Blueprint para IA generativa guiada 3D oferece aos artistas um controle mais preciso sobre a geração de imagens. Embora a IA possa gerar imagens incríveis a partir de prompts de texto simples, controlar a composição da imagem usando apenas palavras pode ser desafiador.
Com este blueprint, os criadores podem usar objetos 3D simples dispostos em um renderizador 3D, como o Blender, para orientar a geração de imagens. O artista pode criar ativos 3D manualmente ou gerá-los usando IA, colocá-los na cena e definir a câmera da janela de visualização 3D.
Em seguida, um fluxo de trabalho alimentado pelo microsserviço FLUX NIM usará a composição atual para gerar imagens de alta qualidade que correspondem à cena 3D.
Os microsserviços NVIDIA NIM e AI Blueprints estarão disponíveis a partir de fevereiro com suporte inicial de hardware para as GPUs GeForce RTX Série 50, GeForce RTX 4090, RTX 4080 e NVIDIA RTX 6000 e 5000.
Outras GPUs receberão suporte paras as tecnologias no futuro. PCs RTX IA prontos para NIM também estarão disponíveis na Acer, ASUS, Dell, GIGABYTE, HP, Lenovo, MSI, Razer e Samsung, e nos construtores de sistemas locais Corsair, Falcon Northwest, LDLC, Maingear, Mifcon, Origin PC, PCS e Scan.
Saiba mais sobre como os microsserviços NIM, AI Blueprints e os PCs de IA RTX prontos para NIM estão acelerando a IA generativa com os anúncios da NVIDIA na CES.
Veja também: SEGA e Ryu Ga Gotoku Studios anunciam Like a Dragon Direct para 9 de janeiro