NVIDIA 推出基於 AI 的模型，以增強數位人類、內容創作、生產力和開發

NVIDIA 於 1 月 6 日宣布推出在 NVIDIA RTX AI PC 上本地運行的基礎模型，為數位人類、內容創建、生產力和開發提供支援。

這些車型作為 NVIDIA NIM 微服務提供，由新的 GeForce RTX50 系列 GPU 加速，具有高達 3.352 兆次操作/秒的 AI 性能和 32GB VRAM。 RTX50 系列基於NVIDIA Blackwell 架構構建，是首款添加對FP4 計算支援的消費類GPU，與上一代硬體相比，AI 推理性能提高了2 倍，有助於生成AI 模型並以較小的內存佔用在本地運行。

GeForce 長期以來一直是人工智慧開發人員的首選平台。第一個 GPU 加速的深度學習網路 AlexNet 於 2012 年在 GeForce GTX580 上進行了訓練。此外，去年發表的人工智慧研究論文中有超過 30% 引用了 GeForce RTX 的使用。

如今，任何擁有生成式人工智慧和 RTX AI PC 的人都可以成為開發者。一系列新的低程式碼和無程式碼工具，例如 AnythingLLM、ComfyUI、Langflow 和 LM Studio，讓愛好者能夠透過簡單的圖形使用者介面將 AI 模型用於複雜的工作流程。

連接到這些 GUI 的 NIM 微服務可以輕鬆存取和部署現代生成式 AI 模型。 NVIDIA AI Blueprint 是基於 NIM 微服務構建，為數位人類、內容創建等提供易於使用、預先配置的參考工作流程。

為了滿足 AI 開發人員和愛好者不斷增長的需求，所有主要 PC 製造商和系統建構商都在推出由 GeForce RTX50 系列 GPU 提供支援、支援 NIM 的 RTX AI PC。

NVIDIA 創辦人兼執行長黃仁勳表示：「人工智慧正在以光速發展，從感知人工智慧到生成人工智慧，再到現在的代理人工智慧。我們為開發者和愛好者提供探索人工智慧魔力的建構模組。

・使AI與NIM相容
底層模型（經過大量原始資料訓練的神經網路）是生成式人工智慧的建構塊。 NVIDIA 發布了適用於 RTX AI PC 的 NIM 微服務管道，來自 Black Forest Labs、Meta、Mistral 和 Stability.AI 等領先模型開發人員。使用案例涵蓋大規模語言模型 (LLM)、視覺語言模型、圖像生成、語音、用於檢索增強生成 (RAG) 的嵌入式模型、PDF 提取和電腦視覺。

Black Forest Labs 執行長Robin Rombach 表示：「具有FP4 運算功能的GeForce RTX 50 系列GPU 讓我們能夠在以前僅限於大型資料中心的PC 上運行大型模型。透過將FLUX 打造為NVIDIA NIM 微服務，將會有更多用戶使用。

此外，NVIDIA 今天還推出了 Llama Nemotron 系列開放式模型，可在各種代理任務中提供高精度。 Llama Nemotron Nano 模型是作為 RTX AI PC 和工作站的 NIM 微服務提供，擅長執行基於代理的 AI 任務，例如指令追蹤、函數呼叫、聊天、編碼和數學。

NIM 微服務包含在 PC 上運行 AI 的關鍵元件，並針對跨 NVIDIA GPU（包括 RTX PC、工作站和雲端）的部署進行了最佳化。

這使得開發人員和愛好者可以在具有 Windows Subsystem for Linux (WSL) 的 Windows 11 PC 上快速下載、設定和運行這些 NIM 微服務。

微軟 Windows 公司副總裁 Pavan Davuluri 表示：「人工智慧正在迅速推動 Windows 11 PC 上的創新，Windows Linux 子系統 (WSL) 與 Windows Copilot Runtime 一起是 Windows 11 上人工智慧開發的強大工具。」針對Windows PC 進行優化的NVIDIA NIM 微服務為開發人員和愛好者將AI 整合到他們的Windows 應用程式中提供了良好的跨平台環境。 “這將進一步加速人工智慧功能向Windows用戶的部署。”

在 RTX AI PC 上運行的 NIM 微服務與領先的 AI 開發和代理框架相容，包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow 和 LM Studio。開發人員可以透過業界標準端點將基於這些框架建立的應用程式和工作流程連接到運行 NIM 微服務的 AI 模型，確保跨雲端、資料中心、工作站和 PC 使用最新技術和現代介面。

此外，NVIDIA ChatRTX技術演示也即將發布，讓您體驗各種NIM微服務。

・為特工型AI賦予臉部表情
為了示範使用者和開發人員如何使用 NIM 建置代理程式和助手，NVIDIA 今天發布了 Project R2X。這是一個視覺化身，可以為用戶提供即時訊息，協助桌面應用程式和視訊電話會議，以及閱讀和總結文件。

化身使用 NVIDIA RTX Neural Faces 進行渲染，這是一種新的生成式 AI 演算法，可透過完全生成的像素增強傳統光柵化。然後，基於擴散的新型 NVIDIA Audio2Face-3D 型號可以對面部表情進行動畫處理，從而改善嘴唇和舌頭的運動。 R2X 透過 OpenAI 的 GPT4o 和 xAI 的 Grok 等雲端 AI 服務以及 CrewAI、Flowise AI 和 Langflow 等開發人員框架，連接到 NIM 微服務和 AI 藍圖，例如 PDF 檢索器和替代 LLM。註冊以了解 R2X 專案的最新動態。

・AI 藍圖現已登陸 PC
NIM 微服務還可以透過 AI Blueprint 向 PC 用戶提供，AI Blueprint 是一種可以在 RTX PC 上本地運行的參考 AI 工作流程。這些藍圖允許開發人員從 PDF 文件建立播客或在 3D 場景引導下產生令人驚嘆的影像。

PDF 到播客藍圖從 PDF 中提取文字、圖像和表格，以建立使用者可以編輯的播客腳本。您也可以使用藍圖中提供的音訊和使用者音訊範例從腳本產生完整的錄音。此外，用戶還可以與人工智慧播客主持人進行即時對話，以了解有關特定主題的更多資訊。

Blueprint 使用 NIM 微服務，例如用於語言的 Mistral-Nemo-12B-Instruct、用於文字轉語音和自動語音識別的 NVIDIA Riva，以及用於 PDF 提取的 NeMo Retriever 微服務集合。

AI Blueprint 是一種 3D 引導生成 AI，讓藝術家能夠更好地控制影像生成。人工智慧可以透過簡單的文字提示產生精美的圖像，但僅使用文字控制圖像的組成可能很困難。此藍圖允許創作者使用 3D 渲染器（例如 Blender）中佈置的簡單 3D 物件來指導 AI 影像生成。藝術家可以手動創建 3D 資產或使用 AI 生成它們，將它們放置在場景中，並設定 3D 視窗相機。然後，FLUX NIM 微服務提供的打包工作流程使用目前配置產生與 3D 場景相符的高品質影像。

NVIDIA NIM 微服務和 AI 藍圖將於 2 月開始提供，並為 GeForce RTX50 系列、GeForce RTX4090 和 4080 以及 NVIDIA RTX6000 和 5000 專業 GPU 提供初始硬體支援。未來將支援更多 GPU。支援 NIM 的 RTX AI PC 可從 Acer、ASUS、Dell、GIGABYTE、HP、Lenovo、MSI、Razer、Samsung 和區域系統製造商 Corsair、Falcon Northwest、LDLC、Maingear、Mifcon、Origin PC、PCS、Scan Scheduled 購買被釋放。