英偉達，火力全開

因為人工智慧的助推，英偉達本身在過去幾年裡就一路狂飆。進入最近兩年，因為“元宇宙”的火熱，公司股價大漲，市值直逼萬億美元，市場關注度也空前。但對這個以GPU起家的晶片巨頭來說，他們的未來不僅僅是GPU。

其實我們甚至可以直言，英偉達不再是一個單純的晶片公司。

在一年一度的GTC大會開幕前夕，當我們看著黃仁勳在影片上一樣一樣地介紹著英偉達的GPU、網絡卡、方案和應用案例，並在期間侃侃其對元宇宙的佈局和展望之後，我們看到了這個極客對未來的設想和野心。

深耕資料中心

雖然在GTC主題演講上黃仁勳沒有過多地談論其GPU，但從一些相關資料，我們可以看到了這個當前炙手可熱產品對於黃仁勳構建的未來世界的重要意義。

據Nvidia 產品管理和營銷高階總監 Paresh Kharya 介紹，該公司的GPU晶片已經在推動該行業實現“百萬倍的飛躍”，這遠遠超過摩爾定律所帶來的遞增。Paresh Kharya 進一步指出，當前許多新應用都依賴於人工智慧演算法，而這些演算法為Nvidia GPU上的大量電晶體提供了理想的機會。按照Kharya的預估，在過去 10 年中，Nvidia GPU 的原始計算能力增長了 1，000 倍，但更多硬體設計和軟體演算法的引入，使得資料中心中的多個 GPU 能夠有效協同地高效能工作。

除了GPU以外，英偉達還在探索更多的晶片機會，以滿足需求。正如黃仁勳在GTC主題演講中所說，加速計算推動了現代AI的發展，它掀起的浪潮正在湧向科學界和全球各行各業。而這一切都基於3類晶片 —— GPU、CPU、DPU，以及從雲端到邊緣部署廣泛的多種系統 —— DGX、HGX、EGX、RTX和AGX系統。

在演講中，黃仁勳釋出了公司新一代的InfiniBand網路平臺NVIDIA Quantum-2，為雲計算提供商和超級計算中心提供極致的效能、廣泛的接入能力及強大的安全性。得以在這麼重要的重合亮相，可以看到英偉達對其在公司未來的底層技術版圖中的重要性。

據介紹，NVIDIA Quantum-2 平臺即400Gbps的 InfiniBand網路平臺，包括NVIDIA Quantum-2交換機、ConnectX-7網絡卡、BlueField-3資料處理器DPU（資料處理器）和所有支援這種新架構的軟體。這也是迄今為止最先進的端到端網路平臺。其中，採用7nm工藝打造的Quantum-2交換機晶片集成了超過570億個電晶體的，比NVIDIA的GA100 GPU核心（540億電晶體）還要多。

Quantum-2交換機晶片還具有64個400Gbps埠或128個200Gbps埠，並將提供不同埠數的交換機系統，最多達2048個400Gbps埠或4096個200Gbps埠——交換能力上，超出上一代Quantum-1約 5倍。

ConnectX-7也是基於7奈米工藝設計，包含80億個電晶體，其資料傳輸速率是目前世界領先的高效能計算網路晶片NVIDIA ConnectX-6的兩倍，還使RDMA、GPUDirect Storage、GPUDirect RDMA和網路計算的效能翻倍。；BlueField-3 InfiniBand也採用7奈米工藝設計，包含220億個電晶體，提供16個64位的Arm CPU，以解除安裝和隔離各種資料中心基礎設施服務。

憑藉每秒400 Gbps的高吞吐量，NVIDIA Quantum-2 InfiniBand將網速提高了一倍，網路埠數量增加了三倍。它在效能提升3倍的同時，還將對資料中心網路所需的交換機數量減少了6倍，於此同時，資料中心的能耗和空間各減少了7%。按照英偉達所說，這個新平

臺是為超級計算中心和全球雲服務提供商準備的。

為邊緣AI鋪平道路

在深耕資料中心的同時，英偉達同時還深耕多個領域，而機器人就是他們專注的一個方向。日前，他們釋出了全球最小、功能最強大、能效最高的AI超級計算機——NVIDIA Jetson AGX Orin，為機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算帶來了無限可能。

據介紹，Jetson AGX Orin建立在NVIDIA Ampere架構之上，與前代機型Jetson AGX Xavier相比，新產品的處理能力提升了6倍，那就意味著在 INT8 機器學習工作負載中實現 200 TOPS 的效能。此外，公司還為新產品保持了相同的外形尺寸和引腳相容性。來到效能方面，Jetson AGX Orin每秒可進行200萬億次運算（TOPS），可與內建GPU的伺服器相媲美，但尺寸卻只有人的手掌那麼大。

資料顯示，搭載在Jetson AGX 中的Orin處理器具有 12 個 Arm Cortex-A78AE “Hercules” CPU 核心和一個具有 2048 個 CUDA 核心的整合 Ampere 架構 GPU，多達 170 億個電晶體，鑑於 Orin 的移動優先設計，NVIDIA 在該產品的時鐘速度方面相當保守。據瞭解，Jetson AGX Orin 的 CPU 核心最高頻率為 2GHz，而 GPU 最高頻率為 1GHz。此外，SoC 還包含一對 NVIDIA 最新一代的專用深度學習加速器（DLA），以及一個視覺加速器，以進一步加速和有效處理這些任務。Orin SoC 還搭配 32GB LPDDR5 RAM，該 RAM 連線到 256 位記憶體匯流排，可實現 204GB/秒的記憶體頻寬，搭配的64GB eMMC 5。1可以為資料儲存提供便利，容量更上一代Jetson AGX的兩倍。

英偉達方面表示，全新的Jetson計算機甚至還可以加速整個NVIDIA AI軟體棧，使開發者能夠部署最大、最複雜的模型以解決自然語言理解、3D感知、多感測器融合等領域的邊緣AI和機器人技術挑戰。他們指出，使用Jetson AGX Orin的客戶可以運用NVIDIA CUDA-X加速計算棧、NVIDIA JetPack SDK和最新NVIDIA工具進行應用開發和最佳化，包括雲原生開發工作流程。來自NVIDIA NGC目錄的預訓練模型已經過最佳化並且可以使用NVIDIA TAO工具套件和客戶資料集進行微調。這減少了生產級AI的部署時間和成本，而云原生技術實現了產品整個生命週期內的無縫更新。

在具體應用方面，按照英偉達所說，其針對特定用例的軟體框架包括用於機器人技術的NVIDIA Isaac Sim on Omniverse，NVIDIA Clara Holoscan SDK 用於醫療健康，NVIDIA DRIVE 用於自動駕駛。最新的 Isaac 版本包括對機器人作業系統（ROS）開發人員社群的重要支援。NVIDIA 還發布了用於合成數據生成和 Isaac GEMs 的全新 Omniverse Replicator，這些硬體加速軟體包使ROS開發者更容易在Jetson平臺上構建高效能AI機器人。

值得一提的是，英偉達DRIVE AGX Orin 同樣由 Jetson AGX Orin 等 NVIDIA Ampere 架構提供支援，是運輸行業的首選平臺。是新發布的 NVIDIA DRIVE Concierge 和 DRIVE Chauffeur 背後的先進處理器，這兩個 AI 平臺致力於透過 AI 助手重新定義車內乘客體驗，並分別為安全的自動駕駛提供動力。全球汽車和卡車製造商、新能源汽車初創公司和機器人計程車公司等眾多公司正在將其高效能 AI 計算用於其下一代智慧、軟體定義的移動解決方案。

按照黃仁勳在GTC主題演講中所示，所有移動之物都將實現完全或近乎完全的自主化。“到2024年，絕大多數新電動車都將具備真正的自動駕駛功能。”

他進一步指出，NVIDIA DRIVE是NVIDIA的自動駕駛汽車全棧開放式平臺，而Hyperion 8是NVIDIA最新的完整硬體和軟體架構。其感測器套件包括12個攝像頭、9個雷達、12個超聲波和一個前置鐳射雷達，所有處理均透過兩個NVIDIA Orin 系統級晶片進行。

黃仁勳子啊鹽加個鬧鐘功能詳細介紹了Hyperion內建的幾項新技術，包括用於DRIVE Sim的Omniverse Replicator。其中Omniverse Replicator是一個基於Omniverse的自動駕駛汽車合成數據生成引擎。

如英偉達所說，真實世界資料是昂貴、費力、需要人工標記的，它容易出錯且不完整，而Omniverse Replicator擴充套件了這些資料，該引擎能夠建立大量、多樣化的精確物理資料以滿足自動駕駛汽車和機器人開發者的需求。它還能生成人類難以或無法標記的真值資料，如速度、深度、被遮擋的物體、惡劣的天氣條件、追蹤各感測器上的物體移動等。

英偉達火力全開

其實上述的幾款晶片僅是英偉達昨天分享的冰山一角。

例如，公司還推出了一款用於邊緣AI推理的低功耗、小尺寸的加速器NVIDIA A2 Tensor Core GPU，其推理效能比CPU高出20倍。從配置上看，A2 似乎使用了其低端 GA107 GPU 的大幅縮減版本。由於只有 1280 個 CUDA 核心（和 40 個張量核心），A2 的尺寸僅為 GA107 的一半左右。但這與卡的尺寸和功率最佳化目標是一致的。A2 開箱即用僅消耗 60W，並且可以配置為進一步降低至 42W。

與此同時，NVIDIA 還發布了其 Triton 推理伺服器重大更新。據瞭解，Triton 支援在雲、資料中心、企業邊緣和嵌入式裝置等環境中對 GPU 和 CPU 進行 AI 推理，並與 AWS、Google Cloud、Microsoft Azure、阿里雲PAI-EAS 等平臺整合。此外，一款經 NVIDIA 最佳化、認證和支援的用於開發和部署 AI 的端到端軟體套件NVIDIA AI Enterprise 也集成了 Triton，客戶可利用它在本地資料中心和私有云的主流伺服器上執行 AI 工作負載。

據瞭解，全球超過 25000 餘家公司部署 NVIDIA AI 推理平臺，而這次Triton 推理伺服器的更新則包括：

可以自動化地從數百種組合中中為 AI 模型選擇最佳配置，以實現最優效能，同時確保應用程式所需服務質量的 Triton 模型分析器；支援基於Transformer的大規模語言模型（例如 Megatron 530B）在多個GPU和伺服器節點上執行並提供實時推理效能，而不是在單個GPU上執行的多 GPU 多節點功能；針對隨機森林和梯度提升決策樹模型 GPU 或 CPU 推理的新後端為開發者使用 Triton 進行深度學習和傳統機器學習提供了一個統一部署引擎的RAPIDS FIL；無縫整合讓客戶能夠在 SageMaker（AWS 完全託管的 AI 服務）中使用 Triton 輕鬆部署多框架的模型，並實現高推理效能的Amazon SageMaker 整合以及除了 NVIDIA GPU 和 x86 CPU 外，還支援在 Arm CPU 上最佳化 AI 推理工作負載。

此外，英偉達還推出了為訓練具有數萬億引數的語言模型而最佳化的 NVIDIA NeMo Megatron 框架、為新領域和語言進行訓練的可定製大型語言模型（LLM）Megatron 530B。其中，NVIDIA NeMo Megatron是在Megatron的基礎上發展起來的開源專案。由NVIDIA研究人員主導，研究大型轉換語言模型的高效訓練。而Megatron 530B則是世界上最大的可定製語言模型。

包含NVIDIA ReOpt、cuQuantum、cuNumeric、cuGraph、Modulus、Morpheus、Nemo、 Megatron、Riva、RAPIDS和DOCA在內的數十種新的或者更新的加速計算庫則是英偉達本次GTC的又一個亮點，這可以為資料科學家、研究者、學生和開發者帶來更好的特性和功能。

據瞭解，現在在NVIDIA產品目錄中有150多個加速計算工具包，NVIDIA開發者計劃中的近300萬名成員使用這些工具包，這個數字在過去五年增長了6倍。而CUDA（平行計算平臺和程式設計模型）僅在去年就被下載了700萬次，自發布以來的下載次數更是高達3000萬次。

在本屆GTC上，NVIDIA 還發布了一款零信任網路安全平臺，利用該平臺的一整套功能，網路安全行業可構建實時保護客戶資料中心的解決方案，助力客戶未雨綢繆應對日漸複雜的威脅。他們表示，零信任安全平臺結合了三種技術 —— NVIDIA BlueField DPU、NVIDIA DOCA 和 NVIDIA Morpheus 網路安全人工智慧框架。開發合作伙伴透過該平臺可實現應用程式與基礎設施隔離，增強下一代防火牆的效能，並利用加速計算和深度學習的力量來持續監控和檢測威脅，從而大幅提高資料中心的安全性，而這一切的處理透過 NVIDIA 加速效能比普通伺服器快 600 倍。

基於 NVIDIA Riva 語音 AI 軟體，英偉達還推出了一款名為NVIDIA Riva 的定製語音軟體。利用該工具，只需 30 分鐘的音訊資料，即可在一天之內打造類似真人的定製語音，能為為虛擬助理、呼叫中心語音和其他基於語音的應用程式提供支援。

英偉達還透過強大的AI流分析工具包DeepStream 6。0為視覺AI帶來低程式碼開發功能。據介紹，該版本引入了Graph Composer。這一全新低程式碼程式設計工具增強了DeepStream的使用者體驗。DeepStream 和 Graph Composer 將使用者底層平臺、框架和庫的具體內容抽象化，使開發者能夠將構建加速應用的時間從數週縮短至數日。

在現在的英偉達大會上，少不了的環節就是元宇宙，而NVIDIA Omniverse就是他們走向元宇宙的關鍵核心。簡而言之，這是一個用於將 3D 世界連線到共享虛擬世界的平臺。黃仁勳也表示，有了Omniverse，我們就有了建立全新3D世界，或對物理世界進行建模的技術。他進一步指出，自去年年底釋出以來，Omniverse已被500家公司的設計師下載了7萬次。“如何使用Omniverse模擬倉庫、工廠、物理和生物系統、5G邊緣、機器人、自動駕駛汽車，甚至是虛擬形象的數字孿生，是一個永恆的主題。”黃仁勳接著說。在主題演講中，他還對外發布了Omniverse Avatar。

英偉達方面表示，Omniverse Avatar能夠連線NVIDIA在語音AI、計算機視覺、自然語言理解、推薦引擎和模擬方面的技術。在該平臺上建立的虛擬形象是具有光線追蹤3D影象效果的互動式角色，可以看到、說話、談論各種主題，以及合理地理解表達意圖。致力於助力開發者使用Omniverse建立互動式角色，並使此角色具備視覺和語言能力，能夠就各類主題進行交談，並理解自然語言中的深層含義。這就為AI助手的建立開闢了道路，而且可以根據各個行業的需求輕鬆定製。

黃仁勳在主題演講中也展示了Project Maxine如何利用Omniverse Avatar平臺將計算機視覺、Riva語音AI以及虛擬形象動畫和圖形連線到一個實時對話的AI機器人——“Toy Jensen Omniverse Avatar”上。

在全球企業的推動下，元宇宙的時代正式來臨，而屬於英偉達的新時代，才剛剛開始。

百聞網

英偉達，火力全開

相關文章