iPhone,早已不僅僅是一個名詞,更多時候,它被作為形容詞來使用,用來形容被顛覆、新時代到來的時刻。
在一年一度的英偉達GTC大會上,英偉達CEO黃仁勛三次強調(diào)AI的“iPhone時刻”已經(jīng)到來,這也很好地呼應了這次大會的宣傳語——切勿錯過,AI的決定性時刻。
![]()
那么,這次老黃帶來了哪些前沿的技術和產(chǎn)品?他們又能否承擔起“AI的iPhone時刻”這個描述呢?
1
讓ChatGPT快10倍的H100 NVL
英偉達的主場,自然離不開GPU。
此次,英偉達推出了全新GPU推理平臺,包括了L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級芯片四種配置。這四種配置分別用于加速AI視頻、圖像生成加速、大型語言模型加速(LLM)和推薦系統(tǒng)。
![]()
其中L4 Tensor Core GPU是針對AI視頻設計的通用GPU,可提供比CPU高120倍的AI視頻性能,能效提高99%。同時,優(yōu)化了視頻解碼與轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話等功能,如背景替換、重新打光、眼神交流、轉(zhuǎn)錄和實時翻譯等。一臺8-GPU L4服務器將取代100多臺用于處理AI視頻的雙插槽CPU服務器。
據(jù)悉,Google Cloud會是首批集成L4的公司之一,谷歌會通過其Vertex AI平臺向客戶提供L4的服務。
L40 GPU則是用于圖像生成,針對2D、3D圖像生成進行了優(yōu)化,且能結合Omniverse直接生成3D甚至元宇宙內(nèi)容,其推理性能是英偉達云推理GPU T4的10倍。
Grace Hopper超級芯片則適用于推薦系統(tǒng)和大型語言模型的AI數(shù)據(jù)庫,是圖推薦模型、向量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡的理想選擇。它可以通過900GB/s的高速一致性芯片到芯片接口連接英偉達Grace CPU和Hopper GPU。
最后是采用了Transformer加速解決方案、可用于處理ChatGPT的H100 NVL。這款專門用于訓練大型語言模型的GPU是基于去年英偉達發(fā)布的H100的改進版本,它將兩張擁有94GB HBM3顯存的PCIe H100 GPU通過NVLink拼接在一起,支持188GB HBM3內(nèi)存。可處理擁有1750億參數(shù)的GPT-3大模型,同時支持商用PCIe服務器輕松擴展。
據(jù)黃仁勛介紹,目前適用于GPT-3處理的HGX A100,是云上唯一可以實際處理ChatGPT的GPU,但一臺搭載4對H100及雙GPU NVLink的標準服務器的速度,比HGX A100還要快10倍,這意味著H100 NVL可以把大型語言模型的處理成本降低一個數(shù)量級。
2
光刻計算庫,讓光刻機效率提升40倍
除了在產(chǎn)品層面帶來更高性能的GPU,英偉達還從制造層面帶來了新武器——光刻計算庫NVIDIA cuLitho,一套可以集成在NVIDIA Hopper架構中的光刻庫。

NVIDIA Hopper是去年GTC上英偉達帶來的全新GPU架構,并基于該架構推出了首個產(chǎn)品英偉達H100。該產(chǎn)品已經(jīng)在短短一年時間里成為各大科技訓練人工智能模型使用最多的GPU之一。
NVIDIA cuLitho可以通過計算技術大幅優(yōu)化芯片制造流程,利用GPU技術實現(xiàn)計算光刻,可以使傳統(tǒng)光刻技術提速40倍以上,為2nm及更先進芯片的生產(chǎn)提供助力,幫助GPU提高在芯片制造場景中的工作效率。
黃仁勛在演講中透露,英偉達目前已經(jīng)和AMSL、臺積電以及新思科技建立了合作關系,ASML計劃將搭載了NVIDIA cuLitho軟件庫的NVIDIA Hopper GPU集成在他們所生產(chǎn)的光刻機設備中去。
“使用NVIDIA cuLitho軟件庫加上NVIDIA Hopper GPU替代目前光刻機上使用的CPU,整體的效率可以提升40倍左右,減少目前每年消耗數(shù)百億CPU小時的大量計算工作負載。” 黃仁勛介紹道,“臺積電可以通過在500個DGX H100系統(tǒng)上使用cuLitho加速,將功率從35MW降至5MW,替代用于計算光刻的40000臺CPU服務器。”
3
云上英偉達
最后我們再到本次GTC的另一個重頭戲——云上看一看。
英偉達這次帶來了一項名為DGX Cloud的AI超級計算服務,搭配NVIDIA AI軟件,就能讓企業(yè)可以通過一個Web瀏覽器就能訪問AI超算,消除了獲取、部署和管理本地基礎設施的復雜性,以便企業(yè)為生成式AI和其他開創(chuàng)性應用,訓練先進的模型。
目前,該服務已與微軟Azure、谷歌OCP、Oracle OCI合作,用戶可以租用DGX Cloud的月租為36999美元起。
除了算力,通過云服務,英偉達還開發(fā)了一系列的應用模型,這些模型為特定領域的任務創(chuàng)建,通過專有的數(shù)據(jù)進行訓練,旨在把大模型創(chuàng)造的能力交給更多用戶。基于此,英偉達宣布NVIDIA AI Foundations模型,涵蓋NVIDIA NeMo語言模型、視覺模型Picasso和生物學模型BIONEMO。
![]()
NeMo是文本生成模型構建服務,能提供80億、430億、5300億參數(shù)的模型,并定期更新額外的訓練數(shù)據(jù),幫助企業(yè)為客服、企業(yè)搜索、聊天機器人、市場情報等生成式AI應用進行模型定制。
Picasso是視覺語言模型構建服務,具有先進的文生圖、文本轉(zhuǎn)視頻、文本轉(zhuǎn)3D功能,可為產(chǎn)品設計、數(shù)字孿生、角色創(chuàng)建等使用自然文本提示的應用快速創(chuàng)建和定制視覺內(nèi)容。目前英偉達已經(jīng)與Shutterstock合作,開發(fā)了Edify-3D生成式AI模型。
BioNeMo為生命科學服務,提供AI模型訓練和推理,加速藥物研發(fā)中最耗時和成本最高的階段,可加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學、化學、生物學和分子動力學研究。英偉達與三菱聯(lián)合發(fā)布了將用于加速藥物研發(fā)的日本第一臺生成式AI超級計算機Tokyo-1。通過在Tokyo-1上使用BioNeMo軟件,研究人員能運行高達數(shù)十億參數(shù)的先進AI模型,包括蛋白質(zhì)結構預測、小分子生成、姿態(tài)估計等。
4
AI的“iPhone時刻”
過去短短幾個月,從ChatGPT推出、GPT-4發(fā)布、百度文心一言跟進發(fā)布到微軟發(fā)布AI助手Microsoft 365 Copilot、Midjourney發(fā)布能“畫手指”的V5版本……AI技術刮起了一陣陣旋風,這些風不僅吹到了行業(yè)里,更影響到了每一個普通人。
AI的“iPhone時刻”,此言不虛。
在這個AI時刻,自動駕駛,甚至是整個汽車行業(yè)都顯得有些暗淡。
在黃仁勛一個多小時的演講中,汽車領域只在談及Omniverse時有所提及。據(jù)黃仁勛介紹,這個虛擬世界仿真引擎不是一種工具,而是一個USD網(wǎng)絡和共享數(shù)據(jù)庫,也是與各行各業(yè)使用的設計工具相連接的基礎結構。其一大用處是讓企業(yè)在實際建設工廠、生產(chǎn)產(chǎn)品前,通過數(shù)字化模擬“預覽”實際的成品。
奔馳、沃爾沃、豐田、Lotus等多家車企已經(jīng)在使用Omniverse構建自己工廠的數(shù)字孿生、為新車型構建、優(yōu)化和規(guī)劃組裝流水等。
這也讓筆者想起此前與國內(nèi)某3D引擎企業(yè)交流時,對方談到,相比Unity、Unreal,英偉達才是那個真正可怕的對手。
確實,別人引以為傲的單點能力,在英偉達這里,只是其以AI為核心構建的技術產(chǎn)品帝國中的一環(huán)。
以點擊面,難度何其大。
曾經(jīng)的PC時代,英偉達只是配角,移動時代也黯然離場。如今,AI大風刮來,英偉達也終于成為了人工智能這場新時代大戲的主角。
大風愈刮愈烈,能把英偉達送到多高,我們且一起看看。同時,我們也期待著,這場大戲中能出現(xiàn)更多動人的角色與劇情。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.