25年9月22日,聯發科新旗艦天璣9500正式發布:再刷紀錄的300億晶體管、首發最新的C1系列CPU核心和G1-Ultra架構GPU、光線追蹤和AI性能再次翻倍、首發大量GPU和AI的新特性。
天璣9500提前省流:發哥的CPU單核和GPU性能,依然維持30%以上的提升;AI和光追性能,還在倍增級提升。
CPU單核性能暴漲32%,峰值性能下的單核功耗降低55%;
CPU多核性能提升17%,峰值性能下的多核功耗降低37%;
GPU性能提升33%,同性能下功耗下降42%;
AI性能提升111%,同性能下功耗下降56%;
光追性能提升119%,已經可以支持120fps的高幀率光追游戲。
PS:發哥旗艦的發布時間越來越早了——天璣9300是23年11月7日發布,天璣9400是24年10月9日,天璣9500是25年9月22日。
PSS:自2020年三季度以來,發哥已經連續19個季度的市場第一,發哥在旗艦中的占比已經超過40%。
【簡要規格】
最新的臺積電第三代3nm工藝(N3E → N3P。和蘋果A19/A19 Pro同代);
再刷紀錄的300億晶體管↑(天璣9400是291億,蘋果M4是280億,估計得明年的天璣9600才有可能打破這紀錄了);
首發最新的Arm架構“全家桶”,Arm V9.3,全核心支持SME2:
1顆4.21GHz的C1-Ultra超大核,2MB的L2緩存(L1緩存提升1倍)
+3顆3.5GHz的C1-Premium性能核,1MB的L2緩存
+4顆2.7GHz的C1-Pro能效核,512KB的L2緩存
16MB的L3緩存(比前代大33%)+10MB的SLC系統緩存。
首發G1-Ultra GPU,搭載全新的動態緩存Dynamic Cache架構(能顯著降低功耗并提升性能);
支持10667Mbps的LPDDR5X內存(理論帶寬85GB/s);
首發支持4通道UFS 4.1閃存(連續讀取性能提升100%,大模型載入速度提升40%);
NPU 990改成超性能+超能效雙NPU架構(后者有NPU里,首個CIM存算一體架構);
Imagiq 1190大幅提升追焦/對焦和防抖計算性能,首發4K60幀電影人像渲染引擎+天璣RAW域處理引擎。
全套首發的新架構:
暴降的峰值功耗
最近兩代旗艦SoC↑
CPU這邊的關鍵詞,就是全套首發架構+SME2矩陣運算指令集。
天璣9500沿用之前的1顆超大核+3顆性能核+4顆能效核的核心比例,3個CPU架構全部都是首發,且全部支持最新的SME2矩陣運算指令集。
Arm表示SME2矩陣運算指令集能在AI上帶來5倍的性能提升,3倍的能效提升,10bit AV1視頻解碼性能可以提升22%,同時功耗降低12%。而發哥的說法是↑,在視覺、語音、翻譯等AI任務,可以有20%性能提升,物體偵測運算性能提升57%,運行編解碼模型功耗下降50%。
【C1-Ultra】↑是安卓陣營最強的超大核,它是X925的迭代,單線程提升25%,IPC比驍龍8E強20%,和X925峰值性能相同時,功耗降低28%。
【C1-Premium】用于代替原來的X4,官方宣稱游戲性能提升16%,而且芯片面積比Ultra小35%。
【C1-Pro】是A725的迭代,從能效曲線上看,就知道它可能是今年能效進步最大的核心。
而聯發科這邊落地之后,因為有架構優化,數據比Arm官方還猛:單核性能暴漲32%,多核性能提升17%。
其實比起峰值性能,這一代最驚艷的是能效提升:天璣9500在和天璣9400相同性能時,功耗降低37%。
也就說,在前代多核9000分附近的成績,天璣9500有接近4成的功耗下降。日用使用中,需要8核全開的應用開啟或短時間重載中,可以更長時間地維持高性能輸出。
發哥也公布了其他關于低功耗區間的數據:例如在王者+通話場景的功耗可降低30%、吃雞+通話功耗下降16%、短視頻功耗降低13%、4K 120fps錄像的功耗也降低了22%等等等。
GPU這邊的關鍵詞,是和蘋果殊途同歸的動態緩存Dynamic Cache+翻倍的光追單元。
發哥表示3年前就開始研究GPU的Dynamic Cache動態緩存。后者可以根據實際寄存器的壓力,動態調整線程數量,減少寄存器的浪費,給整個GPU的運行效率帶來巨幅提升(以前的GPU很難一直保持滿載,經常“被迫摸魚”。但有Dynamic Cache之后,GPU就能長時間維持輸出)。
發哥表示,天璣9500的G1-Ultra GPU可以直接讀取10MB的SLC系統緩存。單單這個改進,能在絕區零中,就能省下600MB/s的內存帶寬,立竿見影地降低功耗和機身溫度(降低60mA的電流,溫度降1度)。
而傳統的光柵性能方面,在3DMark Steel Nomad Light測試中,發哥表示天璣9500的GPU性能提升33%,同性能下,功耗降低42%。
因為光線追蹤單元翻倍,天璣9500直接在3DMark Solar Bay Extreme光追測試能跑出2773分(前代是1173),光追性能提升119%。而且天璣9500將首發暗區突圍光追120fps模式(天璣9400是90fps)。
反映到實際游戲:極致畫質120fps的王者,功耗下降19%;60fps全高畫質的原神,功耗下降9%。
性能實測:
大躍進的單核性能+外星科技GPU
聯發科的工程機↑ 已經是老朋友了,從天璣9000開始就是這套模具。它和量產機的散熱條件,有億點不同。它只有基礎的均熱板,電池容量很小。
今年的配置是天璣9500,搭配16GB 10667Mbps的LPDDR5X內存+1TB UFS 4.0閃存,以及6.78英寸2800x1260的1.5K AMOLED屏幕。
實測,天璣9500的GeekBench 6.4單核3610分,多核10837分。
天璣9500工程機的單核性能提升27.5%,多核性能提升19.5%。
天璣9500的C1-Ultra超大核,CPU單核性能堪稱大躍進:在頻率提升16.3%的情況下,單核性能提升27.5%。同頻分數和蘋果A19 Pro/A18 Pro非常接近,已經超過了A19/A18。
PS:GeekBench 6的單核測試中,很多測試都是短于1秒的。但A18/天璣9400/驍龍8至尊版之后的現代CPU,單核功耗都是6W起步。A19系列量產機在常溫下,貌似出現了機身散熱壓不住單核功耗的情況。
PSS:GeekBench 6和邏輯和GeekBench 5不一樣,它的多核測試其實是核越多,越不利,利好蘋果這種少核心策略。
PSSS:GeekBench在6.3之后引入對SVE/SME支持,后兩者在AI、圖形等密集計算場景,會有明顯的加速作用。
天璣9500的GFX與3DMark測試成績↑
GPU測試這邊,這次改成了以3DMark為主,GFXBench為輔:
GFXBench用的是老一點的API,會更貼近傳統手游的渲染管線。
而3DMark在24年6月加入的Steel Nomad Light測試,特性更新,會更貼近現代3A游戲的渲染管線,適合用來看新的旗艦GPU(它對移動設備的要求很高,強制要求8GB內存,導致A16跑不了這個該測試)。
光追這邊,3DMark在25年6月更新的3DMark Solar Bay Extreme測試,加入了大量光追的反射、透明、軟陰影、漫反射,光追占比超過50%,宣稱壓力是Solar Bay的5倍(后者的光追占比只有10%到15%),是現在最適合測光追性能的單一測試。
天璣9500工程機在GFXBench Aztec 1440P Vulkan離屏測試是154幀。
在3DMark Steel Nomad Light場景,是3380分(作為對比,極客灣“強能冷條件”下的A19 Pro和A19,分別是3004和2598)。
這兩項偏向傳統光柵性能的測試中,天璣9500實際提升分別是26%和36%。
實在是太可怕了,天璣9400本身就是上一代的GPU冠軍,結果這一代還有30%級別的提升,是“學霸比你還努力”的恐懼感……
而更可怕的是Solar Bay Extreme光追測試,天璣9500工程機跑出了2601分的成績,比前代高了221%(這么大的代際差異,在歷史上也是非常少見的)。
作為對比,極客灣“強能冷條件”下的A19 Pro和A19,分別是2407和2115分(比A18系列提升50%左右)。光追單元堆這么猛,波真是下血本了。
游戲實測:基本征服崩鐵!
室溫22度,屏幕亮度200尼特。
先看“輕輕松松”的王者榮耀,極致畫質120fps模式,主要看功耗。
天璣9500工程機,平均119.9幀,1% Low幀 118.14fps,重點是功耗竟然只有2.73W。功耗之低,甚至都不能叫熱身。
然后我們直接去972P+畫質拉爆的《崩壞:星穹鐵道》黃金的時刻↑↓。
天璣9500工程機平均58幀,平均功耗6.5W。可以說是基本征服崩鐵,幸福來得太突然了。
作為對比,驍龍8至尊領先版的榮耀GT Pro(975P),在同樣路線上,即便打開“幻影穩幀”(把不足60fps的畫面插幀到60fps),平均幀率也只有55.5幀,平均功耗7.3W。
游戲方面,發哥除了提升絕對性能,還有一批游戲相關的優化:
提高了觸控和高刷的一致性,宣稱延遲可以壓縮到42ms±6ms(iPhone 16 Pro是109ms±20ms);
內存壓縮(提升APP啟動速度);
天璣調度2.0(120fps吃雞功耗下降14%);
動畫的預測運行(將由Find X9首發落地)。
另外,天璣9500還引入了很多真·PC級的特性:
切換成原生PC光追管線(提升效率,光影明顯更強);
首發支持虛幻引擎5.5 Nanite(支持的三角形數量提升超過10倍。PS:現在原神是30萬到80萬個三角形,現在可以千萬級的三角形。安卓終于有希望在畫質上擺脫“低PC一等”的局面);
首發支持虛幻引擎5.6 MegaLights(支持的多點光源數量,從幾十個,提升到200個以上。PS:其實以前的機器也能跑百級多光源,但會巨卡)。
性能繼續倍增的AI與ISP
AI這邊的關鍵詞,是新增超能效核+存算一體+大量首發的AI特性。
天璣9500的NPU 990,改成了超性能+超能效雙NPU架構。宣稱AI性能提升111%,同性能下功耗下降56%(*在千問2.5-3B-CL=4096測試中)。
之前傳言天璣9500的NPU算力達到100TOPS,在看到天璣9500工程機的蘇黎世測試(ETHZ AI Benchmark v6.0.3)超過1.5萬分之后,我信了……
天璣9400工程機在蘇黎世測試是6700分,天璣9300工程機是3410分。前代是翻倍,天璣9500這代翻倍都不止(提升了1.24倍)。
天璣9500毫無懸念地登頂蘇黎世AI Benchmark榜單↑。
NPU 990的超能效核,首發CIM存算一體(Compute In Memory),自帶Cache,可以省去頻繁讀取內存的功耗,單這部分就能省24%功耗,最多可以降低42%。
這顆超能效核,宣稱已經可以像低功耗前攝那樣,做到All Ways On的全天候常駐——讓AI模型可以常駐,且機身不發燙。
端側的AI翻譯↑(沒眼花,這就是原速)
端側的AI摘要↑(每秒100多Token)
天璣9500工程機的AI性能強得很夸張,在跑本地AI翻譯和AI摘要的時候,竟然可以1秒100多Token,一走神,它都跑完了。
這暴漲的AI性能+暴降的NPU功耗,可以明顯提升全時語音轉文字、翻譯、相機對焦/追焦/錄像的功耗表現,也是業界夢寐以求的主動式AI的前置條件。
就算不想那么遠,發哥表示,天璣9500的追焦性能從以前的5、6fps提升6倍,能做到和視頻幀率同步的30fps。中譯中就是,如果拍攝30fps視頻,等于每一幀都能完成追焦,運動攝影愛好者都聽哭了。
首個手機端的4K文生圖↑
另外, NPU 990還有很多首發特性:
生成式引擎2.0,有Transformer固化電路(響應速度快2倍以上)+內存壓縮升級(4B模型的內存占用從2GB降到1.6GB);
首發端側BitNet,1.58bit推理框架。速度提升2倍,內存占用減少60%;
Diffusion Transformer性能翻倍,手機端首發4K文生圖;
文生文模型性能翻倍,支持的錄音長文本從32K提升到128K;
首發LLM大語言模型,端側LoRA訓練;
端到端的模型訓練優化(vivo X300會做首個個人化的AI美顏模型,本地訓練的內存占用降低80%,占用低于2GB。PS:訓練模型的內存需求,是推理的2倍以上)。
(1) vivo X300系列除了AI定制美顏還會有錄音轉錄提升、異構加速;
(2) OPPO Find X9系列則主要做流暢多任務、讀屏AI意圖等。
發哥同時還表示,已經用AI做信號做頻譜補償、WiFi自動頻寬和速率選擇(宣稱傳輸速率提升20%)、AI定位(搜星速度提升20%)、AI選網/搶網(在擁塞場景的選基站,宣稱流暢度提升50%)等。
ISP方面,關鍵詞也是降功耗。這是天璣9500將首發4K 60fps的電影人像視頻的核心原因(強如蘋果,iPhone今年依然是4K 30fps的電影模式)。
發哥表示,同樣是4K 60fps的SoC功耗,如果天璣9200是100%的話,天璣9300是89%,天璣9400是77%,天璣9500是69%(每年11%到13%的功耗下降,幾年下來降低了31%)。
Imagiq 1190 ISP內化了vivo V3+影像芯片,核心包括:
內置4K 60幀電影級人像渲染引擎(景深光斑+膚質打光+調色風格);
內置RAW域處理引擎(降低存取頻寬),用好2億像素傳感器(之后vivo X300的主攝、X300 Pro都是2億像素傳感器);
追焦抓拍提升。支持30fps的追焦,追焦引擎提升5倍+對焦引擎提升3倍:33ms追焦(友商150ms)+3ms對焦(友商100ms);
支持4K 120fps杜比視界的雙軌防抖(以前做不了的核心原因,還是因為功耗太高了)。
這部分的實測表現,得等vivo X300系列和OPPO Find X9系列的量產機來揭曉了。
總結:功耗是最后的懸念
我們本以為,在“如超新星爆發”的天璣9300之后就不會再有30%級別的提升,結果天璣9400和天璣9500都在猛漲,讓我們像極了踏空的股民。
天璣9500這一代,CPU單核實測有27.5%的提升,CPU多核有接近20%的提升;本就是最強的GPU竟然還有26%和36%的提升;AI性能漲了124%,光追測試更是暴漲221%。
這一代的懸念,還是實際功耗。峰值性能是用來爭門面的,暴降的功耗才是用來過日子的。
比起峰值性能,同性能下的功耗降幅,才是最值得關注的數值(就像天璣9400,它在日常功耗區間的性能,就已經超過火力全力的前代,過程中節省的電量和降低的發熱,才是最影響日常使用的)。
而發哥給的數據是:同性能下,CPU功耗降低37%,GPU功耗降低42%,AI功耗降低56%。這才是我們看好天璣9500的核心原因。
和同代的蘋果A19 Pro對比,天璣9500的CPU多核性能小勝,GPU依然和蘋果拉開了一代的差距。
雖然高通的成績還沒出來,但估計發哥又又又會是GPU衛冕冠軍。下一次破紀錄,估計得等明年的天璣9600了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

