![]()
第一個六億人參與的全棧 AI 超級項目。
作者|Cynthia
編輯|鄭玄
電商江湖的風云變幻中,2025 年的雙十一故事有些不同尋常。
最直觀的變化就是隨著大促周期繼續(xù)拉長,規(guī)則卻刪繁就簡,用戶參與門檻被極大降低。
同步發(fā)生變革的是場景的重構(gòu):隨著淘寶閃購加入,外賣等即時消費場景與電商的深度融合,大促參與人數(shù)進一步提升,據(jù)易觀分析統(tǒng)計,10 月 15 日天貓雙 11 開啟當天,APP 日活躍用戶(DAU)便攀升至 6 億,創(chuàng)下歷史峰值。
相應的,過往集中于晚間 8 點至 10 點的購物高峰,也正式演變?yōu)槲玳g 12 點外賣即時消費、晚間 8 點傳統(tǒng)購物的雙峰格局,對系統(tǒng)的流量調(diào)度能力提出了全新要求。
而在體驗側(cè),今年也是阿里從芯片到云到 PaaS 到大模型,再到頂層 agent 等全棧 AI 能力接入的首個雙 11——世界范圍內(nèi),從未有過如此大規(guī)模生產(chǎn)場景 AI 落地。
場景變化,用戶量增加,疊加全棧 AI 接入——當雙 11 技術(shù)備戰(zhàn)進入第 17 個年頭,其意義早已超越一次促銷的技術(shù)保障。這既是阿里云一年練兵成功的交卷日,也是在回答一個關(guān)于產(chǎn)業(yè) AI 落地、云服務基礎設施當下天花板究竟在哪里的終極設問。
01
千萬核 CPU 的資源保衛(wèi)戰(zhàn)
今年 8 月左右,淘寶閃購、飛豬、餓了么并入電商事業(yè)群,業(yè)務聯(lián)動產(chǎn)生的化學反應遠超想象。
原本大家都以為,這次外賣大戰(zhàn),是 9 億活躍用戶的淘寶,作為超級入口降維打擊外賣,最終現(xiàn)實卻變成了是日訂單峰值突破 1.2 億單的外賣需求,直接在 8 月便拉動手淘日活用戶增長 20%。
如果只是業(yè)務合并,帶來了流量峰值與用戶活躍時間變化還只是小問題,但此時,距離雙 11 這個電商行業(yè)的春晚,只剩短短 2 個月。
是的,今年的雙 11,十月下旬就開始了。
兩大因素疊加,導致節(jié)點激增、互訪增多,云基礎設施 VPC 內(nèi)的轉(zhuǎn)發(fā)網(wǎng)關(guān)(XGW)承載量急劇上升,網(wǎng)元消耗量也呈指數(shù)級增長,原本看似充裕的 180 萬容量 VPC,可能瞬間就會被推到崩潰邊緣,撞墻風險一觸即發(fā)。
一場無聲的基礎設施保衛(wèi)戰(zhàn),在悄然間拉響警報,阿里云技術(shù)團隊迅速進入戰(zhàn)時狀態(tài)。
擺在他們面前的是兩條路:傳統(tǒng)的 VPC 拆分方案,就像把一座城市按行政區(qū)強行割裂,雖能緩解局部壓力,但跨域調(diào)用要怎么安排的合理,需要對集團業(yè)務需求做一次深度梳理,兩個月時間顯然不夠用。
剩下唯一一條路,就是打造一套沒人做過的 200 萬 VPC 級聯(lián)方案。兩者對比,前者是重新做市政規(guī)劃,后者則是把馬路升級為飛機跑道,難度同樣不低。
阿里云團隊骨子里就有一股不服輸?shù)膭艃海桨付ㄏ碌谝粫r間就迅速成立內(nèi)部組建攻堅小組,一頭扎進技術(shù)深海。
![]()
經(jīng)過無數(shù)次模擬測試與壓力驗證,團隊從軟件角度,提出了「云網(wǎng)關(guān)級聯(lián)方案」:在不影響現(xiàn)有業(yè)務的前提下,基于軟硬協(xié)同技術(shù),通過在網(wǎng)關(guān)層擴展多級流表、打通超大 VPC 的邏輯互聯(lián),使網(wǎng)絡容量實現(xiàn)彈性擴張,成功將單 VPC 容量拉升至 200 萬,提前化解了雙 11 的網(wǎng)絡瓶頸。
VPC 瓶頸的突破,如同打開了算力世界的潘多拉魔盒。基于第八代和第九代 ECS 實例的業(yè)內(nèi)首個千萬核 CPU 集群得以組網(wǎng)。而通過這個統(tǒng)一資源池 + 智能調(diào)度層,算力的精準分配與高效利用得以實現(xiàn),面對突如其來的流量洪峰,阿里云也成功支撐天貓雙 11 和閃購兩大業(yè)務雙峰的絲般順滑。
同時,隨著 CIPU(云基礎設施處理器)的不斷演進和規(guī)模化部署,今年雙 11 上線了千萬核 CPU 算力,規(guī)模的數(shù)量級的擴展標志著阿里云基于 CIPU 架構(gòu)的算力進入了全新的發(fā)展階段。
技術(shù)的突破,又進一步換來了雙 11 的絲滑購物和下單體驗。
前些年,用戶參與雙 11,尤其是超級熱門主播的搶購,偶有不順暢,例如加購物車卻半天無法付款,或者卡在產(chǎn)品頁面,沒辦法選擇心儀的尺寸。
但是今年雙 11,不僅打開 APP 打開、操作更順暢,推薦、營銷等核心場景性能提升 30%-50%,RT 延時降低更是超 30%,每一次添加、刪除操作都能即時反饋。
阿里云,又一次穩(wěn)住了雙11的順利落地。
02
第一個全面 AI 落地的雙11
如果說 2023 年是大模型元年,那么今年雙 11 就是這場 AI 革命的超級練兵場。
它既考驗云在海量數(shù)據(jù)高并發(fā)情況下對多元異構(gòu)算力的高效調(diào)度,也考驗 AI 在大規(guī)模生產(chǎn)場景的可靠程度與實際效用。
今年雙 11,AI 全面滲透各個環(huán)節(jié),被認為是首個 AI 全面落地的雙 11。從消費者端的「AI 萬能搜」「AI 幫我挑」,到商家端的智能客服、經(jīng)營分析,再到平臺端的搜索、推薦引擎體系,大模型在整個電商體系中占據(jù)了舉足輕重的地位。
![]()
在商家側(cè),AI 正在成為重要的生產(chǎn)工具,淘寶基于 Qwen3 家族多款模型打造和升級了生意管家、店小蜜等應用。以生意管家為例,其 AI 數(shù)據(jù)分析師為商家提供經(jīng)營數(shù)據(jù)分析,可覆蓋 90% 的中小商家核心分析場景,大幅提升分析和決策效率;此外,全新升級的店小蜜能精準連貫理解用戶意圖、調(diào)用平臺以及商家工單系統(tǒng)、自動化處理售后問題。
面向商品出海場景,包括通義 Qwen-MT 在內(nèi)的多個翻譯模型,支持了淘寶出海的商品翻譯需求。據(jù)介紹,通過采用混合專家架構(gòu)與服務調(diào)度優(yōu)化,Qwen-MT 單次調(diào)用延遲降低 40%,為全球用戶提供快速、精準、穩(wěn)定的翻譯服務。今年雙 11,該模型系統(tǒng)支持了億級商品的圖片、評價、商品詳情等翻譯任務,單日調(diào)用量超 14 億次。
這些改造不僅提升了用戶體驗,更讓商家經(jīng)營效率實現(xiàn)了前所未有的提升。
從結(jié)果來看,大模型在這屆天貓雙 11 中確實打了一場漂亮仗,但這背后的云基礎設施能力則是這場仗的另一個勝負手。
要在淘寶這個數(shù)億用戶的超級 APP 上,支撐如此大規(guī)模的 AI 應用,并非易事,在這場看不見硝煙的戰(zhàn)爭中,智算調(diào)度成為決勝關(guān)鍵。多級親和性與拓撲感知調(diào)度設計依次上線。
為了實現(xiàn)了卡間互聯(lián)路徑更短、帶寬更優(yōu),為雙 11 提供個性化、高效的 AI 算力服務。多級親和性調(diào)度算法,就像一位精細的交通規(guī)劃師,按照 NC / 交換機 / 機柜 / 樓宇 / AZ 的多層分級,為 AI 任務規(guī)劃出最短的算力通勤路線,讓 GPU 卡間的數(shù)據(jù)傳輸效率大大提升,帶寬不再是瓶頸。
拓撲感知技術(shù)則時刻掃描網(wǎng)絡狀態(tài),一旦發(fā)現(xiàn)擁塞鏈路,瞬間為數(shù)據(jù)重新導航,確保卡時在線率,杜絕任何一絲算力浪費。
靈駿智算也深度融合阿里云十余年來在計算、存儲與網(wǎng)絡虛擬化領(lǐng)域的技術(shù)積累,通過系統(tǒng)級的集成與優(yōu)化,提供穩(wěn)定、高性能的存儲能力與云網(wǎng)絡訪問能力。讓智算算力更高效地發(fā)掘數(shù)據(jù)的價值,為各類 AI 與業(yè)務場景帶來更強的支撐能力與業(yè)務價值。
最終,靈駿萬卡集群在雙 11 期間交出了一份堪稱完美的答卷:實現(xiàn)了業(yè)界領(lǐng)先的卡時在線率表現(xiàn),為首個 AI 大規(guī)模落地的雙 11 打好了最穩(wěn)的地基。
03
從全棧 AI 到能力溢出
雙 11 的全棧 AI 檢驗,對阿里而言只是小試牛刀,事實上阿里描繪的 AI 藍圖更為宏大。
今年,阿里巴巴集團 CEO、阿里云智能集團董事長兼 CEO 吳泳銘在多個場合中表態(tài),阿里巴巴正在積極推進三年 3800 億的 AI 基礎設施建設計劃,并將會持續(xù)追加更大的投入。
而在這個長期規(guī)劃中,阿里云的定位也很清晰——全棧人工智能服務商。
在模型層面,通義千問堅定開源開放路線,核心目的是打造『AI 時代的 Android』,并成為 AI 生態(tài)的基礎平臺。而從成果來看,通義千問在全球開源生態(tài)的實力也已無需論證,截至目前,通義千問共開源 300 多個模型,全球下載量突破 6 億次,衍生模型超 17 萬個,超越美國 Llama 大模型系列,位居全球第一。
在基礎設施層面,阿里云意在全力打造一臺全新的 AI 超級計算機,靈駿智算集群則是這臺超級計算機的關(guān)鍵一環(huán)。
當前,以靈駿為代表的智算產(chǎn)品早已滲透千行百業(yè) AI 場景,例如自動駕駛是阿里云 AI 落地進度最快的核心場景之一,市場份額占據(jù)絕對優(yōu)勢,絕大部分主流車企、金融企業(yè)、物流企業(yè)均為其客戶,
根據(jù) IDC 的最新報告,2024 年中國 AI 基礎設施(AI IaaS)市場份額,阿里云占比 23%,位列中國市場第一,超過第二名和第三名總和;在生成式 AI 基礎設施領(lǐng)域,阿里云取得模型訓練和模型推理市場的雙項冠軍。
這些投入短期來看不僅換來了絕對領(lǐng)先的市場地位,也換來了包括 200 萬 VPC 以及超千萬核 CPU 調(diào)度能力在內(nèi),這樣超出當前市場需求這樣的超級能力建設。盡管短期內(nèi)不會再有如此大體量的單一用戶,以及如此盛大的全民參與活動,但這也正是我們需要云服務這樣的基礎設施的意義之所在。
站在 AI「生物大爆發(fā)」的節(jié)點當下,我們無法想象未來,就像半導體發(fā)明初期無法預見如今人類的手機、電腦中需要納米級電路在指甲蓋大小塞下上億電路。
而作為基礎設施,云平臺需要前瞻性建設為業(yè)務創(chuàng)新預留技術(shù)緩沖帶今天的超級能力建設,是為后續(xù)的超級場景埋下的伏筆。
![]()
歷年的雙十一如此,科技產(chǎn)業(yè)的歷史如此,今年也不會例外。
*頭圖來源:AI 生成
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你如何看待阿里云的全棧 AI ?
![]()
警惕 AI 生物風險,OpenAI 豪投 1.07 億扶持初創(chuàng)公司
點贊關(guān)注極客公園視頻號,
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.