<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      vLLM團(tuán)隊(duì)創(chuàng)業(yè),種子輪10.5億!清華特獎(jiǎng)游凱超加盟

      0
      分享至

      開源模型都在用的重要推理框架vLLM,核心團(tuán)隊(duì)宣布創(chuàng)業(yè)了!

      創(chuàng)始團(tuán)隊(duì)官宣,成立新公司Inferact,種子輪即斬獲1.5億美元(約10.5億人民幣)融資,估值達(dá)8億美元(約56億人民幣)。

      這一規(guī)模創(chuàng)下了近期AI基礎(chǔ)設(shè)施領(lǐng)域的融資新高,也是有史以來規(guī)模最大的種子輪融資之一。


      投資方指出,隨著AI應(yīng)用落地,行業(yè)焦點(diǎn)正從訓(xùn)練轉(zhuǎn)向推理,如何低成本、高可靠地運(yùn)行現(xiàn)有模型已成為新的痛點(diǎn)。

      Inferact正是為了解決這一“推理瓶頸”而生,旨在構(gòu)建下一代商業(yè)引擎以應(yīng)對(duì)大規(guī)模部署挑戰(zhàn)。

      出任CEO的Simon Mo也表示,這反映了市場(chǎng)機(jī)遇的廣闊,因?yàn)樵谕评硪?guī)?;A段,即使是微小的效率提升也能帶來顯著的成本節(jié)省。

      vLLM商業(yè)化,Inferact正式成立

      本次1.5億美元的種子輪融資由Andreessen Horowitz(a16z)與Lightspeed Venture Partners共同領(lǐng)投。

      除了兩大領(lǐng)投方,跟投名單中還出現(xiàn)了紅杉資本(Sequoia Capital)、Altimeter Capital、Redpoint Ventures以及真格基金(ZhenFund)。

      如此豪華的投資規(guī)模集中在一家剛成立的初創(chuàng)公司身上,顯示出資本市場(chǎng)對(duì)于AI基礎(chǔ)設(shè)施賽道風(fēng)向的劇烈轉(zhuǎn)變。

      a16z合伙人Matt Bornstein指出,隨著大模型能力趨于成熟,開發(fā)者已不再單純等待模型架構(gòu)的更新,而是開始大規(guī)模部署現(xiàn)有模型

      這一轉(zhuǎn)變帶來了新的難題,即當(dāng)應(yīng)用程序需要頻繁與大模型進(jìn)行交互時(shí),算力成本和系統(tǒng)負(fù)載會(huì)呈指數(shù)級(jí)上升,推理環(huán)節(jié)因此成為制約行業(yè)發(fā)展的最大瓶頸。

      市場(chǎng)對(duì)于低成本、高可靠運(yùn)行現(xiàn)有模型的需求,目前已經(jīng)超過了對(duì)新模型研發(fā)的期待。

      作為Inferact的技術(shù)基石,vLLM在此之前已經(jīng)進(jìn)入了工業(yè)界的實(shí)際生產(chǎn)環(huán)境。

      亞馬遜目前已采用該技術(shù),而且是直接應(yīng)用于自身核心購物應(yīng)用的內(nèi)部系統(tǒng)。

      這種來自萬億級(jí)商業(yè)場(chǎng)景的實(shí)際部署,在真實(shí)的高并發(fā)流量下驗(yàn)證了技術(shù)的穩(wěn)定性,也讓資本市場(chǎng)看到了技術(shù)在大規(guī)模商業(yè)落地上的確定性。

      面對(duì)開源與商業(yè)化的平衡問題,Inferact目前的策略是維持雙線并行。

      公司明確表示將繼續(xù)支持vLLM作為一個(gè)獨(dú)立的開源項(xiàng)目發(fā)展,并將技術(shù)改進(jìn)回饋給社區(qū)。

      在商業(yè)層面,團(tuán)隊(duì)將目光投向了硬件適配的效率問題,計(jì)劃開發(fā)獨(dú)立的商業(yè)產(chǎn)品,幫助企業(yè)在不同類型的硬件上運(yùn)行AI模型。

      從vLLM到Inferact

      vLLM創(chuàng)立之初,團(tuán)隊(duì)自己都認(rèn)為是一個(gè)“副業(yè)”項(xiàng)目。

      但如今的Inferact時(shí)刻前夕,vLLM已成為大模型領(lǐng)域的事實(shí)標(biāo)準(zhǔn),幾乎所有主流開源大模型在發(fā)布與部署時(shí),都會(huì)將vLLM作為首選支持的推理框架。

      在a16z合伙人Matt Bornstein主持的深度對(duì)談中,Simon Mo和Woosuk Kwon回溯了vLLM如何從一個(gè)不起眼的“副業(yè)”一步步走到聚光燈下的全過程。


      最初,vLLM僅僅是兩人在伯克利求學(xué)期間的一個(gè)Side Project,驅(qū)動(dòng)代碼更新的動(dòng)力源于一種極其樸素的技術(shù)信仰——

      他們堅(jiān)信,在這個(gè)大模型重塑世界的時(shí)代,開源代碼必須是全球AI基礎(chǔ)設(shè)施的地基。

      這種純粹的初衷,讓vLLM在沒有商業(yè)推廣的情況下,迅速成為了開發(fā)者社區(qū)的寵兒。

      然而,隨著項(xiàng)目從實(shí)驗(yàn)室走向工業(yè)界,團(tuán)隊(duì)的角色發(fā)生了質(zhì)的轉(zhuǎn)變。

      作為核心維護(hù)者,他們不僅是在寫代碼,更是在與全球最頂尖的開發(fā)者協(xié)作,這種高強(qiáng)度的社區(qū)互動(dòng)成為了他們技術(shù)能力的“煉金石”。

      他們積累了獨(dú)有的技術(shù)洞察,并確立了在行業(yè)內(nèi)的權(quán)威身份,構(gòu)成了后來他們能夠駕馭一家獨(dú)角獸企業(yè)的底層能力。

      但在這一過程中,現(xiàn)實(shí)的引力也越來越重。他們發(fā)現(xiàn),當(dāng)推理任務(wù)從簡(jiǎn)單的Demo演示變成數(shù)千張GPU集群的生產(chǎn)級(jí)部署時(shí),挑戰(zhàn)的量級(jí)呈指數(shù)級(jí)上升。

      “推理正在變得越來越難”,這是團(tuán)隊(duì)在第一線摸爬滾打后得出的痛切結(jié)論。

      現(xiàn)有的開源方案在面對(duì)深度底層優(yōu)化、大規(guī)模集群的線性擴(kuò)展以及復(fù)雜的GPU部署流程時(shí),往往顯得力不從心。

      企業(yè)需要的不再是零散的代碼庫,而是能夠穩(wěn)定承載萬億次調(diào)用的工業(yè)級(jí)引擎。

      為了攻克那些開源社區(qū)難以消化的“硬骨頭”,必須引入嚴(yán)密的商業(yè)組織形式構(gòu)建下一代引擎。

      與此同時(shí),為了在商業(yè)化的同時(shí)保證開源項(xiàng)目繼續(xù)運(yùn)行,Inferact設(shè)計(jì)了一套獨(dú)特的反哺機(jī)制,利用商業(yè)資源繼續(xù)滋養(yǎng)vLLM,確保這個(gè)曾經(jīng)的副業(yè)項(xiàng)目能繼續(xù)作為行業(yè)的基石繁榮生長(zhǎng)。

      伯克利博士攜手清華特獎(jiǎng)

      Inferact的CEO由Simon Mo擔(dān)任。

      他曾就讀于加州大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系(EECS),主攻機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)方向。

      在此之前,他是Anyscale的早期工程師,積累了將分布式系統(tǒng)科研成果轉(zhuǎn)化為工業(yè)級(jí)產(chǎn)品的工程實(shí)踐經(jīng)驗(yàn)。

      作為vLLM項(xiàng)目的原始維護(hù)者之一,他主要負(fù)責(zé)項(xiàng)目的工程化構(gòu)建與社區(qū)運(yùn)營(yíng)。


      另一位聯(lián)合創(chuàng)始人是vLLM項(xiàng)目的發(fā)起人Woosuk Kwon。

      他擁有加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)博士學(xué)位,師從Ion Stoica教授,研究重點(diǎn)聚焦于大語言模型的高效服務(wù)系統(tǒng)。

      他在博士期間提出了Paged Attention算法,通過引入操作系統(tǒng)中分頁內(nèi)存管理的思想,解決了KV Cache顯存碎片化問題,這一算法創(chuàng)新為vLLM在吞吐量性能上的提升提供了核心技術(shù)支撐。


      團(tuán)隊(duì)的核心技術(shù)力量還包括清華特獎(jiǎng)得主游凱超(Kaichao You)。

      他曾在加州大學(xué)伯克利分校EECS系擔(dān)任訪問學(xué)者,主攻分布式深度學(xué)習(xí)系統(tǒng)。

      作為vLLM的關(guān)鍵維護(hù)者,他主導(dǎo)了基于張量并行的分布式推理功能實(shí)現(xiàn),并優(yōu)化了與PyTorch原生生態(tài)的集成接口,使得vLLM能夠支持多卡大規(guī)模模型推理并降低了開發(fā)者的遷移成本。


      此外,核心團(tuán)隊(duì)與顧問團(tuán)還集結(jié)了學(xué)術(shù)界與工業(yè)界的資深力量。

      前Roblox高級(jí)機(jī)器學(xué)習(xí)工程師Roger Wang作為核心成員加入,為團(tuán)隊(duì)帶來了生產(chǎn)級(jí)基礎(chǔ)設(shè)施的實(shí)戰(zhàn)經(jīng)驗(yàn);

      加州大學(xué)伯克利分校教授Joseph Gonzalez以及Databricks聯(lián)合創(chuàng)始人Ion Stoica教授則作為顧問深度參與其中,為公司提供技術(shù)愿景與商業(yè)路徑的頂層指導(dǎo)。

      參考鏈接:
      [1]https://www.bloomberg.com/news/articles/2026-01-22/andreessen-backed-inferact-raises-150-million-in-seed-round
      [2]https://x.com/a16z/status/2014394081452163231

      文章來源:量子位。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      你火鍋里的肥牛,可能根本就沒見過牛

      你火鍋里的肥牛,可能根本就沒見過牛

      富貴說
      2026-02-23 17:59:39
      魅族手機(jī)要結(jié)束了,但也早就結(jié)束了。

      魅族手機(jī)要結(jié)束了,但也早就結(jié)束了。

      差評(píng)XPIN
      2026-02-26 00:05:12
      跌成白菜價(jià),也沒人買?14億人輸給3億美國(guó)人,電視到底怎么了?

      跌成白菜價(jià),也沒人買?14億人輸給3億美國(guó)人,電視到底怎么了?

      百科密碼
      2026-02-23 16:49:28
      吃自助餐遇到的人有多離譜?網(wǎng)友:浪費(fèi)糧食的下輩子吃不上熱菜

      吃自助餐遇到的人有多離譜?網(wǎng)友:浪費(fèi)糧食的下輩子吃不上熱菜

      解讀熱點(diǎn)事件
      2026-02-25 15:07:10
      世界第一女巨人來自中國(guó)安徽,穿78碼的鞋子,一頓飯吃六碗炒面

      世界第一女巨人來自中國(guó)安徽,穿78碼的鞋子,一頓飯吃六碗炒面

      不寫散文詩
      2026-02-25 21:02:18
      8人上雙+37次助攻,殘陣勇士狂勝21分!控制變量法讓追夢(mèng)徹底露餡

      8人上雙+37次助攻,殘陣勇士狂勝21分!控制變量法讓追夢(mèng)徹底露餡

      鍋?zhàn)踊@球
      2026-02-26 11:37:44
      別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

      別再尬演白月光了!臉腫皮松,嘟嘴裝嫩,是迷倒男人該有的皮囊?

      不似少年游
      2026-02-24 19:46:25
      孩子第一天就轟動(dòng)學(xué)校是啥感覺?網(wǎng)友:這孩子以后能成大事

      孩子第一天就轟動(dòng)學(xué)校是啥感覺?網(wǎng)友:這孩子以后能成大事

      解讀熱點(diǎn)事件
      2026-02-25 15:32:21
      國(guó)家能源集團(tuán)杜善周,被查!

      國(guó)家能源集團(tuán)杜善周,被查!

      新浪財(cái)經(jīng)
      2026-02-25 23:02:13
      中領(lǐng)館:18-65歲在俄長(zhǎng)期居留男性,須同意在俄軍事單位等至少服役1年

      中領(lǐng)館:18-65歲在俄長(zhǎng)期居留男性,須同意在俄軍事單位等至少服役1年

      揚(yáng)子晚報(bào)
      2026-02-26 07:44:37
      親密度總停在99%,想談個(gè)戀愛怎么就那么難?上海多名單身男子有苦難言:太丟臉了

      親密度總停在99%,想談個(gè)戀愛怎么就那么難?上海多名單身男子有苦難言:太丟臉了

      環(huán)球網(wǎng)資訊
      2026-02-26 07:26:27
      斯諾克賽程:決出8強(qiáng),趙心童領(lǐng)銜,中國(guó)5人出戰(zhàn),3場(chǎng)冠軍交鋒!

      斯諾克賽程:決出8強(qiáng),趙心童領(lǐng)銜,中國(guó)5人出戰(zhàn),3場(chǎng)冠軍交鋒!

      劉姚堯的文字城堡
      2026-02-26 09:01:35
      震驚!網(wǎng)傳一親媽把剛上大學(xué)的兒子弄成“老賴”,以杜絕孩子貸款

      震驚!網(wǎng)傳一親媽把剛上大學(xué)的兒子弄成“老賴”,以杜絕孩子貸款

      火山詩話
      2026-02-25 21:50:47
      92年,張震將軍請(qǐng)邱會(huì)作在國(guó)防大學(xué)餐廳吃飯,秘書勸阻:不吃為好

      92年,張震將軍請(qǐng)邱會(huì)作在國(guó)防大學(xué)餐廳吃飯,秘書勸阻:不吃為好

      雍親王府
      2026-02-26 09:55:05
      【新春走基層】“搭積木”闖三大難關(guān) 4650米“生命禁區(qū)”綻放“太陽花”

      【新春走基層】“搭積木”闖三大難關(guān) 4650米“生命禁區(qū)”綻放“太陽花”

      閃電新聞
      2026-02-25 08:48:33
      巴厘島遭遇暴雨,近5米長(zhǎng)蟒蛇從居民區(qū)游過,當(dāng)?shù)厝A僑:白天晚上均在下雨,現(xiàn)在天氣稍微轉(zhuǎn)好

      巴厘島遭遇暴雨,近5米長(zhǎng)蟒蛇從居民區(qū)游過,當(dāng)?shù)厝A僑:白天晚上均在下雨,現(xiàn)在天氣稍微轉(zhuǎn)好

      大象新聞
      2026-02-25 23:41:02
      碧桂園7000億項(xiàng)目爛尾

      碧桂園7000億項(xiàng)目爛尾

      地產(chǎn)微資訊
      2026-02-23 21:46:01
      開油車的笑了,開電車的慌了?2026油電新政實(shí)錘,稅費(fèi)規(guī)則全變了

      開油車的笑了,開電車的慌了?2026油電新政實(shí)錘,稅費(fèi)規(guī)則全變了

      蜉蝣說
      2026-02-25 09:20:25
      別再吹天生混血臉了,谷愛凌那一頭標(biāo)志性的金發(fā)藏不住天然的黑發(fā)

      別再吹天生混血臉了,谷愛凌那一頭標(biāo)志性的金發(fā)藏不住天然的黑發(fā)

      西樓知趣雜談
      2026-02-24 16:14:33
      小米狂出六款新車!雷軍徹底失控了

      小米狂出六款新車!雷軍徹底失控了

      李東陽朋友圈
      2026-02-25 13:03:08
      2026-02-26 14:04:49
      算法與數(shù)學(xué)之美 incentive-icons
      算法與數(shù)學(xué)之美
      分享知識(shí),交流思想
      5374文章數(shù) 64616關(guān)注度
      往期回顧 全部

      財(cái)經(jīng)要聞

      短劇市場(chǎng)風(fēng)云突變!有人投百萬賠得精光

      頭條要聞

      賴清德改口稱“大陸”被指釋出善意 國(guó)民黨發(fā)言人表態(tài)

      頭條要聞

      賴清德改口稱“大陸”被指釋出善意 國(guó)民黨發(fā)言人表態(tài)

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂要聞

      尼格買提撒貝寧滑雪被偶遇 17年老友情

      科技要聞

      單季營(yíng)收681億凈利429億!英偉達(dá)再次炸裂

      汽車要聞

      第五代宏光MINIEV煥新 四門玩趣代步車來襲

      態(tài)度原創(chuàng)

      教育
      房產(chǎn)
      時(shí)尚
      家居
      本地

      教育要聞

      高考倒計(jì)時(shí)100天,英語50分左右,還有逆襲機(jī)會(huì)嗎?

      房產(chǎn)要聞

      2.2萬/m2起!三亞主城性價(jià)比標(biāo)桿 海墾·桃花源實(shí)景現(xiàn)房春節(jié)被瘋搶

      倫敦時(shí)裝周|2026秋冬流行趨勢(shì)早知道

      家居要聞

      歸隱于都市 慢享自由

      本地新聞

      津南好·四時(shí)總相宜

      無障礙瀏覽 進(jìn)入關(guān)懷版