文:城主
前言
這是Meta官方對(duì)Llama發(fā)布半年的一個(gè)自我總結(jié)。
有一句評(píng)論深感贊同,Llama開源大模型有望成為L(zhǎng)LM時(shí)代的安卓。
在OpenAI讓人失望的成了CloseAI之后,Llama的發(fā)布給全世界做AI+項(xiàng)目 研發(fā)的人們一記強(qiáng)心針。道理很簡(jiǎn)單, 有多少企業(yè)敢把所有身家和未來賭在一個(gè)只有API調(diào)用的核心模式上呢,就算這種閉源API再?gòu)?qiáng)大,也必須至少有一個(gè)后手吧。更不用說費(fèi)用和數(shù)據(jù)安全的問題。
即使看LLM水平本身,Llama2以及后續(xù)社區(qū)優(yōu)化版本已經(jīng)直追GPT-4,很有點(diǎn)SD社區(qū)大模型和Midjourney模型的味道:即使沒有100%趕上,但也非常接近了;更重要的是,社區(qū)各種Llama魔改版,就類似各種SD模型一樣,在不同的垂直領(lǐng)域特別好用。
如果我們看手機(jī)系統(tǒng),即使蘋果手機(jī)系統(tǒng)這么強(qiáng)勢(shì),開放的安卓生態(tài)也早就超過了半壁江山。或許這就是未來的LLM版圖:閉源和開源模型平分天下, 甚至閉3開7。
Meta昨天的Connect大會(huì)可圈可點(diǎn),有AI有XR有智能App。城主看了之后,頗有一種感覺:Meta已熬過了它最艱難的時(shí)刻,未來有AI+元宇宙雙概念加持的Meta,或許要開始走出一條高開的曲線了呢。
前不久,Meta AI掌門人,AI三巨頭的Yann LeCun在參議院捍衛(wèi)Llama的開源精神(),實(shí)是有些讓人敬佩。無論如何,僅就Llama對(duì)世界范圍AI發(fā)展的貢獻(xiàn),城主認(rèn)為就值得向Meta脫帽致敬,相信所有做AI+的團(tuán)隊(duì)都有同樣的敬意。
Llama社區(qū)加油!
(在剛結(jié)束的Meta Connect 2023上,Meta GenAI VP 談Llama大模型的視頻)
=以下是原文完整中文版=
英文原文鏈接:
https://ai.meta.com/blog/llama-2-updates-connect-2023/
![]()
自我們發(fā)布Llama1以來大約已經(jīng)過去七個(gè)月,而Llama2的發(fā)布僅僅過去了幾個(gè)月,緊接著是CodeLlama的發(fā)布。簡(jiǎn)而言之,社區(qū)的反應(yīng)令人震驚。我們看到了大量的動(dòng)力和創(chuàng)新,通過Hugging Face下載的基于Llama的模型超過3000萬次,僅在過去的30天里就有超過1000萬次。就像PyTorch一樣,Llama已經(jīng)發(fā)展成為全世界建設(shè)的平臺(tái),我們對(duì)此感到非常興奮。
迄今為止的影響
Llama社區(qū)的增長(zhǎng)有幾個(gè)顯著的發(fā)展:
?云使用:像AWS、Google Cloud和Microsoft Azure這樣的主要平臺(tái)已經(jīng)在他們的平臺(tái)上接納了Llama模型,而Llama2在云中的存在正在擴(kuò)大。今天我們宣布AWS成為我們的第一個(gè)為L(zhǎng)lama2提供管理API的合作伙伴。現(xiàn)在,所有規(guī)模的組織都可以在Amazon Bedrock上訪問Llama2模型,而無需管理底層的基礎(chǔ)設(shè)施。這是一個(gè)可訪問性的重大改變。此外,到目前為止,Google Cloud和AWS的終端使用情況令人難以置信,基于Llama2模型的企業(yè)項(xiàng)目啟動(dòng)超過3500個(gè)。
?創(chuàng)新者:創(chuàng)新者和初創(chuàng)公司正在將Llama作為他們生成AI產(chǎn)品創(chuàng)新的基礎(chǔ)。成千上萬的初創(chuàng)公司正在使用或評(píng)估Llama2,包括Anyscale、Replicate、Snowflake、LangSmith、Scale AI等等。像DoorDash這樣的創(chuàng)新者正在使用它進(jìn)行大規(guī)模的實(shí)驗(yàn),以便在發(fā)布新的LLM驅(qū)動(dòng)的功能之前。
?眾包優(yōu)化:開源社區(qū)真正接納了我們的模型。到目前為止,社區(qū)已經(jīng)對(duì)Hugging Face進(jìn)行了微調(diào),并發(fā)布了超過7000個(gè)衍生產(chǎn)品。平均來說,在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中,這些產(chǎn)品在常見基準(zhǔn)測(cè)試中的性能提高了近10%,在像TruthQA這樣的基準(zhǔn)數(shù)據(jù)集中的改進(jìn)達(dá)到了驚人的46%。
?開發(fā)者社區(qū):現(xiàn)在在GitHub上有超過7000個(gè)基于Llama或提及Llama的項(xiàng)目。新的工具、部署庫(kù)、模型評(píng)估方法,甚至“微型”版本的Llama正在被開發(fā),以將Llama帶到邊緣設(shè)備和移動(dòng)平臺(tái)。此外,社區(qū)已經(jīng)擴(kuò)展了Llama以支持更大的上下文窗口,增加了對(duì)額外語言的支持,等等。
?硬件支持:硬件社區(qū)已經(jīng)完全接納了Llama作為一個(gè)關(guān)鍵的模型架構(gòu)。主要的硬件平臺(tái)AMD、Intel、Nvidia和Google已經(jīng)通過硬件和軟件優(yōu)化提高了Llama2的性能。
生態(tài)系統(tǒng)充滿活力,參與者遍布從服務(wù)器和移動(dòng)硬件到云平臺(tái)、初創(chuàng)公司和企業(yè)的每一層。最近發(fā)布的CodeLlama,這些模型在許多平臺(tái)上都能在幾個(gè)小時(shí)內(nèi)使用,為社區(qū)創(chuàng)造了令人難以置信的速度。
![]()
它開始于一個(gè)快速發(fā)展的研究項(xiàng)目...
在過去的幾年里,大型語言模型(LLMs)——擁有數(shù)十億參數(shù)的自然語言處理(NLP)系統(tǒng)——已經(jīng)展示出新的能力,如生成創(chuàng)造性的文本、解決數(shù)學(xué)定理、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)、回答閱讀理解問題等等。這些項(xiàng)目代表了AI可以為數(shù)十億人提供的顯著潛在利益的明確例子。
原始項(xiàng)目,LLaMA或我們最近稱之為L(zhǎng)lama1,是由一個(gè)主要專注于形式數(shù)學(xué)的團(tuán)隊(duì)在FAIR中開發(fā)的,但同時(shí)看到了LLMs的力量,以及如何通過正確的縮放法則和高度策劃的數(shù)據(jù)訓(xùn)練一個(gè)相對(duì)較小的模型,可以成為新應(yīng)用研究的強(qiáng)大基礎(chǔ)。因此,Llama的第一代誕生了,并且自那時(shí)起在學(xué)術(shù)界和全世界引發(fā)了創(chuàng)新。事實(shí)上,在幾天內(nèi),各個(gè)學(xué)術(shù)機(jī)構(gòu)的研究人員就能夠調(diào)整出能夠遵循指示或處理額外任務(wù)的更好版本的Llama1。從那時(shí)起,社區(qū)開始在許多方面和方向上進(jìn)行創(chuàng)新。
![]()
但是我們希望讓更多的人能夠使用這項(xiàng)技術(shù)。這就是Llama2的由來。
為什么我們要發(fā)布我們的模型?
正如我們的歷史所顯示的,我們深信開源社區(qū)的力量。我們相信,最先進(jìn)的AI技術(shù)在開放和對(duì)所有人可訪問的情況下會(huì)更安全、更好地對(duì)齊。此外,在高熵區(qū)域,建立橋梁并利用不可避免產(chǎn)生的創(chuàng)新是有利的。這對(duì)于PyTorch來說是真實(shí)的,其中像穩(wěn)定擴(kuò)散、GPT 3和GPT 4這樣的突破不斷地顛覆了AI的世界,對(duì)于Llama也是如此。對(duì)于我們Meta來說,我們可以沿著三個(gè)軸總結(jié)價(jià)值:
研究:新的技術(shù)、性能優(yōu)化、工具和評(píng)估方法,包括在安全性方面的工作,使Meta能夠從研究社區(qū)中更快地吸收學(xué)習(xí)。許多這些社區(qū)也是新興的,公開合作使得取得進(jìn)展更為容易;
企業(yè)和商業(yè)化:越多的企業(yè)和創(chuàng)業(yè)公司在我們的技術(shù)上建立,我們就能更多地了解使用案例、安全模型部署和潛在機(jī)會(huì);以及
開發(fā)者生態(tài)系統(tǒng):LLMs已經(jīng)從根本上改變了AI開發(fā),每天都有新的工具和方法用于操作、管理和評(píng)估模型。擁有一種通用語言使我們能夠快速利用這些技術(shù),加速我們的內(nèi)部堆棧。
但這對(duì)于Meta來說并不新鮮。就像PyTorch和其他幾十個(gè)公開發(fā)布或開源項(xiàng)目一樣,這種理念深深地根植在我們公司的DNA中。
前進(jìn)的道路
有一件事是肯定的:生成AI領(lǐng)域發(fā)展迅速,我們都在一起學(xué)習(xí)這項(xiàng)技術(shù)的能力和應(yīng)用。Meta仍然致力于今天的AI的開放方式。以下是我們?cè)谶@個(gè)旅程中繼續(xù)關(guān)注的幾個(gè)領(lǐng)域:
多模態(tài):就像世界并非完全由文本構(gòu)成一樣,AI可以接受新的模態(tài),以實(shí)現(xiàn)更多沉浸式的生成體驗(yàn);
安全和責(zé)任:生成AI已經(jīng)使負(fù)責(zé)任的AI世界煥發(fā)新生。我們將更加重視安全和責(zé)任,開發(fā)新的工具,建立合作伙伴關(guān)系,并利用Llama作為我們的社區(qū)繼續(xù)學(xué)習(xí)如何安全和負(fù)責(zé)任地建設(shè)的工具;以及
關(guān)注社區(qū):就像PyTorch一樣,我們將這看作是一個(gè)有發(fā)言權(quán)的開發(fā)者社區(qū),我們希望給予他們權(quán)力和推動(dòng)他們創(chuàng)新的工具。我們的目標(biāo)是為社區(qū)提供展示工作、貢獻(xiàn)和講述他們故事的新方式。
想了解更多關(guān)于Llama家族的信息嗎?
在Meta Connect主題演講(完整)中,我們談了很多關(guān)于我們的Llama模型和開放訪問的未來。從我們的會(huì)議到動(dòng)手工作坊,我們很高興與您分享我們的最新發(fā)展。
以下是您可以深入了解和學(xué)習(xí)更多的一些方式:
a.下載模型并與Llama 2互動(dòng)。
b.參加Connect Sessions,包括我們關(guān)于使用Llama模型的工作坊。
c.訪問ai.meta.com/llama閱讀論文,查看我們的負(fù)責(zé)任使用指南和可接受使用政策,并了解更多關(guān)于支持Llama生態(tài)系統(tǒng)的合作伙伴。
作者:
Joe Spisak 產(chǎn)品總監(jiān)
Sergey Edunov 工程總監(jiān)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.