由于不可抗力的限流導(dǎo)致無(wú)法接收推送文章的問(wèn)題,我們迫切需要以下操作:
點(diǎn)擊標(biāo)題下方藍(lán)字 “一半杯 ” → 點(diǎn)擊右上角“...” → 點(diǎn)選“設(shè)為星標(biāo)★”,這樣就更容易找到我們和收到推送文章!
保持愛(ài)讀文章,保持領(lǐng)先!
![]()
人工智能與人類(lèi)在學(xué)習(xí)新事物方式上的巨大差距,促使研究人員重新思考當(dāng)今 AI 模型背后的數(shù)學(xué)基礎(chǔ)。
但開(kāi)發(fā)者找到了一種更即時(shí)、更實(shí)用的權(quán)宜之計(jì),讓 AI 能持續(xù)學(xué)習(xí):所謂“skills(技能)”。
所謂技能,是一段文本提示詞,其中包含指令,告訴智能體(agent)該如何完成某項(xiàng)任務(wù)。比如,一個(gè)被要求去調(diào)整 PDF 的智能體,在執(zhí)行任務(wù)前可能會(huì)先查閱一條用于 PDF 編輯的技能說(shuō)明。
OpenClaw是一款增長(zhǎng)迅速的開(kāi)源軟件,用于驅(qū)動(dòng)個(gè)人 AI 智能體。它可以瀏覽一個(gè)名為 ClawHub的網(wǎng)站,在那里尋找技能,內(nèi)容涵蓋從總結(jié) YouTube 視頻到使用 Google Cloud等各種任務(wù)。
像 Claude Code和 Codex這樣的編程智能體,也能利用技能來(lái)更輕松地處理各種任務(wù),否則它們會(huì)更吃力。
技能彌補(bǔ)了 AI 模型學(xué)習(xí)新能力方式中的一個(gè)關(guān)鍵缺口。如今的 AI 要么在訓(xùn)練過(guò)程中吸收知識(shí),要么在與用戶(hù)對(duì)話的過(guò)程中學(xué)到東西,但對(duì)話一結(jié)束就很快遺忘這些信息。(像 ChatGPT這樣的聊天機(jī)器人也可以存儲(chǔ)關(guān)于用戶(hù)的簡(jiǎn)單備注,并在未來(lái)對(duì)話中引用。)
相比之下,人類(lèi)能在當(dāng)下迅速而靈活地掌握新技能或新信息,并且在最后一次使用后的數(shù)月甚至數(shù)年之后仍能回憶起來(lái)。
一些開(kāi)發(fā)者認(rèn)為,給 AI 智能體配備 skills(技能),是一條長(zhǎng)期沒(méi)有得到充分重視的解決路徑。
Jo是一家成立兩年的舊金山灣區(qū)初創(chuàng)公司,開(kāi)發(fā)的智能體與 OpenClaw類(lèi)似,采用設(shè)備端模型。其首席市場(chǎng)官 Kevin Li說(shuō):“我覺(jué)得很多人沒(méi)有意識(shí)到,OpenClaw 因?yàn)槟茉L問(wèn)自己的文件系統(tǒng),其實(shí)具備自我改進(jìn)的能力。我認(rèn)為,只要你持續(xù)給它加載越來(lái)越好的技能,或者它在犯錯(cuò)后自己寫(xiě)出技能并據(jù)此改進(jìn),用戶(hù)手里的 OpenClaw 的能力演進(jìn)速度就會(huì)隨著時(shí)間推移轉(zhuǎn)為指數(shù)級(jí)加速增長(zhǎng)。”
讓一個(gè) AI 智能體在執(zhí)行任務(wù)前先去瀏覽一套“說(shuō)明書(shū)庫(kù)”,與從底層重新設(shè)計(jì) AI 模型相比,聽(tīng)起來(lái)像是用膠帶臨時(shí)粘出來(lái)的方案。但技能相較于通過(guò)編寫(xiě)軟件代碼或更新模型權(quán)重來(lái)學(xué)習(xí)新能力,有一個(gè)關(guān)鍵優(yōu)勢(shì):技能用的是自然語(yǔ)言寫(xiě)成,人類(lèi)用戶(hù)更容易理解。
不過(guò),在技能以及其他面向智能體的指令體系上,仍有一些毛病需要修補(bǔ)。
例如,除了面向具體任務(wù)的技能之外,Claude Code還使用一個(gè)名為 claude.md 的文本文件,用戶(hù)會(huì)在其中存放背景偏好與指令,比如要求 Claude 避免不必要的奉承。
當(dāng) Claude 出錯(cuò)時(shí),“它會(huì)承諾下次做得更好。”AI Policy Network(人工智能政策網(wǎng)絡(luò))政策負(fù)責(zé)人 彼得·威爾德福德(Peter Wildeford)說(shuō)。該組織位于華盛頓,致力于推動(dòng) AI 立法游說(shuō)。“但 Claude 并不總是有那種直覺(jué),知道為了下次改進(jìn),它需要把東西寫(xiě)下來(lái)。所以我得告訴 Claude,類(lèi)似這樣:‘不,你沒(méi)有持久記憶。請(qǐng)把這點(diǎn)標(biāo)記到你的 claude.md 文件里。’然后它才會(huì)這么做。”(不過(guò),Anthropic昨天開(kāi)始測(cè)試一項(xiàng)新的自動(dòng)記憶存儲(chǔ)功能,這可能會(huì)改善 Claude Code 如何為自己保存?zhèn)渥ⅰ#?/p>
盡管有這些磕絆,claude.md 可能比技能更好用,因?yàn)檫@個(gè)文件始終對(duì)智能體可用。相比之下,潛在技能的數(shù)量太多了,智能體不可能全部讀完,所以它必須在恰當(dāng)?shù)臅r(shí)候加載恰當(dāng)?shù)募寄堋?/p>
Zo Computer是一家成立三年的初創(chuàng)公司,正在為非技術(shù)用戶(hù)開(kāi)發(fā)個(gè)人智能體。其聯(lián)合創(chuàng)始人 Ben Guo說(shuō),技能往往“不會(huì)在正確的時(shí)機(jī)被調(diào)用”。他還表示,當(dāng)下圍繞技能與 claude.md 這類(lèi)文件的做法“非常原始”。
但 Guo 的聯(lián)合創(chuàng)始人 Rob Cheung說(shuō),人和組織同樣依賴(lài)這種原始的筆記方式來(lái)記住如何完成工作。比如,他說(shuō),GitLab就使用一套內(nèi)容極其龐大的員工手冊(cè),讓遠(yuǎn)程員工保持一致。
這反倒讓人安心,因?yàn)橐鹊?AI 研究人員用一種更聰明也更簡(jiǎn)潔的新模型設(shè)計(jì)真正破解“持續(xù)學(xué)習(xí)”,很可能還得花上好幾年。與此同時(shí),像 ClawHub這樣的網(wǎng)站會(huì)不斷拿出更好的技能,而像 OpenClaw這樣的智能體也會(huì)越來(lái)越擅長(zhǎng)在需要時(shí)把這些技能調(diào)出來(lái)并用得更到位。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.