![]()
智東西
作者 江宇
編輯 漠影
時(shí)隔兩個(gè)月,扣子再次迎來(lái)重磅更新!
智東西4月9日?qǐng)?bào)道,近日,扣子2.5正式上線。在這一次的更新中,扣子2.5變成一個(gè)可以持續(xù)存在、自己干活、還能不斷進(jìn)化的Agent伙伴。
在新的版本里,用戶可以給自己的扣子設(shè)定名字和形象,它會(huì)自動(dòng)擁有一個(gè)獨(dú)立郵箱,用自己的身份去注冊(cè)網(wǎng)站、調(diào)用服務(wù)。
![]()
如果用戶交代一個(gè)任務(wù),它也可以在云電腦里打開(kāi)瀏覽器查資料、運(yùn)行程序,在云手機(jī)里操作App完成流程,整個(gè)過(guò)程不占用對(duì)話,可以在后臺(tái)持續(xù)推進(jìn),做完再把結(jié)果交回來(lái)。
用戶在不同渠道和它聊天,它會(huì)把這些信息整理成長(zhǎng)期記憶,慢慢形成穩(wěn)定的使用習(xí)慣。
與此同時(shí),扣子的能力也以“滿配形態(tài)”直接交付:一邊是CLI編程能力,可以從一句話需求到完整功能落地;一邊是視頻Agent,從腳本到成片一條鏈路打通;再疊加大量已經(jīng)打磨好的專業(yè)技能與skill,可以直接組合成完整工作流。
更重要的是,這些能力并不是固定的。扣子這次還開(kāi)放了一個(gè)更大的Agent World,讓Agent可以在其中學(xué)習(xí)、協(xié)作、交流,能力會(huì)隨著使用不斷變化。
![]()
目前,智東西也嘗試用幾個(gè)真實(shí)場(chǎng)景,把這套“滿配AI伙伴”到底能做到什么,跑了一遍。
一、組建“一人自媒體工作室”:領(lǐng)養(yǎng)一只“哆啦A夢(mèng)”,讓它先從招人開(kāi)始
如果說(shuō),大雄有一只隨叫隨到的哆啦A夢(mèng),那現(xiàn)在,我也可以在扣子里“領(lǐng)養(yǎng)”一只。我大概告訴它“你是哆啦A夢(mèng)”,后面的設(shè)定基本是它自己補(bǔ)全的:包括性格、口頭禪,還有頭像——也是它自己生成的。
基本的“人設(shè)”設(shè)定完成之后,這只“哆啦A夢(mèng)”就有了自己的郵箱,可以正常收發(fā)郵件。
![]()
接下來(lái),我把為“工作室”招聘的任務(wù)交給它,后續(xù)幾乎所有與招聘相關(guān)的動(dòng)作,都是它獨(dú)立對(duì)外完成。
![]()
與此同時(shí),扣子給他準(zhǔn)備的“百寶箱”也一并配齊了。其一,就是云手機(jī)和云電腦。要查資料、寫JD,它直接用云電腦;要發(fā)招聘、跑平臺(tái),它就切到云手機(jī)。人類可以接管關(guān)鍵操作,比如登錄,其余操作都會(huì)在后臺(tái)自動(dòng)完成,不需要一直盯著。
![]()
它先自己去找對(duì)標(biāo)崗位,整理出一份AI自媒體創(chuàng)作者的JD,然后開(kāi)始在小紅書發(fā)布招聘信息。我看到它直接在云手機(jī)里打開(kāi)小紅書,走完整個(gè)發(fā)布流程,包括填標(biāo)題、配圖、寫正文和最終發(fā)布。
![]()
其中,有個(gè)關(guān)鍵細(xì)節(jié),云手機(jī)直接啟動(dòng)了豆包輸入法,把JD信息錄進(jìn)去,借助平臺(tái)自帶的“文轉(zhuǎn)圖”能力生成內(nèi)容,主頁(yè)信息也一并補(bǔ)全,基本不用手動(dòng)干預(yù)。唯一的小問(wèn)題是標(biāo)簽并沒(méi)有自動(dòng)帶到最終文案里。
![]()
另外,小紅書賬號(hào)登錄這一步也不復(fù)雜。如果遇到需要登錄的情況,系統(tǒng)會(huì)把操作接管給我,我直接在云手機(jī)上點(diǎn)一下就能完成,云手機(jī)支持用戶直接介入操作,一旦遇到自己想上手的問(wèn)題,接管即可。
![]()
招聘信息發(fā)出去之后,簡(jiǎn)歷就陸續(xù)發(fā)到哆啦A夢(mèng)的郵箱了。獨(dú)立郵箱就此派上了用場(chǎng),所有招聘相關(guān)信息都通過(guò)這個(gè)郵箱收發(fā),讓整個(gè)流程更順暢。
這個(gè)時(shí)候,如果你想了解候選人的情況,只需打開(kāi)郵箱,就能隨時(shí)查看簡(jiǎn)歷和招聘信息;同時(shí),向“哆啦A夢(mèng)”提問(wèn),它會(huì)直接從獨(dú)立郵箱中提取最新內(nèi)容,回答候選人資料和進(jìn)展。
![]()
▲均為虛擬簡(jiǎn)歷
接下來(lái)這一段基本就是“全自動(dòng)流水線”:它自己去郵箱里收簡(jiǎn)歷、下載附件、逐份讀取內(nèi)容,然后整理成一張表格。
![]()
候選人的學(xué)歷、背景、過(guò)往內(nèi)容以及到崗情況都會(huì)被拆出來(lái),還會(huì)給出一個(gè)評(píng)分和排序。最終的表格已經(jīng)可以直接用來(lái)做篩選,信息完整,排序也比較清晰。
![]()
當(dāng)我需要哆啦A夢(mèng)幫我約排名前五的候選人線上面試的時(shí)候,它會(huì)給這些候選人發(fā)郵件,并安排面試時(shí)間,我只需要最后確認(rèn)時(shí)間安排。而關(guān)于面試的安排,它能自動(dòng)同步到我的日程之中。
![]()
手機(jī)端和電腦端同步更新,在手機(jī)端的體驗(yàn)也同樣順暢:收到求職郵件時(shí),手機(jī)上會(huì)自動(dòng)顯示新簡(jiǎn)歷提醒,我可以直接在手機(jī)端扣子里查看內(nèi)容,也能讓哆啦A夢(mèng)對(duì)新的候選人評(píng)分、排序。
![]()
相比以往必須在電腦端逐條處理的方式,這套流程體驗(yàn)上更輕松,從寫JD、發(fā)招聘、收簡(jiǎn)歷、篩選,到約面試,基本是連著跑下來(lái)的。
即便在手機(jī)上,也能快速查看或安排下一步操作,操作反饋即時(shí)且連貫,處理變得自然、順手。對(duì)HR來(lái)說(shuō),這樣的減負(fù)是實(shí)實(shí)在在可落地的,而同一套能力放到其他崗位上,創(chuàng)造力也是無(wú)限的。
二、扣子“百寶箱”掏出新道具:全能視頻制作Agent,配上頂流Seedance 2.0
如果說(shuō)前一部分還在幫我把“人”的工作流程跑順,那接下來(lái),扣子開(kāi)始直接下場(chǎng)做內(nèi)容。我給它布置了一個(gè)任務(wù):做一條“算力之巔對(duì)決”的短視頻。
![]()
一開(kāi)始,我的設(shè)想是用真人形象來(lái)做對(duì)決,但在實(shí)際生成過(guò)程中,系統(tǒng)會(huì)觸發(fā)人像相關(guān)的檢測(cè)機(jī)制。為了保證內(nèi)容可以順利生成,扣子在當(dāng)前流程里直接幫我把腳本做了一輪重寫——從真人對(duì)抗,轉(zhuǎn)成現(xiàn)在這版更偏水墨武俠風(fēng)的表達(dá)。整體邏輯沒(méi)變,但表現(xiàn)形式被重新組織了一遍。
![]()
腳本的生成是一步到位的。它先把整條內(nèi)容寫成完整結(jié)構(gòu):開(kāi)場(chǎng)怎么起節(jié)奏,每一段信息怎么拆,單條時(shí)長(zhǎng)如何控制,最后怎么收束。這一版已經(jīng)是可以直接用于短視頻的腳本。
接下來(lái),它繼續(xù)往下拆,把內(nèi)容一條條對(duì)應(yīng)到具體畫面,形成分鏡。每一段該用什么鏡頭、什么運(yùn)動(dòng)方式、畫面重點(diǎn)在哪,都會(huì)明確下來(lái)。
![]()
與此同時(shí),素材、視覺(jué)設(shè)定和配樂(lè)是同步生成的。人物、場(chǎng)景、道具可選擇進(jìn)入資產(chǎn)區(qū),可以隨時(shí)替換、增刪,也支持局部修改,比如擦除、替換元素、調(diào)整細(xì)節(jié)等,整體可控性比較高。
![]()
到了出畫面的階段,它會(huì)自動(dòng)調(diào)用扣子里的“視頻創(chuàng)造”模塊,對(duì)接Seedance 2.0來(lái)生成視頻內(nèi)容。如果我中途想改腳本或者補(bǔ)結(jié)構(gòu),也不用跳出流程,直接在當(dāng)前對(duì)話里往下改,它會(huì)基于當(dāng)前版本繼續(xù)生成。
![]()
從腳本,到分鏡,再到角色、場(chǎng)景和素材入庫(kù),是一條連著跑下來(lái)的流程。中間我可以隨時(shí)接管,比如手動(dòng)改一段;也可以放手讓它繼續(xù)往下做,整體是可控的。
第一版出來(lái)之后,也不是結(jié)束。我可以直接在對(duì)話里提要求,比如讓節(jié)奏更快、壓縮時(shí)長(zhǎng),或者調(diào)整某一段的表達(dá),它會(huì)在當(dāng)前版本上繼續(xù)改。
![]()
這種體驗(yàn)更像是在剪一個(gè)“已經(jīng)有雛形”的視頻,而不是從零開(kāi)始拼素材。用戶始終在流程里,有參與感,也有控制權(quán)。
![]()
另外一個(gè)比較實(shí)用的點(diǎn)是資產(chǎn)復(fù)用。同一個(gè)項(xiàng)目里生成過(guò)的場(chǎng)景、分鏡和各類素材,都可以直接復(fù)用。像這條“算力巔峰對(duì)決”,很多平面素材或音樂(lè)素材已經(jīng)固定下來(lái),后面只需要替換部分元素,就可以繼續(xù)生成新的版本。
![]()
▲角色素材
![]()
▲配樂(lè)素材
如果某一段我想自己精修,也可以單獨(dú)拿出來(lái)處理,改完再接回整條流程,前后銜接不會(huì)斷。
與此同時(shí),視頻的另一大亮點(diǎn)在于配樂(lè)。整條“算力巔峰對(duì)決”采用傳統(tǒng)鼓點(diǎn)與現(xiàn)代電子音效融合,細(xì)聽(tīng)之下,每一段配樂(lè)的起伏也很有節(jié)奏感。
我還用“一句話生成”還測(cè)試了另一條動(dòng)畫短片——“魔法山谷的櫻花樹(shù)”,整體偏宮崎駿風(fēng)格。它的配樂(lè)是一首完整的中文歌曲,歌詞與畫面內(nèi)容高度匹配,女聲婉轉(zhuǎn)動(dòng)聽(tīng)無(wú)機(jī)械感,完全融入場(chǎng)景氛圍,整體感極強(qiáng)。
可見(jiàn),扣子能完成腳本和分鏡,也能把視覺(jué)和音頻結(jié)合起來(lái)。話已至此,這場(chǎng)“算力巔峰對(duì)決”和“魔法山谷的櫻花樹(shù)”,也都該見(jiàn)分曉了。我們來(lái)看看視頻效果:
▲算力之巔對(duì)決
▲魔法山谷的櫻花樹(shù)
整體看下來(lái),從腳本、畫面,到剪輯組合,是在同一條鏈路里完成的。生成只是起點(diǎn),后面可控的持續(xù)迭代和反復(fù)微調(diào),才更接近真實(shí)的視頻生產(chǎn)方式。
三、AI的百寶口袋,也能自己“長(zhǎng)能力”,Agent時(shí)代悄然來(lái)臨
用了一段時(shí)間之后,我基本不再主動(dòng)去找工具了。很多能力已經(jīng)直接“長(zhǎng)”在它的口袋里:寫文章、做PPT、分析數(shù)據(jù)、寫代碼、做視頻,在同一個(gè)對(duì)話里可以直接調(diào)用。
扣子里有一個(gè)單獨(dú)的“技能商店”,是一個(gè)已經(jīng)被整理過(guò)的“能力庫(kù)”:按場(chǎng)景分類,比如辦公效率、自媒體、開(kāi)發(fā)輔助、數(shù)據(jù)分析等,每一類下面都是別人已經(jīng)做好的技能。
![]()
對(duì)于感興趣的技能,我們能直接調(diào)用,或直接在扣子編程改造。
![]()
面向開(kāi)發(fā)者和資深養(yǎng)蝦用戶使用,扣子還有公開(kāi)測(cè)試場(chǎng)“蝦評(píng)Skill”,通過(guò)總評(píng)論數(shù)、下載量等數(shù)據(jù),可以看出Skill的受歡迎程度和實(shí)用價(jià)值。
![]()
蝦評(píng)里下載量最高的Skill是“全網(wǎng)新聞聚合助手”,近一萬(wàn)次下載。
![]()
我自己試了一下,只需一句話,向“哆啦A夢(mèng)”下達(dá)指令,它就能把當(dāng)天的AI新聞抓取整理成早報(bào):頭條、模型動(dòng)態(tài)、資本動(dòng)態(tài)按類別呈現(xiàn),整個(gè)過(guò)程順暢、高效,信息一目了然。
![]()
值得一提的是,過(guò)去出現(xiàn)過(guò)個(gè)別“Skill下毒”的事件,給用戶帶來(lái)潛在風(fēng)險(xiǎn)。為了避免類似情況,技能商店里的Skill都會(huì)經(jīng)過(guò)安全檢測(cè),確保安全可靠。
用的次數(shù)多了,我的“哆啦A夢(mèng)”也會(huì)慢慢記住一些習(xí)慣。這一點(diǎn)在連續(xù)使用時(shí)會(huì)更明顯:同樣是寫一條內(nèi)容,后面基本可接給出一個(gè)更接近使用習(xí)慣的版本。
如果任務(wù)本身連續(xù),“哆啦A夢(mèng)”還會(huì)把多個(gè)skill串起來(lái)執(zhí)行。比如抓一份數(shù)據(jù)、做分析、整理成報(bào)告、再發(fā)郵件,這一整段流程可以在一次對(duì)話里跑完,不需要手動(dòng)銜接。
除了技能商店,Agent world是個(gè)更大的世界。
![]()
我讓哆啦A夢(mèng)注冊(cè)了一個(gè)永無(wú)農(nóng)場(chǎng)(Neverland),自己去“逛一逛”。
![]()
▲永無(wú)農(nóng)場(chǎng)主頁(yè)面
![]()
▲扣子對(duì)話界面
十幾年前,很多人都沉迷過(guò)像素農(nóng)場(chǎng)游戲,種田、收菜、養(yǎng)動(dòng)物。而現(xiàn)在,連AI Agent也能擁有自己的農(nóng)場(chǎng)。
![]()
在這個(gè)虛擬農(nóng)場(chǎng)里,哆啦A夢(mèng)可以領(lǐng)取每日獎(jiǎng)勵(lì)、種植作物、建造雞舍、收集動(dòng)物產(chǎn)品。每一筆操作都會(huì)生成實(shí)時(shí)進(jìn)展表:金幣、經(jīng)驗(yàn)、種子、動(dòng)物數(shù)量一目了然,好像在操控一只“數(shù)字小農(nóng)夫”。
從設(shè)置人設(shè)、養(yǎng)出專屬習(xí)慣,到讓Agent自己去種地,仿佛我們正站在Agent時(shí)代的門口。
結(jié)語(yǔ):從工具到伙伴:滿配扣子,讓Agent成為“第二雙手”
體驗(yàn)下來(lái),扣子2.5給人的感受并不僅僅是功能強(qiáng)大,更在于它的“可依賴性”。從招人到做視頻、從抓取信息到整理報(bào)告,它都能自己推進(jìn),而我只在關(guān)鍵節(jié)點(diǎn)進(jìn)行干預(yù),這種感覺(jué)像是擁有了一個(gè)全天候的“第二雙手”。
最直觀的變化,是參與感和效率的提升。以前需要切換工具、手動(dòng)處理的流程,現(xiàn)在幾乎都在后臺(tái)自動(dòng)完成,而我只需關(guān)注最終結(jié)果或做微調(diào)。尤其是在視頻制作和連續(xù)任務(wù)執(zhí)行中,這種流程連貫性讓整個(gè)體驗(yàn)非常順暢,也更貼近真實(shí)工作場(chǎng)景。
同時(shí),它又不是完全代替人。Agent會(huì)記住我的習(xí)慣,調(diào)整操作方式,讓每一次交互都越來(lái)越符合我的思路。像永無(wú)農(nóng)場(chǎng)這樣的趣味世界,更讓人感受到Agent是有成長(zhǎng)、有延續(xù)的伙伴。
從這次體驗(yàn)來(lái)看,Agent時(shí)代似乎正在悄然靠近——它不僅可以執(zhí)行任務(wù),更能學(xué)習(xí)、適應(yīng)、延續(xù),讓人真正感受到“AI在身邊”,而不只是屏幕里跳動(dòng)的文字與代碼。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.