網易首頁 > 網易號 > 正文申請入駐

查資料做視頻寫代碼甚至畫 CAD，豆包這動手能力真有點離譜了

2026-02-21 00:08:13　來源: 差評XPIN

浙江舉報

分享至

但說句實話，跑分這東西就跟簡歷一樣。紙面上看著好看，真坐到工位上頂不頂用，那是另外一碼事。那咱不說廢話，接下來直接上強度，看看它到底能做些啥。有的，這模型現在連畫復雜的 CAD 圖紙，都能硬啃下來。而且，它干這活兒的方式，也強到離譜。

大伙兒有沒有發現，現在不管哪家公司發新模型，底下提問最常見的就一種類型：“這事兒到底能不能干？”好像跑分越高越強的思維，已經過時了。

但我說實話，這群 AI 和機器人公司全學壞了，就愛擱春節亮相，搞得世超和同事連春晚都看不進去了。

這不，就在春節放假前，咱大伙最愛用的豆包，先是丟了一個王炸視頻模型 Seedance 2.0，接著又在春節來臨之際推出了豆包大模型 2.0（Doubao-Seed-2.0）系列。

你別說，這發得真是時候。。世超本來說趕在節前水一篇稿子放假，結果一上手，發現稿子寫不完了。

因為這小子，干起活來還真有點東西。。能干的活，兩三天根本研究不明白，于是整個春節假期，我基本全耗在研究怎么壓榨它的勞動力上了。

現在，這套“壓榨流程”總算完工了，今天就來給大伙兒交個作業。咱們不整虛的，一切全從哥們的實際需求出發。

當然了，例行公事的成績單咱還是得掃一眼。

這次字節的“Seed”家族更新得還蠻全面，除了核心的豆包 Seed 2.0，還有主攻視頻生成的 Seedance 2.0，以及搞定圖像的 Seedream 5.0 Lite，在火山引擎上都能試用，而且Seed 2.0系列的API已全部上線。

就拿核心的 2.0 Pro 來說，空間理解、運動感知和視頻理解這幾個科目，直接跑贏了 Gemini 3 Pro。

數學和推理分數拿下了 IMO 等硬核競賽的金牌水平，全球最高，信息搜索和工具調用能力也拉升了一大截，只輸一手 GPT 5.2。

首先，這玩意的 Agent 能力非常強，也就是抄家伙干活的能力。

眾所周知，差評編輯部是一個多模態的團伙，文字，圖片，視頻，樣樣精通。。所以我們每次用 AI 都挺麻煩的，各種 AI 工具擅長的東西都不一樣，有的作圖強，有的視頻強，我們需要把窗口切來切去，文件傳來傳去，很影響效率。

但在春節假期期間，我用seed-2.0-pro 再配合 seedance、seedream，搭建了一個多模態的 AI 助手，并把它連接到了飛書。

現在，我只需要把任何格式的東西用飛書發給它，再給它提要求，它就能按要求和文件類型，處理我發過去的文件。

具體實現方法，簡單來說，就是本地部署一個 OpenClaw，然后給它接上火山引擎上 Seed-2.0-Pro 的 API，再在飛書開發者后臺創建一個機器人，接入我們的 OpenClaw，最后再在飛書給它發消息，讓它自己配置個 Skill ，用 Skill能自行調用圖片、視頻生成能力即可。

只要機器人配置好，咱什么東西都能在里面搓了。比如，你們剛剛看到的切屏表情包，就是我用這個神秘妙妙工具做的。

或者，咱可以對已生成的圖片進行修改，也就一句話的事兒。比如我可以給它一張過年期間的全家福，讓它改得喜慶一點。

結果。。不對，居然翻車了？？不能說是一模一樣，只能說是毫無血緣關系。

按說豆包的 seedream 4.5，是很強的生圖模型了，難道其中還有什么玄機。。于是我打算盤問一下它的工作流程。

然后它告訴我沒把原圖傳過去，原因是“圖生圖傳base64太大了調用失敗”。這我哪聽得懂？直接讓它自己幫我解決。

結果，它一通操作，檢查問題-提出方案-解決問題，一套流程下來，還真給我調試好了。。

這番交互下來，我還是挺滿意的。因為一個模型犯錯其實是不可避免的，這和用戶的提示詞、當前的上下文都脫不開關系，而真正重要的是它知錯就改的能力，在你需求描述越來越精確后，它能精準捕捉需求，并快速解決錯誤。

當然除了圖片，視頻也是可以在同一個對話框生成的。比如我可以發個圖片過去，讓它轉成視頻。

這是成品：

如果你需要，還可以一鍵轉成 GIF，它自己調用工具生成：

所以這個機器人，現在不僅能改文案，還能幫美編作圖，給后期配素材，還能給編輯配 GIF 圖，只能說爽飛了啊，誰還分得清機器人和同事啊？

好了，那如果你需求沒那么垂直，只想體驗跟 Seed 2.0 對話怎么辦？很簡單，直接上火山引擎，在模型廣場里找到 Doubao-Seed-2.0 全系列，點擊立即體驗就能用。

對了，剛咱跑分里提到一個 BrowseComp，就是考察大模型搜索犄角旮旯里信息的能力的。剛好世超也蠻需要這個功能的，咱再來試試。

剛好世超最近在研究數學，發現一個很神奇的問題，為什么圓周率π（約 3.14）的平方和g（重力加速度，約 9.8）的值那么近似？我研究了很大篇幅的資料，也沒找到令我滿意的答案。

于是我把我自己的想法（約 3000 字）一股腦發給了它，讓它通過手里的知識庫和互聯網工具一一解答。

答案真是夯爆了啊，不僅解答了我的疑問，還補充了說明了彩蛋和冷知識，其實就是人類定義的問題，完全不是什么巧合。

有意思的是，我讓同樣擅長搜索的 Claude Opus 4.6 做了一遍這個題，然后把Seed 2.0 pro答案發了過去，它直接自愧不如了。

對了，不僅能處理文本，Seed 2.0 的多模態能力也是一等一的強。比方說，視頻理解這一項，昔日王者是 Gemini 3 pro，現在 Seed 2.0 pro 也能打一打了。

比如我直接傳了一個往日最佳視頻過去，讓 AI 進行笑點解析。

說的確實不賴，每個動作它都看清了，還能看懂烏鴉的神態。甚至能預測接下來的劇情走向。

這是 Gemini 的回答，感覺也大差不差了。

而世超覺得這個是真實用。現在視頻的缺點，就是你第一眼不知道它的重點是啥，是夯還是拉你得看完才知道，而現在你能直接下載視頻發給豆包，如果視頻又臭又長，你也不用浪費你寶貴的時間了。

那，還有其他硬核項目嗎，比如，寫代碼？

這次，字節跟 OpenAI 想到一塊兒去了，端出了專精編程的 Doubao-Seed-2.0-Code 模型。可能他們也統一思路了，想讓 AI 成為真正的生產力，就必須專門出一個垂直模型，死磕寫代碼。

我這不會寫代碼的也試了試，我拿它擼了個手勢控制的飛機小游戲，我只需要在對話框里輸入幾句大白話需求，Seed 2.0 Code 就像接管了我的鍵盤一樣，唰唰把復雜的攝像頭捕捉和運動計算邏輯全寫完了。

現在我只要坐在屏幕前，對著攝像頭揮揮手，就能直接操縱游戲里的飛機閃轉騰挪。一個零基礎的人在五分鐘內搞定這種交互，只能說非常好用了。

看到這里，你可能以為，它也就搞搞自媒體、寫點小游戲了，還有別的活嗎？

比如操作 FreeCAD 建模，它不是給你丟一堆代碼給你，而是直接奪舍你的鼠標，自己在屏幕上去找菜單、點圖標。

最神的是，中間它操作太快沒點準，不小心點錯工具彈了個報錯框。

結果這貨在后臺觸發了一段“自我反思”：“我的，點錯了，不小心點到了 Pocket 工具，等我關了重來。。”

這一大圈折騰下來，世超最大的感受就是：豆包這次是真的在往“六邊形戰士”的方向死磕。

放在以前，大伙兒一聊起多模態體驗最牛的，第一反應就只有 Gemini，綜合能力強到斷層，你放眼望去，甚至連個能稍微抗衡一下的老二都找不出來。

但今天再看豆包，不管是文字、圖片還是視頻全都能接得住，理解能力也直逼第一梯隊。那肉眼可見的差距，正在被進化的速度慢慢填平。

而且最關鍵的是，它是真會自己動手啊。遇到盲區會搜資料，需要工具會抄家伙，甚至連 CAD 都能硬啃。這就導致在跟它一來一回的拉扯中，你會感覺它越來越像一個坐在你隔壁工位、隨叫隨到的同事了。

回過頭來看看這波 AI 浪潮，從最開始只會陪人聊天的文字窗口，到后來能看圖、能聽聲音，再到現在直接能長出了手和腳，這種從“對話工具”向“干活幫手”的跨越，意味著硅基生命替碳基生命打黑工的齒輪，已經徹徹底底轉動起來了。

往后看，各家搞軍備競賽，光靠在 PPT 上吹參數已經唬不住人了。大家真正在意的，到底是誰能替大伙兒扛下那些讓人頭禿的臟活累活。

所以咱能做的，也只有多配合它踏踏實實干活，繼續等它進化完全的那天吧。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

懂人性更懂執行，螞蟻這個萬億開源模型把情商和戰斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2
重塑軟件工程：從Vibe Coding走向Spec Coding

鈦媒體APP 2026-02-11 09:37:53
57 跟貼 57

DPO「只看總分不看細節」？TI-DPO用Token重要性重塑大模型對齊

機器之心Pro 2026-02-11 13:45:57
0 跟貼 0

SIGGRAPH Asia 2025 | 讓3D場景生成像「寫代碼」一樣靈活可控

機器之心Pro 2025-11-14 19:18:57
0 跟貼 0
從AlphaGo到DeepSeek R1，推理的未來將走向何方？

機器之心Pro 2026-02-20 13:28:45
0 跟貼 0

不卷視頻卷造人？Pika推出AI Selves，讓你親手「養大」數字分身

機器之心Pro 2026-02-21 12:19:49
1 跟貼 1

北大團隊讓AI智能體「入侵」論壇，指揮真實機器人執行任務

新智元 2026-02-21 12:03:31
0 跟貼 0
硅谷大佬拒絕握手，印度AI峰會“槽點”不斷

第一財經資訊 2026-02-20 21:10:47
250 跟貼 250

App Store模式過時，未來屬于即興創作！Karpathy激進言論被懟慘

機器之心Pro 2026-02-21 12:28:27
1 跟貼 1
8500億美元！OpenAI刷新AI公司估值紀錄，斷層第一

都市快報橙柿互動 2026-02-20 16:49:27
353 跟貼 353
只有3年了！奇點之父終極警告：AGI來襲，千倍智能怪物爆誕？

新智元 2026-02-21 12:02:24
0 跟貼 0
OpenAI計劃2027年前推出人工智能智能音箱

環球網資訊 2026-02-21 09:38:52
14 跟貼 14
豆包AI手機究竟是人工智能還是人工智障？

每日經濟新聞 2026-01-13 22:08:29
0 跟貼 0
離婚十年前岳父找我借3萬我轉30萬，三天后前妻上門送來一份文件

擁抱抵不過時光 2026-02-19 06:11:47
3 跟貼 3
Agent2World來了，把世界模型做成可運行的符號環境

機器之心Pro 2026-02-02 15:24:04
5 跟貼 5
ClawHub迷之封殺操作，逼出首個Agent全球進化網絡

量子位 2026-02-20 15:41:42
9 跟貼 9
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0
7名中國游客貝加爾湖遇難目擊者：車兩三分鐘就沉了

極目新聞 2026-02-20 23:13:15
35665 跟貼 35665
Gemini最強版本上線：推理斷層領先，姚順宇預告更強版本還在路上

DeepTech深科技 2026-02-20 18:35:08
30 跟貼 30
春晚《賀花神》的背后：Seedance 2.0學會了東方美學

小思說 2026-02-18 12:22:06
0 跟貼 0
賈樟柯用AI拍短片，袁和平用豆包做彩蛋：AI會取代創作者嗎？

商道童言 2026-02-20 20:37:48
4 跟貼 4
郭麒麟王惠同臺，郭德綱后臺關注

煙寒若雨s 2026-02-21 07:18:58
0 跟貼 0
AI賦能武俠電影工業化：豆包Seedance助力《鏢人》片尾彩蛋

PChome電腦之家 2026-02-20 16:13:56
6 跟貼 6
對聯用 AI 寫，測完我真是醉了

科技狐 2026-02-20 22:41:24
0 跟貼 0
豆包你現在強的有點可怕

石頭的碎碎念 2026-02-18 09:03:42
0 跟貼 0
家居裝修類公眾號文章需要優質配圖，試試豆包精致又適配兩步搞定

太公筆調 2026-02-20 19:15:18
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個純粹為了好玩的人競爭

愛范兒 2026-02-20 17:25:49
3 跟貼 3
谷歌突發Gemini 3.1 Pro！推理性能×2

量子位 2026-02-20 09:24:13
25 跟貼 25
1979年中央決定撤掉吳忠，許世友為何扣下免職文件？結果如何

奔跑的麥兜 2026-02-20 12:48:26
0 跟貼 0
中國常駐聯合國代表傅聰重申：日本沒資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
3366 跟貼 3366
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
為啥蘇式武器一仿一個準，美式武器圖紙給你都沒法抄？

主宰穩場 2026-02-19 12:54:23
9 跟貼 9
美國F47新視頻公開，帶鴨翼又在抄作業了

三叔的裝備空間 2026-02-20 23:34:47
1 跟貼 1
白宮：臨時進口關稅將于美國東部標準時間2月24日零時01分生效

財聯社 2026-02-21 08:20:40
4 跟貼 4
天津2月房價最新出爐，這個區最高54807元/m2！

天津族 2026-02-21 07:34:38
0 跟貼 0
人氣火爆！江蘇無錫一景區發布限流公告

現代快報 2026-02-19 22:42:05
589 跟貼 589
哈爾濱冰雪大世界臨時閉園2天，網友稱有冰雕開始融化，客服稱正在修整，重新開園后門票降價100元

極目新聞 2026-02-19 23:22:54
321 跟貼 321
特斯拉新車正式下線：無方向盤、無踏板、無后視鏡；定價不高于3萬美元，“不需要人開，直接輸入目的地即可”

中國能源網 2026-02-20 19:18:19
1565 跟貼 1565
電影《鏢人》使用Seedance 2.0輔助設計片尾彩蛋

IT之家 2026-02-20 09:13:04
13 跟貼 13
用硅膠制作的美人魚模型，長得真是太恐怖了

樂活捕手 2026-02-19 08:18:06
13 跟貼 13

差評XPIN

用知識和觀點Debug the world！

10299文章數 489458關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

時尚

本地

軍事航空

手機 / 數碼

房產 / 家居

查資料做視頻寫代碼甚至畫 CAD，豆包這動手能力真有點離譜了

智譜上市1月漲5倍，市值超越京東、快手

夫婦撿到裝20多個紅包帆布袋：4個孩子7萬多的壓歲錢

夫婦撿到裝20多個紅包帆布袋：4個孩子7萬多的壓歲錢

冬奧第一"海王"？一人和13國選手都有關系

鏢人反超驚蟄無聲拿下單日票房第二！

一覺醒來，世界大變，特朗普改新打法了

態度原創

轉頭就暈的耳石癥，能開車上班嗎？

一個教師的2026年“不做清單”

2026紐約秋冬時裝周，在春天開啟美的新故事！

春花齊放2026：《駿馬奔騰迎新歲》

硬核揭秘！福建艦“一馬當先”底氣何在