不止是代碼生成：Qwen3-Coder在“感知-規(guī)劃-行動(dòng)”循環(huán)中的驚艷表現(xiàn)

2025-07-23 16:59:58　來源: 平凡AI

海外舉報(bào)

分享至

剛剛火速用Qwen3-Coder試了下我最近一直卡著的一個(gè)任務(wù)，先給大家看下消耗。這個(gè)任務(wù)跑了1個(gè)小時(shí)18分鐘，token的使用量input用了19萬多一點(diǎn)兒，output將近1萬。

你可能覺得這個(gè)數(shù)據(jù)好像還行，但是這是我前兩天跑的一樣的項(xiàng)目，我整整坐著看了3個(gè)多小時(shí)，實(shí)際上模型跑了22個(gè)小時(shí)多，吃掉了將近2880萬的token，一個(gè)小時(shí)1百萬，非常恐怖的消耗，且很貴。

我先來說一下我最近一直在搞的這個(gè)項(xiàng)目，其實(shí)需求很簡單，就是「爬蟲+可視化+AI feature」。

但是具體的要求有點(diǎn)兒復(fù)雜，你看我最開始的需求很長，且包含了大量的鏈接。

因?yàn)槲倚枰狝I幫我做一個(gè)英國funding機(jī)會(huì)的整合站，要求它針對于每個(gè)funding主體設(shè)計(jì)一個(gè)爬蟲，然后數(shù)據(jù)保存的時(shí)候要針對于數(shù)據(jù)類型的最大公約數(shù)進(jìn)行設(shè)計(jì)，這個(gè)其實(shí)很trick，比如UKRI這個(gè)主體下面有好幾個(gè)分部，比如EPSRC，ESRC等等，但是其他的主體就沒這個(gè)東西，所以只有在獲取到所有的funding信息后才能做這一步；最后做一個(gè)數(shù)據(jù)展示。

不過可惜的是，這個(gè)任務(wù)太復(fù)雜了，我直接給到這個(gè)頁面，大多數(shù)的AI都會(huì)被頁面里非常多的鏈接弄暈頭，失敗的有很多Claude-4-sonnet，Gemini-2.5-Pro。

所以我改變了策略，一個(gè)個(gè)的來，最后整合，我這里是在Qwen Code里面做的測試，結(jié)合Trae這個(gè)編輯器，可以很方便的比較代碼歷史記錄。

使用方法很簡單，先安裝Node.js，版本要在20及以上，然后在命令行輸入這兩行代碼。

npm install -g @qwen-code/qwen-code

qwen --version

然后輸入qwen就能激活下面的環(huán)境。

你需要配置下這三個(gè)參數(shù)，建議使用modelscope魔搭的API，速度很快，不過開源模型，后續(xù)會(huì)上的平臺(tái)會(huì)有很多。

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="your_api_base_url_here"
export OPENAI_MODEL="your_api_model_here"

我的第一句Prompt是讓Qwen3 Coder先了解我的主要需求，內(nèi)容如下：

做一個(gè)靜態(tài)網(wǎng)站，從我提供的funding body整合所有的funding opportunity，要用爬蟲爬取，整合所有的funding機(jī)會(huì)，并且用最大公約數(shù)來展示簡要和關(guān)鍵信息，打開之后跳轉(zhuǎn)到具體的funding詳細(xì)頁面

這個(gè)Prompt我在Claude和Gemini那得到的反饋都是直接給我來了一套框架，里面有詳細(xì)的前端代碼，后端代碼，爬蟲代碼，數(shù)據(jù)保存邏輯等，我最開始覺得這樣挺專業(yè)的，但是那3個(gè)小時(shí)的時(shí)間讓我發(fā)現(xiàn)，它的確可以生成非常多的代碼，但是后面稍微一改動(dòng)就是一大片，又慢又費(fèi)token。

Qwen3-Coder的思考邏輯很「克制」，表現(xiàn)就是它并沒有想著給我從哪找一套框架先放在當(dāng)前的文件夾里，它的任務(wù)分解跟其他的AI類似，但是順序不一樣，它提出的是先做爬蟲，然后數(shù)據(jù)存儲(chǔ)，最后做可視化。

也是這么一提示我，才讓我覺得有點(diǎn)兒上道了，本來不就應(yīng)該這樣嘛，你不得分析下數(shù)據(jù)是什么樣的再去設(shè)計(jì)存儲(chǔ)和可視化？

Qwen3-Coder拿到我給的UKRI鏈接后，就試著查看下了網(wǎng)頁信息，主要目的是找里面具體的funding信息。

定位的邏輯以及結(jié)果是很準(zhǔn)確的，把帶有opportunity字眼的鏈接找到了。

但是有個(gè)問題，那就是只有后面兩個(gè)才是我需要的信息。

但是代碼寫的很驚艷，那就是它“自主”的排除了opportunity/后面是空值和feed/的兩種情況，保留了正確的信息。

這一點(diǎn)兒我是沒有告訴它的，非常聰明。

因?yàn)槲疫@里有一個(gè)Claude Code的對比，對于同樣的任務(wù)，Claude設(shè)計(jì)了一個(gè)很復(fù)雜的邏輯，但其實(shí)結(jié)果很不理想，第一頁有10個(gè)funding機(jī)會(huì)，它每次都只能找到6，7個(gè)。

接下來它開始執(zhí)行爬蟲操作，這里碰到個(gè)問題，那就是代碼運(yùn)行沒報(bào)錯(cuò)，但是也沒有返回任何有用的信息。

這個(gè)挺正常的，因?yàn)榕老x總是需要修改幾次的，但是Qwen3-Coder的操作讓我有點(diǎn)兒大開眼界，它在之前的網(wǎng)頁分析中得知UKRI是有feed的，然后它竟然很聰明的測試了下feed，結(jié)果可行。

所以它就直接重構(gòu)了代碼用feed來獲取funding信息，結(jié)果不出意外的成功了，爬到的內(nèi)容用json格式來保存，都沒問題。

就這一點(diǎn)兒，我這兩天各種Agent試過不下20次，沒有一個(gè)找到用feed這個(gè)方法的。

接下來的網(wǎng)頁可視化沒問題，這一點(diǎn)兒對于絕大多數(shù)的AI都很簡單，但是有個(gè)問題，那就是它只爬取到了20個(gè)信息，而實(shí)際上UKRI的網(wǎng)站上有超過100+項(xiàng)目，然后我就提出了這個(gè)問題。

Qwen3-Coder的反應(yīng)的也很快，它做了兩個(gè)操作（1）看看Feed最大的數(shù)量是多少，結(jié)果是20，所以這條路走不通了（2）嘗試返回到老辦法，網(wǎng)頁直接獲取。

它接下來的操作是環(huán)環(huán)相扣的，可以很清楚的看到Agent需要的“感知-規(guī)劃-行動(dòng)”的循環(huán)一直都在，它行動(dòng)的每一步都進(jìn)行了細(xì)致的思考與調(diào)整。

這是最后做的半成品，從界面美觀度，說實(shí)話不如Claude做的那么花里胡哨，但是對于一個(gè)信息集合站來說也足夠了。

因?yàn)樽屛殷@喜的是這一步，就是在我點(diǎn)擊了其中一個(gè)funding后，它不是直接跳轉(zhuǎn)到真實(shí)的地址，而是有個(gè)中間步，就是類似于對于這個(gè)funding的簡要描述。

我覺得這個(gè)好的點(diǎn)有兩個(gè)：首先我沒有說，它這么做說明它“自主“的覺得這樣好，其次就是我本來就打算加一個(gè)AI功能，就是調(diào)用AI工具對funding先進(jìn)行初步的分析和篩選，最后做一個(gè)匹配。

那么多出來這一步，其實(shí)就是放AI分析的好去處。

與Qwen3-Coder的這次協(xié)作編程，整體體驗(yàn)下來非常流暢高效。首先它的任務(wù)成功率很高，處理長上下文的能力也很強(qiáng)。但最讓我驚喜的，還是它對我編程意圖的把握——基于這種深刻理解，它做出的幾次“自主”決策，其精準(zhǔn)度和前瞻性都相當(dāng)出色。憑借如此卓越的表現(xiàn)，再結(jié)合其開源這一關(guān)鍵優(yōu)勢，我認(rèn)為Qwen3-Coder已經(jīng)具備了真正撼動(dòng)Claude-4系列在編程領(lǐng)域領(lǐng)先地位的巨大潛力。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.