剛剛火速用Qwen3-Coder試了下我最近一直卡著的一個(gè)任務(wù),先給大家看下消耗。這個(gè)任務(wù)跑了1個(gè)小時(shí)18分鐘 ,token的使用量input用了19萬多一點(diǎn)兒,output將近1萬。
你可能覺得這個(gè)數(shù)據(jù)好像還行,但是這是我前兩天跑的一樣的項(xiàng)目,我整整坐著看了3個(gè)多小時(shí),實(shí)際上模型跑了22個(gè)小時(shí)多,吃掉了將近2880萬的token,一個(gè)小時(shí)1百萬,非常恐怖的消耗,且很貴。
我先來說一下我最近一直在搞的這個(gè)項(xiàng)目,其實(shí)需求很簡單,就是「爬蟲+可視化+AI feature」。
但是具體的要求有點(diǎn)兒復(fù)雜,你看我最開始的需求很長,且包含了大量的鏈接。
因?yàn)槲倚枰狝I幫我做一個(gè)英國funding機(jī)會(huì)的整合站,要求它針對于每個(gè)funding主體設(shè)計(jì)一個(gè)爬蟲,然后數(shù)據(jù)保存的時(shí)候要針對于數(shù)據(jù)類型的最大公約數(shù)進(jìn)行設(shè)計(jì),這個(gè)其實(shí)很trick,比如UKRI這個(gè)主體下面有好幾個(gè)分部,比如EPSRC,ESRC等等,但是其他的主體就沒這個(gè)東西,所以只有在獲取到所有的funding信息后才能做這一步;最后做一個(gè)數(shù)據(jù)展示。
不過可惜的是,這個(gè)任務(wù)太復(fù)雜了,我直接給到這個(gè)頁面,大多數(shù)的AI都會(huì)被頁面里非常多的鏈接弄暈頭,失敗的有很多Claude-4-sonnet,Gemini-2.5-Pro。
所以我改變了策略,一個(gè)個(gè)的來,最后整合,我這里是在Qwen Code里面做的測試,結(jié)合Trae這個(gè)編輯器,可以很方便的比較代碼歷史記錄。
使用方法很簡單,先安裝Node.js,版本要在20及以上,然后在命令行輸入這兩行代碼。
npm install -g @qwen-code/qwen-code
qwen --version
然后輸入qwen就能激活下面的環(huán)境。
你需要配置下這三個(gè)參數(shù),建議使用modelscope魔搭的API,速度很快,不過開源模型,后續(xù)會(huì)上的平臺(tái)會(huì)有很多。
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="your_api_base_url_here"
export OPENAI_MODEL="your_api_model_here"我的第一句Prompt是讓Qwen3 Coder先了解我的主要需求,內(nèi)容如下:
做一個(gè)靜態(tài)網(wǎng)站,從我提供的funding body整合所有的funding opportunity,要用爬蟲爬取,整合所有的funding機(jī)會(huì),并且用最大公約數(shù)來展示簡要和關(guān)鍵信息,打開之后跳轉(zhuǎn)到具體的funding詳細(xì)頁面
這個(gè)Prompt我在Claude和Gemini那得到的反饋都是直接給我來了一套框架,里面有詳細(xì)的前端代碼,后端代碼,爬蟲代碼,數(shù)據(jù)保存邏輯等,我最開始覺得這樣挺專業(yè)的,但是那3個(gè)小時(shí)的時(shí)間讓我發(fā)現(xiàn),它的確可以生成非常多的代碼,但是后面稍微一改動(dòng)就是一大片,又慢又費(fèi)token。
Qwen3-Coder的思考邏輯很「克制」,表現(xiàn)就是它并沒有想著給我從哪找一套框架先放在當(dāng)前的文件夾里,它的任務(wù)分解跟其他的AI類似,但是順序不一樣,它提出的是先做爬蟲,然后數(shù)據(jù)存儲(chǔ),最后做可視化。
也是這么一提示我,才讓我覺得有點(diǎn)兒上道了,本來不就應(yīng)該這樣嘛,你不得分析下數(shù)據(jù)是什么樣的再去設(shè)計(jì)存儲(chǔ)和可視化?
Qwen3-Coder拿到我給的UKRI鏈接后,就試著查看下了網(wǎng)頁信息,主要目的是找里面具體的funding信息。
定位的邏輯以及結(jié)果是很準(zhǔn)確的,把帶有opportunity字眼的鏈接找到了。
但是有個(gè)問題,那就是只有后面兩個(gè)才是我需要的信息。
但是代碼寫的很驚艷,那就是它“自主”的排除了opportunity/后面是空值和feed/的兩種情況,保留了正確的信息。
這一點(diǎn)兒我是沒有告訴它的,非常聰明。
因?yàn)槲疫@里有一個(gè)Claude Code的對比,對于同樣的任務(wù),Claude設(shè)計(jì)了一個(gè)很復(fù)雜的邏輯,但其實(shí)結(jié)果很不理想,第一頁有10個(gè)funding機(jī)會(huì),它每次都只能找到6,7個(gè)。
接下來它開始執(zhí)行爬蟲操作,這里碰到個(gè)問題,那就是代碼運(yùn)行沒報(bào)錯(cuò),但是也沒有返回任何有用的信息。
這個(gè)挺正常的,因?yàn)榕老x總是需要修改幾次的,但是Qwen3-Coder的操作讓我有點(diǎn)兒大開眼界,它在之前的網(wǎng)頁分析中得知UKRI是有feed的,然后它竟然很聰明的測試了下feed,結(jié)果可行。
所以它就直接重構(gòu)了代碼用feed來獲取funding信息,結(jié)果不出意外的成功了,爬到的內(nèi)容用json格式來保存,都沒問題。
就這一點(diǎn)兒,我這兩天各種Agent試過不下20次,沒有一個(gè)找到用feed這個(gè)方法的。
接下來的網(wǎng)頁可視化沒問題,這一點(diǎn)兒對于絕大多數(shù)的AI都很簡單,但是有個(gè)問題,那就是它只爬取到了20個(gè)信息,而實(shí)際上UKRI的網(wǎng)站上有超過100+項(xiàng)目,然后我就提出了這個(gè)問題。
Qwen3-Coder的反應(yīng)的也很快,它做了兩個(gè)操作(1)看看Feed最大的數(shù)量是多少,結(jié)果是20,所以這條路走不通了 (2)嘗試返回到老辦法,網(wǎng)頁直接獲取。
它接下來的操作是環(huán)環(huán)相扣的,可以很清楚的看到Agent需要的“感知-規(guī)劃-行動(dòng)”的循環(huán)一直都在,它行動(dòng)的每一步都進(jìn)行了細(xì)致的思考與調(diào)整。
這是最后做的半成品,從界面美觀度,說實(shí)話不如Claude做的那么花里胡哨,但是對于一個(gè)信息集合站來說也足夠了。
因?yàn)樽屛殷@喜的是這一步,就是在我點(diǎn)擊了其中一個(gè)funding后,它不是直接跳轉(zhuǎn)到真實(shí)的地址,而是有個(gè)中間步,就是類似于對于這個(gè)funding的簡要描述。
我覺得這個(gè)好的點(diǎn)有兩個(gè):首先我沒有說,它這么做說明它“自主“的覺得這樣好,其次就是我本來就打算加一個(gè)AI功能,就是調(diào)用AI工具對funding先進(jìn)行初步的分析和篩選,最后做一個(gè)匹配。
那么多出來這一步,其實(shí)就是放AI分析的好去處。
與Qwen3-Coder的這次協(xié)作編程,整體體驗(yàn)下來非常流暢高效。首先它的任務(wù)成功率很高,處理長上下文的能力也很強(qiáng)。但最讓我驚喜的,還是它對我編程意圖的把握——基于這種深刻理解,它做出的幾次“自主”決策,其精準(zhǔn)度和前瞻性都相當(dāng)出色。憑借如此卓越的表現(xiàn),再結(jié)合其開源這一關(guān)鍵優(yōu)勢,我認(rèn)為Qwen3-Coder已經(jīng)具備了真正撼動(dòng)Claude-4系列在編程領(lǐng)域領(lǐng)先地位的巨大潛力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.