<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      實(shí)測(cè)GLM-4.5:開(kāi)發(fā)出網(wǎng)頁(yè)版Excel,成本不到一杯奶茶錢

      0
      分享至



      上周,智譜 AI 正式發(fā)布開(kāi)源旗艦 MoE 架構(gòu)大模型 GLM?4.5,包含主模型( 355B 總參數(shù),激活參數(shù) 32B )和輕量版本 GLM?4.5?Air( 106B 總參數(shù),激活12B )。

      和 Kimi K2、Qwen3 Coder 類似,GLM?4.5 也是專為智能體任務(wù)打造,擅長(zhǎng)推理、編程及工具自動(dòng)調(diào)用能力。并且,參數(shù)量更少,只有 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3。

      API 價(jià)格上也相當(dāng)實(shí)惠,即便不算當(dāng)前的限時(shí)優(yōu)惠,輸入成本最高( 輸入長(zhǎng)度 32K-128K 范圍內(nèi) )4 元/百萬(wàn) token,輸出成本最高 16 元/百萬(wàn) token,這和 Kimi-K2 是一致的。之前知危曾提到,寫(xiě) 4 個(gè)小游戲和一個(gè)游戲網(wǎng)站,Kimi-K2只花了不到 17 塊錢。當(dāng)然,每個(gè)模型的 token 輸出量和調(diào)用工具次數(shù)有自己的特點(diǎn),最終的成本消耗不能只看價(jià)格。

      話不多說(shuō),這就隨手先在網(wǎng)頁(yè)端( chat.z.ai )上測(cè)一測(cè)。

      簡(jiǎn)單的 Flappy Bird、2048、Dino Run 等小游戲都沒(méi)問(wèn)題,z.ai 還提供了 artifact 功能即時(shí)演示效果。并且知危注意到,游戲界面的審美都是很舒服的。







      一鍵生成網(wǎng)站也挺有驚喜,讓 GLM-4.5 生成淘寶網(wǎng)站,商品卡片、篩選、搜索、加購(gòu)物車、付款、登錄功能,都全了,操作邏輯也沒(méi)問(wèn)題。就是有一個(gè) Bug,搜索撤銷之后,商品頁(yè)狀態(tài)無(wú)法還原。



      然后也是老規(guī)矩,寫(xiě)植物大戰(zhàn)僵尸。結(jié)果第一版就有比較完整的視覺(jué),代碼審美至少第一版來(lái)說(shuō)是目前看過(guò)同類模型寫(xiě)的最好的,Bug 不少,但能正常游玩。



      迭代了第二版,修改了很多問(wèn)題,包括:

      • 草坪和有效區(qū)域位置沒(méi)有對(duì)齊,
      • 僵尸移動(dòng)速度太快,
      • 缺乏開(kāi)始游戲、暫停游戲、重置游戲的功能,
      • 缺少僵尸剩余數(shù)量計(jì)數(shù)功能,
      • 缺少櫻桃炸彈植物,

      第二版邏輯上已經(jīng)比較完整,雖然解決完舊問(wèn)題可能會(huì)出現(xiàn)新問(wèn)題,但迭代能力還是值得認(rèn)可的。

      在前幾期,知危已經(jīng)測(cè)試了 Kimi-K2( 在 Claude Code 調(diào)用 )、CodeBuddy( 基于 Claude 4 Sonnet )寫(xiě)網(wǎng)頁(yè)游戲的極限表現(xiàn),并在開(kāi)發(fā)《 植物大戰(zhàn)僵尸 》的 “ 無(wú)限生存模式 ” 上推到了新的高度,代碼行數(shù)約為 2500 行,屬于初級(jí)或中級(jí)開(kāi)發(fā)者的難度。

      但辦公場(chǎng)景應(yīng)用就不同了,據(jù)了解,早期的 WPS 已經(jīng)是百萬(wàn)行級(jí)別的代碼量,場(chǎng)景復(fù)雜度更是不在一個(gè)量級(jí),需要中高級(jí)開(kāi)發(fā)者或團(tuán)隊(duì)才能完成。

      知危想測(cè)試代碼智能體在這個(gè)更具挑戰(zhàn)的場(chǎng)景下能推進(jìn)到什么程度。這就拿 GLM-4.5 試試,寫(xiě)一個(gè)網(wǎng)頁(yè)版的 Excel 。

      首先,知危分別嘗試了 z.ai 上的 artifact 和全棧開(kāi)發(fā),來(lái)寫(xiě)網(wǎng)頁(yè)版 Excel。

      提示詞:

      幫我寫(xiě)一個(gè)網(wǎng)頁(yè)版excel,實(shí)現(xiàn)以下功能:

      • 網(wǎng)格渲染:1000x1000 單元格虛擬渲染,滾動(dòng)性能良好;
      • 單元格編輯:雙擊進(jìn)入編輯狀態(tài),支持 Enter/Tab 移動(dòng),空值/默認(rèn)值處理;
      • 格式設(shè)置:字體大小、加粗、對(duì)齊、背景色(toolbar + 屬性欄);

      artifact 選用常規(guī)的 HTML/CSS/JavaScript 技術(shù)棧,寫(xiě)出了基本的形態(tài),但 Bug 不少。比如列號(hào)和行號(hào)重合了,傾斜功能用不了,清除格式也用不了等等。



      全棧開(kāi)發(fā)模式選用了比 HTML/CSS/JavaScript 更復(fù)雜的技術(shù)棧:



      文件組成也完全不同:



      該模式下開(kāi)發(fā)的初版就有很驚艷的效果,審美極佳,基礎(chǔ)輸入邏輯和滾動(dòng)邏輯也都沒(méi)問(wèn)題,UI 左邊還有詳細(xì)的單元格狀態(tài)欄展示。只是有更嚴(yán)重的 Bug,設(shè)置樣式、對(duì)齊、顏色就會(huì)報(bào)錯(cuò),也沒(méi)修復(fù)成功。

      而且,當(dāng)前 z.ai 只能維護(hù)一個(gè)項(xiàng)目的工作空間,替換項(xiàng)目后代碼容易丟失,不利于長(zhǎng)期維護(hù)。



      為了具備可靠的迭性,知危選擇和測(cè)試 Kimi-K2 類似的方式,將 GLM-4.5 接入 Claude Code,并在 Cursor 的終端里使用。

      智譜官方文檔( bigmodel.cn )也提供了接入方式說(shuō)明。



      這一次,知危全程沒(méi)看過(guò)代碼一眼,畢竟不像游戲,連數(shù)值都不需要調(diào),所以就不展示 Claude Code 生成過(guò)程和代碼細(xì)節(jié)了。

      接入 Claude Code 完成后,正式開(kāi)始網(wǎng)頁(yè)版 Excel 的開(kāi)發(fā)!

      第一版使用了和前面一樣的提示詞。



      在 Claude Code 框架下,GLM-4.5 還是選擇了更簡(jiǎn)單的 HTML/CSS/JavaScript 技術(shù)棧。

      初版已經(jīng)有較完善的單元格編輯功能,包括:

      • 雙擊進(jìn)入編輯,Enter保存輸入并自動(dòng)跳到右一格;
      • 還能給字體加粗、傾斜,調(diào)整字體大小,調(diào)整居中、居左、居右對(duì)齊,添加背景顏色;
      • 一鍵清除格式;

      就是滾動(dòng)功能有一個(gè)很明顯的 Bug,行號(hào)和列號(hào)都使用和單元格獨(dú)立的滾動(dòng)條,以至于不能對(duì)齊。

      另一個(gè)對(duì)實(shí)用性影響較小的 Bug 是,雙擊進(jìn)入編輯后,編輯框是偏離了單元格固定方向的紅色框,但畢竟不太好看。

      Excel 官方設(shè)置里,格式欄和單元格之間,有名稱框和編輯欄,名稱框顯示單元格坐標(biāo),是沒(méi)問(wèn)題的,編輯欄對(duì)應(yīng)當(dāng)前選中的單元格的值,官方設(shè)置是可編輯的,而目前 GLM-4.5 實(shí)現(xiàn)的版本是無(wú)法編輯的。



      后續(xù),我還想對(duì)齊 Excel,給字體增加更多格式,Enter/Tab 鍵移動(dòng)方向和官方設(shè)置一致,修復(fù)滾動(dòng)和編輯方面的 Bug,于是直接給 GLM-4.5 提了以下需求:

      • 格式設(shè)置再加上下劃線、刪除線功能;
      • Enter 鍵讓單元格向下移動(dòng),Tab 鍵讓單元格向右移動(dòng);
      • 編輯欄應(yīng)該是可編輯的,而不是只能靜態(tài)顯示單元格的值;
      • 橫坐標(biāo)( A,B,C 等 )、縱坐標(biāo)( 1,2,3 等 )需要和單元格直接對(duì)齊,不需要單獨(dú)的滾動(dòng)條,請(qǐng)修復(fù);
      • 雙擊單元格后會(huì)出現(xiàn)偏離單元格的編輯框,請(qǐng)將其與非編輯狀態(tài)的單元格重合;

      這一版的結(jié)果,第一個(gè)需求有名無(wú)實(shí),有功能鍵但沒(méi)實(shí)際效果,第二、三個(gè)需求實(shí)現(xiàn)了,第四個(gè)需求實(shí)現(xiàn)了一半,列號(hào)對(duì)齊了,行號(hào)出現(xiàn)了新的問(wèn)題,每個(gè)坐標(biāo)下多了一個(gè)間隔,第五個(gè)需求完全沒(méi)實(shí)現(xiàn)。

      Enter/Tab 鍵目前只能移動(dòng)一次,而 Excel 官方設(shè)置下每按一次都會(huì)移動(dòng)單元格。

      為修復(fù)這些殘留問(wèn)題,繼續(xù)給模型提了以下需求:

      • 下劃線、刪除線功能點(diǎn)擊后沒(méi)有對(duì)單元格格式產(chǎn)生實(shí)際效果,請(qǐng)修復(fù);
      • 加粗、傾斜、下劃線、刪除線按鈕的點(diǎn)擊效果( 變成綠色 )沒(méi)有互相獨(dú)立,請(qǐng)修復(fù);
      • Enter鍵讓單元格向下移動(dòng),Tab鍵讓單元格向右移動(dòng),這應(yīng)該是持續(xù)有效的,請(qǐng)修復(fù);
      • 縱坐標(biāo)( 1,2,3 等 )沒(méi)有和單元格正確對(duì)齊,請(qǐng)修復(fù);
      • 雙擊單元格后會(huì)出現(xiàn)偏離單元格的編輯框,請(qǐng)將其與非編輯狀態(tài)的單元格重合;

      跑完這個(gè)需求,Claude Code 就提示我,已經(jīng)花費(fèi)了 5 美元。



      我去 GLM-4.5 后臺(tái)( bigmodel.cn )看了一下,贈(zèng)送的 200 萬(wàn)通用 token 資源包花費(fèi)了 33 萬(wàn) token 。



      按目前 GLM-4.5 的資源包價(jià)格計(jì)算( 目前有 1 折優(yōu)惠,6.9 人民幣/1000 萬(wàn) token ),相當(dāng)于花費(fèi)了兩毛錢,就算以后沒(méi)有優(yōu)惠了,也就需要兩塊錢成本。



      這一版也不令人滿意,GLM-4.5 只修復(fù)了下劃線、刪除線生效,以及 Enter/Tab 鍵持續(xù)移動(dòng)的功能,其它需求都沒(méi)有滿足。



      查看這時(shí)的代碼總行數(shù),大概 800 行,對(duì)于 GLM-4.5 的上下文長(zhǎng)度 128K 而言不算多( 這個(gè)長(zhǎng)度預(yù)計(jì)能支持 2000 行左右的代碼生成和編輯 )。

      但為可靠性起見(jiàn),只能先認(rèn)定接下來(lái)一次只能可靠修復(fù) 1-2 個(gè)錯(cuò)誤,于是我把需求拆分,一次只提一個(gè),每次修改都在本地備份源代碼。

      接下來(lái)的需求是繼續(xù)解決試用后發(fā)現(xiàn)的新問(wèn)題:

      • 加粗、傾斜、下劃線、刪除線按鈕的點(diǎn)擊效果(變成綠色)沒(méi)有互相獨(dú)立,也沒(méi)有和對(duì)齊按鈕互相獨(dú)立,請(qǐng)修復(fù);

      對(duì)這個(gè)需求,GLM-4.5 只修復(fù)了和對(duì)齊格式之間的獨(dú)立性,字體格式功能鍵的獨(dú)立性仍然沒(méi)有實(shí)現(xiàn)。

      這時(shí)候我意識(shí)到,我使用的提示詞表述其實(shí)不太規(guī)范,而 Excel 問(wèn)世了那么多年,很多術(shù)語(yǔ)應(yīng)該都標(biāo)準(zhǔn)化了。

      知危與業(yè)內(nèi)在企業(yè)內(nèi)部落地代碼智能體的技術(shù)專家的交流中也了解到,即便是代碼智能體如此強(qiáng)大的當(dāng)下,提示詞的專業(yè)性、規(guī)范性對(duì)智能體的表現(xiàn)的影響也是非常顯著的。

      于是接下來(lái),我將提的每一個(gè)需求,都先發(fā)給 ChatGPT 優(yōu)化,再發(fā)給 GLM-4.5。



      對(duì)以下提示詞:

      • 加粗、傾斜、下劃線、刪除線按鈕的生效狀態(tài)( 變成綠色 )沒(méi)有互相獨(dú)立,也沒(méi)有基于每個(gè)單元格獨(dú)立顯示格式狀態(tài),請(qǐng)修復(fù);

      ChatGPT 提供了更專業(yè)和規(guī)范的版本:

      問(wèn)題描述: 富文本工具欄中的加粗、傾斜、下劃線、刪除線按鈕的狀態(tài)顯示存在問(wèn)題:

      • 當(dāng)前行為: 按鈕的“激活狀態(tài)”(變?yōu)榫G色)未基于當(dāng)前選中單元格的格式屬性單獨(dú)反映,且不同按鈕間狀態(tài)非獨(dú)立控制。
      • 期望行為: 各格式按鈕應(yīng)當(dāng)根據(jù)當(dāng)前選中的單元格樣式獨(dú)立判斷激活狀態(tài),即:
      • 若某單元格已加粗,則“加粗”按鈕應(yīng)自動(dòng)呈激活狀態(tài);
      • 各按鈕的狀態(tài)應(yīng)互不影響,且與其他單元格無(wú)關(guān);

      請(qǐng)修復(fù)上述狀態(tài)同步邏輯,使按鈕狀態(tài)與選中單元格的實(shí)際格式保持一致。

      這回終于成功解決了這個(gè)問(wèn)題。



      然后,我按同樣的方式解決雙擊單元格出現(xiàn)的編輯框與原單元格不重合的問(wèn)題,為簡(jiǎn)單起見(jiàn)就不再展示 ChatGPT 優(yōu)化后的提示詞。

      原提示詞:

      • 雙擊單元格后會(huì)出現(xiàn)偏離單元格的編輯框,請(qǐng)將其與非編輯狀態(tài)的單元格重合;

      結(jié)果發(fā)現(xiàn)這個(gè)問(wèn)題很磨人,雖然解決了,但出現(xiàn)了新的問(wèn)題,Enter/Tab 鍵失效了,跳到其它單元格后原來(lái)編輯的內(nèi)容不能保存。



      于是我繼續(xù)提修復(fù)需求:

      • 現(xiàn)在編輯態(tài)下的輸入框與該單元格在非編輯狀態(tài)下的邊界已經(jīng)完全重合,但輸入內(nèi)容后,按enter鍵無(wú)法向下一個(gè)單元格跳躍,如果切換選中的單元格,原來(lái)單元格輸入的內(nèi)容也沒(méi)有保存,請(qǐng)修復(fù)。

      然后,編輯框就暴走了,成了雙擊激活的剪貼板。



      到這里,只能先判斷編輯框的問(wèn)題不好修復(fù),暫且擱置,這時(shí)候就能感受到 vibe coding 中隨時(shí)本地備份的重要性。

      我跳回修復(fù)了字體格式獨(dú)立性的版本,繼續(xù)迭代。( 注意這種情況下,除了替換文件夾中的源代碼,也要清理 Claude Code 的上下文,在終端中輸入 /clear 就可以 )

      然后,我就開(kāi)始修復(fù)縱坐標(biāo)( 行號(hào) )與單元格對(duì)齊的問(wèn)題:

      • 縱坐標(biāo)( 1,2,3 等 )在滾動(dòng)后就沒(méi)有和單元格正確對(duì)齊,而是坐標(biāo)的每個(gè)值之間多了一個(gè)單元格的距離,請(qǐng)修復(fù);

      修改失敗,但沒(méi)有出現(xiàn)新的問(wèn)題。

      接下來(lái),我在官方文檔了解到,GLM-4.5 在調(diào)用模型時(shí)不是默認(rèn)最強(qiáng)的版本,而是會(huì)通過(guò)多因素權(quán)衡來(lái)靈活調(diào)用 GLM-4.5 或 GLM-4.5-Air 。



      https://docs.bigmodel.cn/cn/guide/develop/claude

      因此,為保證能夠解決更難的Bug,我參考官網(wǎng)說(shuō)明修改了~/.claude/settings.json 文件,強(qiáng)制只使用最強(qiáng)模型。



      并嘗試加強(qiáng)思考強(qiáng)度。Claude Code 有一個(gè)重要的使用技巧是,在提示詞中增加一些關(guān)鍵詞,可以極大提高解決問(wèn)題的能力,當(dāng)然 token 使用量也會(huì)暴增。

      具體來(lái)說(shuō),只要在提示詞最后加上“ think ”或 “ think hard ”、“ think harder ”、“ ultrathink ”,就能讓模型更積極地思考。

      思考強(qiáng)度排序如下:

      “ think ” < “ think hard ” < “ think harder ” < “ ultrathink ”

      其實(shí)我并不確定這個(gè)提示詞對(duì) Claude 以外的模型是否管用,但畢竟提示詞比程序靈活多了,試試也無(wú)妨。

      這是我接下來(lái)使用的提示詞( 經(jīng)過(guò)了 ChatGPT 優(yōu)化 ):

      問(wèn)題描述: 在滾動(dòng)表格區(qū)域后,縱向坐標(biāo)(即左側(cè)行號(hào),如1、2、3等)未與對(duì)應(yīng)行正確對(duì)齊。滾動(dòng)后,每個(gè)行號(hào)之間多出一個(gè)單元格高度的間距,導(dǎo)致視覺(jué)錯(cuò)亂。

      期望行為: 左側(cè)行號(hào)(縱坐標(biāo))應(yīng)始終與對(duì)應(yīng)的數(shù)據(jù)行精確對(duì)齊,滾動(dòng)不應(yīng)引入錯(cuò)位或間距異常。

      請(qǐng)修復(fù)行號(hào)渲染或滾動(dòng)同步邏輯,確保其與內(nèi)容區(qū)域垂直對(duì)齊。

      Think hard

      這一次真的成功了!雖然還有些位置偏移,但問(wèn)題不大,token 一次性消耗了 10 萬(wàn),按 GLM-4.5 的價(jià)格,也是能接受的。



      為了修復(fù)位置偏移的問(wèn)題,我繼續(xù)提需求,并加上 “ think harder ” 再提高一級(jí)思考強(qiáng)度,也是花費(fèi)了 10 萬(wàn) token,把問(wèn)題解決了。



      到這里,Excel 開(kāi)發(fā)的第一階段就基本完成了,雖然編輯框?qū)R問(wèn)題沒(méi)有解決有些難受,但因?yàn)椴挥绊憣?shí)用性,所以還能接受。debug 了許多步,代碼還是維持在 800 行的規(guī)模。

      雖然 debug 過(guò)程磕磕絆絆,但也算是摸索出了不少使用的技巧。即便 GLM-4.5 暫時(shí)還趕不上頂級(jí)編程模型的順暢體驗(yàn),疊加提示詞優(yōu)化、強(qiáng)制模型選擇、思考加強(qiáng)等 “ 魔法 ”,最終還是能順利地完成任務(wù)。

      在第二階段,知危打算繼續(xù)實(shí)現(xiàn)更多新功能,包括:

      • 添加/刪除行列操作
      • 復(fù)制剪切粘貼操作和快捷鍵
      • 行列選中和復(fù)制剪切操作
      • 撤銷、恢復(fù)功能鍵和快捷鍵
      • 行列拉伸操作
      • 單元格多選、行列多選操作
      • 格式刷功能鍵

      到這一步,其實(shí)每個(gè)需求看似簡(jiǎn)單,經(jīng)過(guò) ChatGPT 拆解后發(fā)現(xiàn)存在大量細(xì)節(jié),需要注意很多潛在的問(wèn)題。

      比如,增加行列的操作,原提示詞是這樣的( 為保證運(yùn)行效果,都加了第三等級(jí)的思考加強(qiáng) “ think harder ” ):

      • 增加行列操作,支持單擊行號(hào)、列號(hào)后,按=鍵往下添加1行,按-鍵刪除該行,并自動(dòng)調(diào)整行號(hào)或列號(hào)。

      經(jīng)過(guò) ChatGPT 拆解,是這樣的,ChatGPT 特別提醒實(shí)現(xiàn)功能時(shí)避免空值錯(cuò)誤,刪除后坐標(biāo)需要重排:

      功能名稱: 行列快捷操作支持( 基于行號(hào)/列號(hào)點(diǎn)擊 )

      功能說(shuō)明: 用戶在點(diǎn)擊左側(cè)行號(hào)或頂部列號(hào)后,可通過(guò)鍵盤快捷鍵快速添加或刪除整行/整列,具體行為如下:

      功能行為定義:

      添加行( 或列 )

      操作方式: 單擊選中某一行號(hào)( 或列號(hào) )后,按下 = 鍵;

      效果: 在當(dāng)前行( 或列 )下方插入一行( 或右側(cè)插入一列 );

      后續(xù)處理: 自動(dòng)更新所有行號(hào)( 或列號(hào) )以保持連續(xù)性。

      刪除行( 或列 )

      操作方式: 單擊選中某一行號(hào)( 或列號(hào) )后,按下 - 鍵;

      效果: 刪除當(dāng)前選中的行( 或列 );

      后續(xù)處理: 自動(dòng)更新所有行號(hào)( 或列號(hào) )以保持正確順序。

      注意事項(xiàng):

      快捷鍵生效前提是當(dāng)前焦點(diǎn)在行號(hào)/列號(hào)區(qū)域;

      刪除操作需避免刪除最后一行或列( 可添加最小保護(hù)機(jī)制 );

      添加/刪除后,需觸發(fā)表格內(nèi)容重排,并同步更新 UI;

      Think harder

      還有就是內(nèi)存管理也會(huì)越來(lái)越復(fù)雜,很多中間狀態(tài)在 UI 上是看不到的,但必須維護(hù)。比如實(shí)現(xiàn)撤銷恢復(fù)功能時(shí),如果不加管控,內(nèi)存可能不知不覺(jué)就爆炸。這是 ChatGPT 在優(yōu)化實(shí)現(xiàn)撤銷恢復(fù)提示詞時(shí)增加的提醒:

      限制建議:

      加入最大撤銷層數(shù)限制( 默認(rèn) 100 層 )以控制內(nèi)存;

      頁(yè)面刷新或數(shù)據(jù)清空應(yīng)清除操作棧;

      只經(jīng)過(guò)一次 debug,添加/刪除行列操作就實(shí)現(xiàn)了。



      實(shí)現(xiàn)復(fù)制剪切剪切操作、行列選中和復(fù)制剪切、撤銷和恢復(fù)操作、單元格拉伸操作( 單元格不是獨(dú)立拉伸的,時(shí)間關(guān)系就沒(méi)修復(fù),畢竟也能用 ),都很順利。需要注意的一點(diǎn)是由于功能拆解更復(fù)雜,所以都用了 “ Ultrathink ” 思考加強(qiáng),每跑一次大概花費(fèi) 30 萬(wàn) token 。









      當(dāng)然,這些功能也不是沒(méi)有小毛病,比如復(fù)制剪切后只能粘貼一次,選中行列后只能復(fù)制剪切不能統(tǒng)一修改字體格式等。

      在實(shí)現(xiàn)多單元格選中、多行選中功能時(shí),可能代碼長(zhǎng)度已經(jīng)逼近模型上下文極限了( 代碼總行數(shù) 1800 行左右 ),每次清空上下文跑一次都會(huì)觸發(fā) Claude Code 自動(dòng)壓縮上下文。

      甚至,模型還跑偏了方向,實(shí)現(xiàn)的功能和需求完全不搭邊,并花費(fèi)了 100 萬(wàn) token 。



      因此,我放棄了這個(gè)功能以及格式刷功能鍵的實(shí)現(xiàn),也放棄了最難的數(shù)值計(jì)算、數(shù)據(jù)檢索、數(shù)據(jù)可視化功能,只在第三階段補(bǔ)充比較簡(jiǎn)單的需求,把項(xiàng)目收尾。

      在收尾階段,關(guān)注的是外部因素,實(shí)現(xiàn)其作為辦公產(chǎn)品的完整形態(tài),包括里子和面子:

      • .json和.csv文件導(dǎo)出;
      • 整體UI的美化;

      這兩步都挺順利地實(shí)現(xiàn)了。以下是網(wǎng)頁(yè)上的數(shù)據(jù)狀態(tài):



      以下是分別導(dǎo)出的 .json 文件和 .csv 文件在微軟官方 Excel 上打開(kāi)的樣子( .json 文件也要把后綴改成 .csv 才能用官方 Excel 打開(kāi) ):





      最后一步的 UI 優(yōu)化效果,還是很驚艷的,風(fēng)格變化不大,但各種細(xì)節(jié)上的優(yōu)化包括滾動(dòng)動(dòng)畫(huà)、陰影、漸變等,使得視覺(jué)感受舒服了很多,GLM-4.5 再次展現(xiàn)了它的代碼審美水平。



      至此,我們對(duì) GLM-4.5 的評(píng)測(cè)結(jié)束。

      其實(shí),《 植物大戰(zhàn)僵尸 》的 2500 行代碼已經(jīng)能逼近 Claude 4 Sonnet 處理的極限( 上下文長(zhǎng)度 200K )。而具備 128K 上下文長(zhǎng)度的 GLM-4.5,最終在網(wǎng)頁(yè)版 Excel 的開(kāi)發(fā)中,寫(xiě)下了接近 3000 行代碼,完成了高度可交互的原型,已是相當(dāng)亮眼的成績(jī)。

      最終消耗的 token 總數(shù)是 600 萬(wàn),按當(dāng)前 GLM-4.5 資源包價(jià)格算,大約 4 塊錢成本,按非優(yōu)惠的輸入 token 價(jià)格 4 元/百萬(wàn) token 計(jì)算( 相比輸出消耗占大部分 ),并不計(jì)緩存,也就是 24 塊錢,常規(guī)使用的成本消耗大概會(huì)在 4-24 元的范圍內(nèi)。

      在開(kāi)發(fā)過(guò)程中,知危對(duì)代碼智能體的邊界有了更深的體會(huì)。

      GLM?4.5 的確具備了中高級(jí)開(kāi)發(fā)者的 “ 戰(zhàn)力 ”—— 它能一次性生成基礎(chǔ)功能完整、界面美觀、代碼風(fēng)格統(tǒng)一的產(chǎn)品雛形,幾百行代碼量的模塊也能較快成型,審美在目前所有中文編程大模型中屬于第一梯隊(duì)。

      但項(xiàng)目越往深走,便越顯艱難。網(wǎng)頁(yè)版 Excel 作為一款典型的高交互辦公應(yīng)用,不僅功能多,而且每個(gè)功能都牽一發(fā)而動(dòng)全身。

      Excel 處理的對(duì)象是更抽象的文本或數(shù)據(jù),格式、復(fù)制、數(shù)值計(jì)算等操作什么時(shí)候需要批量執(zhí)行、什么時(shí)候需要獨(dú)立執(zhí)行,有更大變化空間;長(zhǎng)鏈路操作下如何維護(hù)和優(yōu)化內(nèi)存,都會(huì)帶來(lái)新的復(fù)雜度;在迭代上,新功能是否需要泛化到其它操作,也是很關(guān)鍵的問(wèn)題;而且,這是工具型應(yīng)用,用戶精度要求高,不像《 植物大戰(zhàn)僵尸 》,僵尸判定攻擊的距離、植物與草坪對(duì)齊的程度等事件,可以有很大的彈性空間。因此,每多一個(gè)新功能,都可能給已有邏輯帶來(lái)干擾和未知的 Bug。

      這就對(duì)模型的持續(xù)調(diào)試能力、上下文一致性認(rèn)知提出了很高的要求。

      GLM?4.5 雖然上下文長(zhǎng)度達(dá)到 128 K,可以支撐較長(zhǎng)的代碼編輯,但一旦進(jìn)入 800-1800 行的范圍,模型對(duì)已有代碼的理解和操作準(zhǔn)確性也會(huì)顯著下降。

      因此,我需要將需求拆成小塊、頻繁清空上下文、保存本地代碼快照,并搭配提示詞的結(jié)構(gòu)化描述、術(shù)語(yǔ)標(biāo)準(zhǔn)化表達(dá)和 “ 思考強(qiáng)度增強(qiáng) ”( 如 “ think harder ”、“ ultrathink ” )等方法,才能維持開(kāi)發(fā)穩(wěn)定性。這些 “ 魔法技巧 ” 不是普通用戶( 比如網(wǎng)頁(yè)端用戶 )能隨手掌握的。

      相比之下,像《 植物大戰(zhàn)僵尸 》這類小游戲,雖然邏輯上涉及實(shí)時(shí)狀態(tài)、動(dòng)畫(huà)驅(qū)動(dòng)和事件聯(lián)動(dòng),數(shù)值調(diào)整需要手動(dòng)操作,測(cè)試的時(shí)間成本較高。但模塊結(jié)構(gòu)清晰,Bug 容忍度高,不涉及長(zhǎng)鏈路狀態(tài)維護(hù),因此智能體處理起來(lái)更輕松。后續(xù)即便不在優(yōu)化上花功夫,也可以直接通過(guò)代碼微調(diào)和模塊組合來(lái)豐富關(guān)卡設(shè)計(jì)。

      而類似 Excel 這種復(fù)雜的、抽象的數(shù)據(jù)型應(yīng)用場(chǎng)景,將是智能體必須攻克的高地。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      博爾特現(xiàn)狀:退役8年生3娃,每年領(lǐng)400萬(wàn)美元,39歲上樓都能喘氣

      博爾特現(xiàn)狀:退役8年生3娃,每年領(lǐng)400萬(wàn)美元,39歲上樓都能喘氣

      削桐作琴
      2025-12-25 17:32:09
      出大事了,烏克蘭發(fā)起斬首行動(dòng):91架戰(zhàn)機(jī)炸普京官邸,特朗普大怒

      出大事了,烏克蘭發(fā)起斬首行動(dòng):91架戰(zhàn)機(jī)炸普京官邸,特朗普大怒

      芳芳?xì)v史燴
      2025-12-30 10:29:34
      廣東高速堵瘋了!首個(gè)能泡溫泉的服務(wù)區(qū)開(kāi)業(yè),停車竟玩成度假

      廣東高速堵瘋了!首個(gè)能泡溫泉的服務(wù)區(qū)開(kāi)業(yè),停車竟玩成度假

      小怪吃美食
      2025-12-30 01:06:09
      上海人沸騰!多家確認(rèn):延長(zhǎng)!先提前做好這件大事,就在今天↗

      上海人沸騰!多家確認(rèn):延長(zhǎng)!先提前做好這件大事,就在今天↗

      申消費(fèi)
      2025-12-30 10:22:22
      美司令曾警告:若大陸武力收臺(tái),美軍將摧毀中方火箭軍和核武庫(kù)!

      美司令曾警告:若大陸武力收臺(tái),美軍將摧毀中方火箭軍和核武庫(kù)!

      壹知眠羊
      2025-12-21 07:15:19
      孫穎莎告別深大倒計(jì)時(shí),王楚欽東家放話:簽下莎莎!有望成大頭隊(duì)友

      孫穎莎告別深大倒計(jì)時(shí),王楚欽東家放話:簽下莎莎!有望成大頭隊(duì)友

      好乒乓
      2025-12-30 12:37:04
      25歲國(guó)足主力大婚!新娘氣質(zhì)出眾 申花眾隊(duì)友出席 81歲徐根寶致辭

      25歲國(guó)足主力大婚!新娘氣質(zhì)出眾 申花眾隊(duì)友出席 81歲徐根寶致辭

      我愛(ài)英超
      2025-12-29 21:46:23
      對(duì)等攔截!報(bào)仇不隔夜!1000萬(wàn)升走私燃料被截,背后竟是美國(guó)人?

      對(duì)等攔截!報(bào)仇不隔夜!1000萬(wàn)升走私燃料被截,背后竟是美國(guó)人?

      動(dòng)漫里的童話
      2025-12-30 10:00:29
      我們已經(jīng)找到了解決油輪被扣的辦法,老師分析太透徹了

      我們已經(jīng)找到了解決油輪被扣的辦法,老師分析太透徹了

      阿芒娛樂(lè)說(shuō)
      2025-12-29 12:46:03
      普京沒(méi)攪黃,特朗普沒(méi)逼簽,下月美國(guó)接著談,美媒:澤連斯基取得“保底勝利”

      普京沒(méi)攪黃,特朗普沒(méi)逼簽,下月美國(guó)接著談,美媒:澤連斯基取得“保底勝利”

      愛(ài)意隨風(fēng)起呀
      2025-12-30 12:55:49
      260億都不要!毛阿敏帶女兒去美國(guó)生活后,大家才知她有多清醒

      260億都不要!毛阿敏帶女兒去美國(guó)生活后,大家才知她有多清醒

      徐徐道史
      2025-12-28 08:01:36
      美司令:一旦中國(guó)在臺(tái)海設(shè)禁飛區(qū),美軍就只能擊沉解放軍的戰(zhàn)艦了

      美司令:一旦中國(guó)在臺(tái)海設(shè)禁飛區(qū),美軍就只能擊沉解放軍的戰(zhàn)艦了

      浮光驚掠影
      2025-12-12 23:27:34
      晚飯七分飽被推翻了?醫(yī)生調(diào)查:過(guò)了56歲,吃飯盡量要做到這5點(diǎn)

      晚飯七分飽被推翻了?醫(yī)生調(diào)查:過(guò)了56歲,吃飯盡量要做到這5點(diǎn)

      39健康網(wǎng)
      2025-12-28 20:31:10
      當(dāng)下,請(qǐng)你做好隨時(shí)失去一切的準(zhǔn)備。

      當(dāng)下,請(qǐng)你做好隨時(shí)失去一切的準(zhǔn)備。

      詩(shī)詞中國(guó)
      2025-12-28 17:43:04
      長(zhǎng)期腦力工作的人會(huì)沉迷簡(jiǎn)單的體力勞動(dòng)!網(wǎng)友:像是發(fā)現(xiàn)了新大陸

      長(zhǎng)期腦力工作的人會(huì)沉迷簡(jiǎn)單的體力勞動(dòng)!網(wǎng)友:像是發(fā)現(xiàn)了新大陸

      另子維愛(ài)讀史
      2025-12-23 16:31:52
      山楂配它煮一煮,淤血暢通了,手腳冰涼好了、臉蛋粉嫩氣色好!

      山楂配它煮一煮,淤血暢通了,手腳冰涼好了、臉蛋粉嫩氣色好!

      健身狂人
      2025-12-30 10:45:21
      NBA最強(qiáng)豬隊(duì)友?63萬(wàn)臨時(shí)工干傷世界籃球第一人!約基奇轟然倒下

      NBA最強(qiáng)豬隊(duì)友?63萬(wàn)臨時(shí)工干傷世界籃球第一人!約基奇轟然倒下

      籃球看比賽
      2025-12-30 11:36:48
      馬伊琍更新動(dòng)態(tài),新造型引發(fā)網(wǎng)友吐槽:從頭到腳都難看,眼里無(wú)光

      馬伊琍更新動(dòng)態(tài),新造型引發(fā)網(wǎng)友吐槽:從頭到腳都難看,眼里無(wú)光

      小咪侃娛圈
      2025-12-30 09:46:35
      營(yíng)業(yè)近10年,又一網(wǎng)紅店扛不住:曾排隊(duì)2小時(shí),今一地門店全關(guān)

      營(yíng)業(yè)近10年,又一網(wǎng)紅店扛不住:曾排隊(duì)2小時(shí),今一地門店全關(guān)

      財(cái)經(jīng)八卦
      2025-12-29 21:26:57
      馬云預(yù)言兌現(xiàn)?2026年手上還握有存款的人,別忽視這三大現(xiàn)實(shí)

      馬云預(yù)言兌現(xiàn)?2026年手上還握有存款的人,別忽視這三大現(xiàn)實(shí)

      來(lái)科點(diǎn)譜
      2025-12-29 09:01:09
      2025-12-30 14:12:49
      知危 incentive-icons
      知危
      投資不立危墻之下
      515文章數(shù) 1829關(guān)注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開(kāi)始批量"制造"小獨(dú)角獸

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習(xí)

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習(xí)

      體育要聞

      這個(gè)59歲的胖子,還在表演“蝎子擺尾”

      娛樂(lè)要聞

      林俊杰官宣文案爭(zhēng)議!女方名字都不提

      財(cái)經(jīng)要聞

      朱光耀:美關(guān)稅政策正使WTO名存實(shí)亡

      汽車要聞

      標(biāo)配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態(tài)度原創(chuàng)

      旅游
      本地
      手機(jī)
      游戲
      公開(kāi)課

      旅游要聞

      博物館里迎新年,濟(jì)南文博活動(dòng)再“上新”

      本地新聞

      即將過(guò)去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

      手機(jī)要聞

      榮耀 Power2 官宣:搭載第二代鴻燕通信,主打超強(qiáng)續(xù)航

      大話手游首個(gè)數(shù)字交易大服上線!【二〇二六】開(kāi)服刷新大話記錄

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日本熟妇浓毛hdsex| 色情一区二区三区免费看| 柯坪县| 中文字幕日韩国产精品| 少妇被多人c夜夜爽爽| 色伊人综合| 国产精品集合| 亚洲 制服 丝袜 无码| 情欲少妇人妻100篇| 亚洲欧洲AV| 淫射网| 东京热无码国产精品| 亚洲色无码国产精品网站可下载 | 亚洲综合激情另类小说区| 欧美性受xxxx白人性爽| 91高清免费| 欧美亚韩一区二区三区| 91偷拍视频| 真人作爱90分钟免费看视频| 国内精品久久久久伊人aⅴ| 影音先锋在线视频| 亚洲av无码成人影院一区| 国产露脸无套对白在线播放| 国产精品人| 拍国产真实乱人偷精品| 精品无码久久久久国产电影| 亚洲黄色AV| 妖精色av无码国产在线看| 亚洲3p| 国模无码在线| 国产精品乱码一区二区三区| 亚洲视屏| 日本丰满熟妇hd| 无码人妻黑人中文字幕| 97超碰自拍| 免费av在线| 亚洲AV日韩AV综合在线观看| 一本大道东京热无码视频 | 99中文字幕精品国产| 国产精品久久久久久久久久| 亚洲精品666|