大家好,我是被智譜卷到的袋鼠帝。
昨天智譜剛把GLM-4.7放出來,群里就有老哥找我寫文章了..
![]()
智譜也太卷了,于是,我又被迫加班了
從平安夜奮戰到了圣誕節,終于在今天把這篇文章發出來了,不容易啊
正好我一直以來想做一個產品,我這次用Codex + GLM-4.7 + Claude Code,從0到1做了一個一鍵生成海外營銷數字人短視頻的平臺(MVP項目)
我覺得作為半天內搓出來的項目已經相當nice,具體的開發經驗稍后分享。
在這之前,我先跟大家說說GLM-4.7這次更新了些什么
這次升級的點,其實很集中,基本就落在四個關鍵詞上:前端、全棧、Agent、寫作。
1.前端更漂亮了:GLM-4.7這次前端審美大幅提升了,生成的前端將會更好看;
2.編程能力提升:提升多語言編程能力(全棧開發能力),開發復雜項目更得心應手;
3.Agent能力更強了:工具調用能力提升,在τ2-Bench交互式工具調用評測中得到87.4分,成為開源SOTA,超過了Claude Sonnet 4.5。提升了數學和推理能力,在HLE(人類最后的考試)基準測試獲得42.8%,較GLM-4.6提升41%,超過了GPT-5.1
4.Code榜殺瘋了:在Lmarena的全世界Code盲測排行榜上排名第6,超越了GPT-5.2。
5.情商也更高了,寫作和角色扮演方面也有加強。
![]()
其實這些跑分我都看麻了,現在我主要看Lmarena的排行,因為這里是全世界所有人盲測投票出來的結果。
GLM-4.7作為開源模型,在編程方面能干到世界第6也是挺意外的
![]()
打造出海營銷數字人平臺
再回到我比較關心的事兒。
這些升級,能不能在一個真實產品里兌現呢。
所以我這次不想搞Case了,也不搞什么花活
我用Codex + GLM-4.7 + Claude Code,嘗試在一天之內,做完一個海外營銷數字人短視頻生成平臺的MVP。
現在回頭看,這個想法本身,其實比結果更有意思。
我先簡單說下這個MVP項目是干啥的。
邏輯比較清晰,大概率能賺米:
一段口播(音頻)+數字人結合產品(圖片)+視頻Prompt(文字)=數字人營銷短視頻
文案由GLM-4.7生成,通過TTS(可以用開源的index-tts)轉成語音
圖片可以由香蕉 Pro生成,也可以自己上傳
視頻Prompt也可以由GLM-4.7生成
最后的數字人由開源的infiniteTalk模型生成
流程大致如下:
![]()
這不是隨便搞的,而是一個真實存在需求的產品形態。
因為我最近一直在研究AI數字人視頻的開源方案,現在數字人開源方案逐漸成熟,并且效果已經很不錯了,但是真正卡住大家的,不是模型效果,而是把這些能力整合成一個完整產品的工程。
這個平臺,把制作數字人短視頻SOP化了,而且的本很低,意味著可以把AI數字人的價格打下來。
而正好,GLM又升級了,好像除了用GLM-4.7,沒有別的更好的選擇了,畢竟這是目前接入Claude Code性價比最高的模型
對了,用量大可以選擇包月,更劃算,文末有折扣二維碼
這次開發的平臺難度有點高,我刻意把節奏放慢了一點,沒有一上來就寫代碼。
現在AI做任何事情,上下文才是關鍵
所以第一步,我們需要花大量的時間在寫需求上。
頁面長啥樣?用戶咋流轉?哪里同步哪里異步?用誰的API?數據庫存啥?
這個階段的初期,其實非常反AI,全是人腦在工作。
但如果你跳過這一步,后面就會發現,靠模型寫得越快,返工越狠,離你的預期越來越遠。
第二步,我把自己梳理的需求初稿交給了接入了GLM-4.7的Codex。
codex梳理需求很好用,GLM-4.7接入Codex的方法,放到最后了
不是讓它寫代碼,是讓它幫我評審需求,挑毛病,找出待確認的地方,然后不斷跟它對話,對齊需求,這幾輪來回,非常重要。
因為它逼著你把腦子里那些模糊的想法,變成可以落地的更詳細的需求。
最后,GLM-4.7給我輸出了一份一千三百多行的超詳細的需求文檔。
從技術架構、選型到接口定義,從數據庫表結構到前端UI布局等9大塊(見上圖),幾乎把后面所有容易出問題的地方都提前鋪平了。
![]()
![]()
第三步:梳理需要用到的第三方API(請求、響應示例、apikey等)、數據庫信息(地址、端口、用戶名、密碼、數據庫名稱)
![]()
第四步:直到這一步,我才讓GLM-4.7+Claude Code進場。
還是不要一上來就寫代碼,先執行/init,讓Claude Code熟悉目錄下的所有文件,包括需求文檔
然后開Plan Mode(計劃模式)制定一個開發計劃。
![]()
確認沒問題之后,才開始一段一段往下寫。
![]()
開發完成之后,可以讓GLM-4.7幫忙快速啟動前后端(過程中需要下載相關依賴,它都完成得很好)
不過這個任務還是太復雜了點,不僅有復雜的業務邏輯,還集成了大量AI能力
GLM-4.7一次性跑完之后是有一些Bug的。
但我覺得現階段應該不會有模型能一次完成得很好,而且沒有bug。
這里我有一個非常明顯的體感變化:
以前我用大模型寫復雜項目,最怕啥?最害怕的不是寫不出來,而是改Bug。
讓它修一個報錯,它可能順手把旁邊已經穩定的功能一起改了....
然后bug就越改越多,甚至還會為了完成任務造假,最后整個項目可能都改廢了。。
這種感覺就像你讓他修廚房的水龍頭,他修好了,但回頭把你衛生間的水管給踩爆了。這種按下葫蘆浮起瓢的感覺,真的讓非常抓狂!
以前用一些規則和或者直接在Input Prompt里面約束會稍微好一點點
這次GLM-4.7牛逼的地方在于,它知道邊界在哪。
能判斷清楚這個問題屬于哪個模塊,影響邊界在哪里,只在必要的位置做修復。
這會讓你真正敢放手把項目持續交給它推進,而不是每一步都擔驚受怕,動不動就要回滾。
每找到一個問題,它都能立馬解決,整個項目非常確定的在朝著越來越好的方向發展,這一點就足以封神了
GLM-4.7的審美和前端能力也有明顯的提升,特別是在一些小細節上
你看這邊框的流光

這個卡片的聚光燈效果,也非常棒

整個過程需求、各種API信息整理大概3個小時
編碼和調試花了4個多小時,這里面包含了,前端的UI設計,功能邏輯,后臺的接口、功能,還有跟數據庫,以及第三方API的交互等等。
最后,一個功能完整、界面效果也不錯的出海營銷數字人短視頻生成平臺(MVP項目),就這樣跑通了。
還有一個點,更現實。
Claude Code,本身就非常消耗token,如果用國外的模型,我可能會下意識壓縮提示詞,減少上下文。
不是不想給信息,是錢包著不住...但開了GLM Coding Plan包季的我變得非常豪橫,瘋狂給Claude Code灌信息,因為試錯成本很低。
我不再擔心每一次修改的成本,關注的重心完全回到了結果本身。
當然,現階段GLM-4.7在特別長的任務里,偶爾還是會忘記早期的一些設定,需要你提醒。
一次性生成的復雜項目,也然需要人工Review和微調。
但技術本身正在被GLM系列的開源模型快速平權。
特別是從GLM-4.5開始,我就覺得智譜在大模型方面越來越對味了。
我還記得7月底的廈門之行,我們一眾博主在一起討論,都發自內心的被GLM-4.5的編程能力所驚艷。
直到國慶前幾天,GLM-4.6又出來了,再次屠榜。時隔2個多月,又到4.7,編程和Agent能力都在不斷升級,感覺這速度也忒快了,下半年開始就跟開了掛一樣。
盲猜GLM-4.8或者GLM-5將在春節前夕發布。
希望下一代的GLM模型能原生集成多模態,在上下文長度方面再次突破,那將是一個在編程和Agent無敵的存在了。
所以,其實現在代碼越來越不是事兒了,誰能找到需求、痛點,用最低成本,最快的速度把流程跑通,誰就是贏家。
我發現周圍開始靠Vibe Coding賺到錢的人,大多不懂代碼。
我也一直都覺得,AI時代,程序員好像反而是最難靠coding賺錢的人。
但是最近我思考了很多,我還是想打造自己的產品,我希望曾經引以為傲的技術能力,在AI時代更能放大它的價值。
接入Claude Code和Codex
接入Claude Code:
把下面的配置寫到Claude Code的setting.json配置文件中
}接入Codex:
第一步:把下面這些配置寫到codex的config.toml
model_provider = "glm"第二步,設置環境變量。
在你的終端里,執行以下命令,注意:把GLM_API_KEY替換成你自己的APIKey。
export GLM_API_KEY="你的GLM_API_KEY"如果是Windows可以在PowerShell里面執行:
$env:GLM_API_KEY = " "第三步,使用codex --profile glm命令,指定模型來啟動,這樣Codex就會默認使用我們配置好的GLM-4.7模型了。
GLM Coding Plan優惠與小彩蛋
我是之前300直接包季了,在時間內不用考慮token消耗,就算開發項目瘋狂用,也沒有限流過, 挺爽的。
![]()
我還給大家爭取到了專屬優惠,掃描下面二維碼,可以領取Coding Plan所有套餐的8折優惠券。
![]()
最后的最后,如果你也在觀望AI編程,不妨給自己設一個具體目標,哪怕只是一個很小的產品,先把東西做出來。
很多答案,只有在真正跑通的那一刻,才會變得清楚。
你會愿意把核心產品的第一版,交給AI一起完成嗎?歡迎評論區交流~
我是袋鼠帝,持續分享AI實踐干貨,我們下期見
能看到這里的都是鳳毛麟角的存在!
如果覺得不錯,隨手點個贊、在看、轉發三連吧~
如果想第一時間收到推送,也可以給我個星標?
謝謝你耐心看完我的文章~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.