大家好,我是冷逸。
朋友們,給大家看看我折騰了好幾天整的公眾號(hào)寫作神器「Auto-Wechat writing」。
它能做什么?
只需簡單輸入內(nèi)容主題和創(chuàng)作要求(比如字?jǐn)?shù)、關(guān)鍵內(nèi)容點(diǎn)),就能調(diào)用寫作styles一鍵直出公眾號(hào)正文、標(biāo)題、摘要和封面圖,支持自由接入各種模型。
出來的文字,人味很足,朱雀檢測“人工創(chuàng)作特征顯著”,全部文字我放今天的次條了。
![]()
項(xiàng)目已開源,歡迎大家star。
![]()
開源鏈接:https://github.com/lengyi2030/Auto-wechat-writing
目前還只是1.0版本,我會(huì)不斷迭代這個(gè)項(xiàng)目,后面給它加入寫作風(fēng)格訓(xùn)練、寫作類型選擇(不限于公眾號(hào))、自動(dòng)同步到公眾號(hào)后臺(tái)以及自動(dòng)生成文章插圖等功能,希望大家多多三連支持,感謝了。
![]()
開發(fā)思路拆解
為什么要做這個(gè)東西?一開始主要還是自己需要。
因?yàn)槲易约旱膶懽髁鞒叹褪牵?/p>
先寫正文,完成框架、觀點(diǎn)和全文,期間配圖也會(huì)同步制作。
確定正文后,根據(jù)全文來起標(biāo)題、摘要(AI會(huì)加入進(jìn)來)。
同步,根據(jù)標(biāo)題和摘要制作封面圖。
最后,排版、發(fā)布。
![]()
最近,我就在琢磨,看能不能搞一個(gè)全自動(dòng)的寫作工具。剛好智譜這幾天上線了新模型GLM-5.1,看大家的實(shí)測,特別擅長長程任務(wù),于是我把它接到Claude Code里開整,也借此測一下這個(gè)模型。
我的需求其實(shí)蠻多的,用口語描述了一大堆功能。
給我做一個(gè)“沃垠AI寫作神器”的全功能網(wǎng)站,可在本地運(yùn)行。
功能要求:
1、有三個(gè)核心功能:正文生成、標(biāo)題摘要生成(先生成正文后,再根據(jù)正文來生成標(biāo)題和摘要)、封面生成。正文、標(biāo)題摘要接同一個(gè)模型,圖片接另外一個(gè)模型。
2、主界面有一個(gè)輸入會(huì)話框,給到示例模板“幫我寫一篇公眾號(hào)文章,主題是xx,字?jǐn)?shù)xx,內(nèi)容要點(diǎn)有:1.xx,2.xx……”,用戶輸入內(nèi)容主題和寫作要求后,開始調(diào)用大模型進(jìn)行寫作。
3、輸入會(huì)話框設(shè)計(jì)有“聯(lián)網(wǎng)”功能,支持用戶手動(dòng)打開和關(guān)閉聯(lián)網(wǎng)功能。
4、輸入會(huì)話框還設(shè)計(jì)有風(fēng)格1、風(fēng)格2等可選的寫作風(fēng)格模板。目前只有一個(gè)“風(fēng)格1:科技媒體評(píng)論”,風(fēng)格控制Prompt見本地文件“風(fēng)格1:科技媒體評(píng)論.txt”。
5、寫作和生圖均支持用戶自行調(diào)用大模型。調(diào)用接口設(shè)計(jì)成可視化窗口,用戶只需要輸入模型url、模型key和模型名字,就可以使用。
5、先寫正文,寫完正文后,再批量出一批標(biāo)題和摘要,供用戶選擇。
6、最后,再根據(jù)本文的核心內(nèi)容提煉2-3個(gè)關(guān)鍵內(nèi)容點(diǎn),并生成封面圖片的文生圖prompt,統(tǒng)一尺寸比例2.35:1,用戶選定某個(gè)prompt后,調(diào)用生圖模型一鍵生成封面圖片。
7、正文和標(biāo)題摘要,都設(shè)計(jì)有復(fù)制按鈕,支持用戶一鍵復(fù)制文本。封面圖片,設(shè)計(jì)有下載按鈕,支持用戶下載到本地。
先給我設(shè)計(jì)網(wǎng)站開發(fā)的產(chǎn)品需求文檔。待我確認(rèn)產(chǎn)品需求文檔后,再進(jìn)行具體的開發(fā)。整體要求架構(gòu)清晰、功能完整,網(wǎng)站真實(shí)可用,代碼安全。
如果你直接讓大模型one shot去做一個(gè)成品,這大概率是做不出來的……所以,我們先讓它寫一份PRD(產(chǎn)品需求文檔)。
![]()
我拿到PRD后,微調(diào)了一下,讓它根據(jù)定稿版PRD進(jìn)行開發(fā)。
![]()
這是一個(gè)前后端都有的輕量級(jí)項(xiàng)目,先簡單過一下架構(gòu)。
![]()
主要就三層:后端用Express服務(wù)入口,負(fù)責(zé)啟動(dòng)服務(wù)器、加載中間件和掛載路由;前端用原生HTML+JS,加載速度快,開發(fā)成本低;styles風(fēng)格系統(tǒng),是一個(gè)外部掛載,支持用戶自己編輯、創(chuàng)建“風(fēng)格.txt”來微調(diào)AI的寫作風(fēng)格。
核心的內(nèi)容生成環(huán)節(jié),它做了一個(gè)路由層 (routes/)。article.js負(fù)責(zé)處理正文生成,可以流式輸出;titles.js負(fù)責(zé)批量生成標(biāo)題和摘要;cover.js負(fù)責(zé)封面生成,提供Prompt生成+圖片下載的功能。
API配置,則是存在瀏覽器localStorage中,做到了安全合規(guī)。
對(duì)于一個(gè)輕量級(jí)網(wǎng)站來說,這個(gè)架構(gòu)是比較成熟且結(jié)構(gòu)清晰的,沒有過渡設(shè)計(jì)。我想要實(shí)現(xiàn)的功能,它基本都規(guī)劃進(jìn)來了。
先看第一版。
![]()
功能大體上做出來了,但是前端太單一,我給了它一些資料和前端設(shè)計(jì)要求,讓它進(jìn)行優(yōu)化。
![]()
優(yōu)化后的前端,果然耐看了很多。
![]()
我們填入API,沖。
![]()
不出意外的話,報(bào)錯(cuò)果然來了……這其實(shí)不能怪它,怪我自己,API格式不對(duì)。前面我填的是anthropic格式的API,而非OpenAI格式的API。
![]()
在調(diào)整API接口后,它真的能生成文章了。
![]()
平時(shí),用慣了別人幾十上百個(gè)工程師窮究集體智慧做出來的工程化產(chǎn)品,總覺得不以為然,現(xiàn)在看到自己手搓的毛坯產(chǎn)品也能正常生成,這種感覺真的挺奇妙的。
就像最近張雪的采訪視頻里,有一句話讓我真的想了好幾天——程前問他初中學(xué)歷怎么就敢去干發(fā)動(dòng)機(jī)?他不做任何思考就說了一句“不會(huì)就學(xué)啊”。
![]()
是啊,不會(huì)就學(xué),不服就干,多么簡單的道理。
對(duì)于我開發(fā)這個(gè)項(xiàng)目也是,不會(huì)你就問AI啊,總能有結(jié)果的。
于是,后續(xù)測試過程中,陸續(xù)出現(xiàn)生成標(biāo)題報(bào)錯(cuò)、生成圖片報(bào)錯(cuò)……沒關(guān)系,我們直接跟GLM-5.1聊,讓它修復(fù)。
![]()
后面,我又迭代了大半天。主要是API接口調(diào)了很久,每家云廠商甚至每個(gè)模型的格式、接口和要求都有些細(xì)微的區(qū)別。
最終看到封面圖也搞定的那一刻,我覺得這個(gè)項(xiàng)目成了。
![]()
再給大家看下整個(gè)的演示流程。
目前,完整項(xiàng)目已經(jīng)開源放在了Github上,歡迎大家使用和Star。上傳Github我也比較懶,直接讓GLM-5.1幫我搞定的。
![]()
開源地址:https://github.com/lengyi2030/Auto-wechat-writing
使用方式,也很簡單。先把這個(gè)項(xiàng)目clone到本地,然后本地npm start,然后接入API就可以用了。
![]()
寫作這塊,文本模型推薦GPT、Qwen、DeepSeek和GLM,圖片模型推薦banana或seedream,API記得要選OpenAI標(biāo)準(zhǔn)協(xié)議的url。
我不知道,這個(gè)項(xiàng)目對(duì)于大家來說有沒有幫助,但對(duì)于我來說是真的受用。
后面,我還會(huì)繼續(xù)迭代風(fēng)格提示詞,以及給它增加導(dǎo)入到公眾號(hào)后臺(tái)、配圖生成、分發(fā)插件等功能,那對(duì)于我來說就真的完全自動(dòng)化了。
![]()
整個(gè)體驗(yàn)下來,GLM-5.1在長程任務(wù)開發(fā)這塊還是挺強(qiáng)的。
我主要開發(fā)時(shí)間是在昨天。給大家看下我的真實(shí)token消耗量,這個(gè)項(xiàng)目一共跑了1300萬tokens。
![]()
從首次輸入需求到最后上傳Github,與CC對(duì)話了大概30多次,調(diào)試了近10個(gè)版本,最后燒掉1300萬tokens,交付了一個(gè)我覺得是非常solid的東西。
期間,還調(diào)用了檢索、代碼、測試和API等工具進(jìn)行開發(fā),也都能穩(wěn)定銜接。1300萬tokens的任務(wù)開發(fā),始終能夠能夠跟目標(biāo)保持一致,并未丟失,也沒有跑偏。
看來,GLM-5.1在長程任務(wù)這塊還是有點(diǎn)東西的
長程任務(wù),它不同于one shot的showcase。
one shot更多是看前端,看審美,跑出來的demo能看但不能用。而長程任務(wù)不關(guān)心你酷不酷,而是要看最終出來的東西能不能用,能不能進(jìn)入生產(chǎn)環(huán)境。
從我的實(shí)測來看,GLM-5.1的表現(xiàn)是合格的。
要是能開源的話,那就更好了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.