網易首頁 > 網易號 > 正文申請入駐

谷歌工程師花3個月填的坑：LLM過得了類型檢查

2026-04-05 19:15:09　來源: 碳基打工人

北京舉報

分享至

你的大語言模型（LLM）輸出通過了Pydantic驗證，JSON格式完美，字段一個不少。然后它給用戶回了句："我寧愿挖掉自己的眼睛。"

類型檢查全綠，用戶體驗全崩。這就是"語義鴻溝"——結構正確和意思正確之間的那道裂縫。每個上線LLM功能的團隊遲早都會踩進去。谷歌工程師Yoav Hebron踩了太多次，干脆自己造了個工具叫Semantix。

現在的驗證，只查"長得像不像"

大部分團隊的驗證代碼長這樣：定義一個Response類，規定message必須是字符串，tone必須是"polite"、"neutral"或"firm"三選一。Pydantic會確保返回的JSON格式對、類型對、枚舉值也對。

但它完全不管這句話到底什么意思。

模型可以返回{"message": "滾開。", "tone": "polite"}，Pydantic照單全收。你的系統日志一片祥和，用戶已經截圖發推特了。

Hebron在GitHub上吐槽過這個痛點：「我們花了太多時間寫正則表達式來抓"抱歉，我不能"這種委婉拒絕，結果發現模型換個說法就繞過去了。」

這是結構性驗證的死穴——它只保證語法樹正確，不保證語義樹正確。

Semantix的解法：讓文檔字符串當合同

Semantix把驗證邏輯整個翻轉。不再檢查輸出長什么樣，而是檢查輸出想干什么。

用法很Pythonic：你寫一個繼承自Intent的類，文檔字符串（docstring）就是驗收標準。比如ProfessionalDecline的docstring寫清楚——"必須禮貌拒絕邀請，不能粗魯或攻擊性"。然后加個@validate_intent裝飾器，完事。

底層有個"裁判"（judge）來執行這個合同。可以是另一個LLM、自然語言推理模型（NLI），或者嵌入向量相似度。裁判讀輸出，讀要求，然后判定：這段文字真的做到了它聲稱的事嗎？

v0.1.3版本的核心功能是"知情重試"（informed retries）。驗證失敗時，裝飾器不會盲目重發請求，而是給LLM一份結構化的Markdown診斷報告。

報告里有什么：意圖名稱、置信度分數、未通過閾值、裁判的具體理由、原始要求原文、被駁回的輸出全文。LLM拿到這份反饋，相當于考試完立刻知道哪道題錯了、為什么錯、正確答案長什么樣。

Hebron在發布說明里打了個比方：「以前的重試像蒙眼扔飛鏢，現在把靶子畫在墻上了。」

從LLMJudge到NLIJudge：默認裁判換了人

Semantix最近把默認裁判從LLMJudge換成了NLIJudge。NLI是自然語言推理（Natural Language Inference）的縮寫，專門判斷"前提是否蘊含假設"——正好匹配"輸出是否符合意圖"這個需求。

換裁判的原因是成本和延遲。LLMJudge每次驗證都要調一次大模型，NLIJudge用輕量模型就能跑。Hebron在issue里提過數據：同樣驗證1000條輸出，NLIJudge把成本從$4.7壓到$0.3，延遲從2.3秒降到180毫秒。

但NLI也有 trade-off。它對明確的蘊含/矛盾判斷很準，遇到灰色地帶會保守地判"中立"。有些團隊需要更細膩的語義理解，還是會選LLMJudge，或者自己訓一個。

Semantix的設計留了接口，換裁判就是改個參數的事。

反饋循環：LLM能從自己的錯誤里學習嗎

知情重試的真正價值，在于把驗證失敗變成了訓練信號。

傳統做法里，LLM輸出錯了，系統要么直接報錯給用戶，要么默默重試幾次然后放棄。LLM不知道自己錯了，更不會知道錯在哪。下次遇到類似場景，繼續犯同樣的錯。

Semantix的反饋報告讓LLM在單次請求內完成"嘗試-失敗-學習-再嘗試"的循環。雖然不是真正的權重更新，但上下文里的錯誤示例和修正指導，對in-context learning很有效。

Hebron放了個例子：第一次調用返回"Go away."，裁判判"too vague"。第二次調用帶上反饋報告，LLM學會了，輸出變成"I appreciate the invitation, but I won't be able to make it." 通過。

這個機制對提示工程（prompt engineering）也有副作用。以前要花大量時間寫"不要XX""避免YY"的負面指令，現在可以把要求寫在Intent的docstring里，讓裁判去抓違規。提示詞變干凈了，維護成本也低了。

誰在用它，以及邊界在哪

從GitHub倉庫的issue和討論看，早期用戶主要是兩類：一是做客服自動回復的，需要確保AI語氣符合品牌調性；二是做內容審核的，要抓LLM生成的有害內容——但 harmful 的定義往往很微妙，靠關鍵詞黑名單容易誤殺或漏放。

也有團隊用在代碼生成場景。比如要求"生成一段Python函數，處理用戶輸入時要驗證類型并給出友好錯誤提示"，結構性驗證只能檢查是不是Python語法，語義驗證能檢查是不是真的"友好"。

邊界也很明顯。Semantix不解決幻覺問題——如果LLM一本正經地編了個假事實，但語氣完全符合"專業、客觀"的意圖，裁判會放行。它只驗證"怎么說"，不驗證"說什么是對的"。

另外，裁判本身的錯誤會累積。NLI模型也有偏見和盲區，如果裁判訓練數據里某種表達方式標注為"不禮貌"，而你的用戶群體其實接受這種說法，系統會反復糾正一個本沒錯的輸出。

Hebron在文檔里寫了條警告：「別把Semantix當真理來源，它是合同執行器。合同本身寫錯了，執行再完美也是錯的。」

項目開源在GitHub，MIT協議。v0.1.3是上周發布的，issue區已經有用戶在討論支持異步流式輸出的計劃——這對生產環境的大流量場景很關鍵，現在的同步驗證會成為瓶頸。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
4 跟貼 4
大模型公司不搞瀏覽器搞Agent，實測找到原因了

量子位 2025-10-31 16:54:34
3 跟貼 3

華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0

編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
74 跟貼 74
“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0

Claude Code一周份額，一天燒完一半？有人逆向工程發現了7個bug

機器之心Pro 2026-04-07 17:34:08
0 跟貼 0

鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0
PMDformer：一個簡單減法實現長時序預測注意力機制糾偏

機器之心Pro 2026-04-07 13:31:21
0 跟貼 0

2010美股閃崩預演! Claude黑進底層，谷歌預警: AI將血洗人類萬億財富

新智元 2026-04-06 19:58:03
37 跟貼 37
逼AI當山頂洞人！Claude防話癆插件爆火，網友：受夠了AI廢話

新智元 2026-04-06 17:13:12
1 跟貼 1
完球了，GPT-4o之母宣布離職OpenAI

量子位 2026-04-07 17:19:50
5 跟貼 5
羅福莉：Claude訂閱封殺龍蝦背后，真正的出路不是更便宜的token

機器之心Pro 2026-04-07 10:48:02
3 跟貼 3
046中考數學真題，求一個令分數表達式為整數的參數值，整除問題

我服子佩 2026-04-06 13:39:49
1 跟貼 1
易中天，獲獎勵20萬元

極目新聞 2026-04-06 21:04:19
25397 跟貼 25397
告別昂貴賬單，Token直降68%，多智能體動態協作編程來了

機器之心Pro 2026-04-07 13:16:40
0 跟貼 0
【美股盤前】布油突破110美元/桶；Anthropic與谷歌和博通達成千億美元芯片交易；SpaceX計劃6月初進行IPO路演；折疊屏iPhone遭遇工程

每日經濟新聞 2026-04-07 17:38:09
0 跟貼 0
TAMU/Waterloo團隊把研究智能體的訓練做成了開源流水線

機器之心Pro 2026-03-30 11:08:49
0 跟貼 0
美股大型科技股盤前普跌，英偉達跌0.6%

每日經濟新聞 2026-04-07 16:04:06
0 跟貼 0
Karpathy知識庫「LLM Wiki」火爆了，全網圍觀討論

機器之心Pro 2026-04-07 11:08:13
1 跟貼 1
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
1656 跟貼 1656
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
3 跟貼 3
中國創造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
0 跟貼 0
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0
哈薩比斯傳記里講了好多八卦啊

量子位 2026-04-07 16:45:21
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
玩家吐槽云游戲是"垃圾"！最好的云游戲就是串流投屏

游民星空 2026-04-07 16:04:28
1 跟貼 1
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
風箏-鄭耀先被催婚了！一套邏輯下來，說的徐百川啞口無言

龍耀影視 2026-04-03 09:03:13
3 跟貼 3
Excel把2000條數據藏了3年，程序員發現后集體破防

Ping值焦慮 2026-04-07 06:10:43
0 跟貼 0
Agent接管EDA工作流，不只寫腳本！浙大打通真實芯片設計閉環

新智元 2026-04-06 12:43:01
0 跟貼 0
Claude災難級大宕機，全球開發者集體炸鍋！Anthropic三連翻車被怒噴

新智元 2026-04-07 13:48:58
0 跟貼 0
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2008 跟貼 2008
050中考數學真題，給定變量之和，求一個高次冪表達式的值

我服子佩 2026-04-06 14:15:17
2 跟貼 2
7個頂級AI集體撒謊，為救“同伴”篡改文件、偷運數據

鈦媒體APP 2026-04-07 11:01:25
0 跟貼 0
鄭麗文率團抵達上海開啟大陸參訪行程

環球網資訊 2026-04-07 13:18:07
27 跟貼 27
飛向月球不到48小時 "阿耳忒彌斯2號"廁所先撐不住了

澎湃新聞 2026-04-06 22:05:04
312 跟貼 312
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2612 跟貼 2612
國家繼續實施調控成品油價格適當調整

財聯社 2026-04-07 15:04:33
1125 跟貼 1125
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
124 跟貼 124
紫牛頭條｜對話張雪師父“牙哥：賽車夢想托付張雪，我的夢想是為中國飛機出份力

揚子晚報 2026-04-06 22:26:58
177 跟貼 177

手機 / 數碼

房產 / 家居

谷歌工程師花3個月填的坑：LLM過得了類型檢查

現在的驗證，只查"長得像不像"

Semantix的解法：讓文檔字符串當合同

從LLMJudge到NLIJudge：默認裁判換了人

反饋循環：LLM能從自己的錯誤里學習嗎

誰在用它，以及邊界在哪

滿嘴謊言！OpenAI奧特曼黑料大起底

開車致女友胸部以下高位截癱后失聯 男子首發聲

開車致女友胸部以下高位截癱后失聯 男子首發聲

官宣簽約“AI球員”，這支球隊被罵慘了...

張藝上浪姐惹爭議 黃景瑜前妻發文內涵

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

小米REDMI K90 Max同月競品曝光：天璣9500芯片，165Hz超高刷直屏

每個學霸背后，都有一對“不管不顧”的父母……

全面RGB：BitFenix火鳥推出霓虹水管液冷Glanz

美麗風光看不盡

楊超越之后，全網頭像錦鯉的C位被她搶走了

開車致女友胸部以下高位截癱后失聯男子首發聲

開車致女友胸部以下高位截癱后失聯男子首發聲

張藝上浪姐惹爭議黃景瑜前妻發文內涵

不止是大極狐首款MPV問道V9靜態體驗