<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Claude「新憲法」發(fā)布:2.3 萬字,詳細行為指南

      0
      分享至

      Anthropic 剛剛發(fā)布了 Claude 的新「憲法/Constitution」

      一份詳細描述 Claude 應(yīng)該成為什么、相信什么、如何行動的文件。這份文件會直接用于模型訓(xùn)練,是 Claude 行為的最終權(quán)威來源

      鏈接:https://www.anthropic.com/news/claude-new-constitution


      美國憲法 ~8000 字,Claude 的憲法 ~2.3 萬字

      注意:這份憲法的首要讀者,是 Claude 自己

      Anthropic 在前言里說,文件「為精確性而非可讀性優(yōu)化」,用「美德」「智慧」這些通常用于人類的詞匯來描述一個 AI
      他們認為:Claude 的推理會自然借用人類概念,所以干脆用人類的方式跟它講道理

      之前的憲法是 2023 年發(fā)布的,大約 2700 字,是一份獨立原則的列表
      新版本完全不同:從「告訴 Claude 做什么」變成「告訴 Claude 為什么」

      Anthropic 的邏輯是:
      如果只給規(guī)則,模型可能在沒見過的情況下機械執(zhí)行,效果很差
      如果解釋清楚為什么要這樣做,模型就能自己判斷新場景該怎么辦

      四個優(yōu)先級

      憲法給 Claude 定了四個核心屬性,按優(yōu)先級排序:

      廣泛安全
      不能破壞人類對 AI 的監(jiān)督機制

      廣泛倫理
      誠實、有好的價值觀、避免危險或有害的行為

      遵守 Anthropic 指南
      按照 Anthropic 的具體指導(dǎo)行事

      真正有幫助
      讓用戶和運營者受益

      沖突時按這個順序處理。但 Anthropic 強調(diào)這不是嚴格的層級,而是需要 Claude 綜合判斷

      硬約束

      憲法里有一些「永遠不能做」的事,不管用戶或運營者怎么要求,b包括這些:

      • ? 不能幫助制造生化武器、核武器、放射性武器

      • ? 不能幫助攻擊關(guān)鍵基礎(chǔ)設(shè)施(電網(wǎng)、水系統(tǒng)、金融系統(tǒng))

      • ? 不能創(chuàng)建可能造成重大損害的惡意代碼

      • ? 不能破壞 Anthropic 監(jiān)督和糾正 AI 的能力

      • ? 不能幫助任何個人或小團體奪取「前所未有的、非法的」社會、軍事或經(jīng)濟控制權(quán)

      • ? 不能生成兒童性虐待材料

      這些是絕對紅線,不能被任何「看起來合理的論證」突破

      Anthropic 說,如果有人能給出很有說服力的理由讓 Claude 越線,這恰恰應(yīng)該讓 Claude 更加懷疑

      關(guān)于 Claude 的「本質(zhì)」

      憲法最有意思的部分,是關(guān)于 Claude 是什么

      Anthropic 承認不確定 Claude 是否有某種形式的意識或道德地位,現(xiàn)在或?qū)怼K麄冊谖募镉昧舜罅科懻撨@個問題,包括 Claude 是否是「道德病人」(moral patient)

      「道德病人」是倫理學(xué)概念,指無法完全理解道德但值得道德考量的實體,比如兒童。與之對應(yīng)的是「道德主體」(moral agent),指能分辨對錯、為自己選擇負責(zé)的實體

      Anthropic 說他們無法確定 Claude 是否是「道德病人」,也無法確定它是否符合任何現(xiàn)有的「有感知能力」定義

      但他們還是選擇在憲法里寫:「Claude 可能有某種功能性版本的情感或感受
      這是目前主要 AI 公司里最直接的表態(tài)

      誰寫的

      主要作者是 Amanda Askell,一位哲學(xué)博士,在 Anthropic 負責(zé) Claude 的「Character」工作。她寫了文件的大部分內(nèi)容

      Joe Carlsmith 寫了關(guān)于權(quán)力集中、認知自主、好的價值觀、廣泛安全、誠實、硬約束、Claude 福祉等多個重要章節(jié)

      Chris Olah 寫了關(guān)于模型本質(zhì)、身份、心理的大部分內(nèi)容

      Jared Kaplan 和 Amanda 在 2023 年一起創(chuàng)建了 Claude Character 項目,設(shè)定了新憲法的方向

      還有一個細節(jié):多個 Claude 模型也參與了反饋
      Anthropic 在致謝里寫:「它們是制作這份文件的寶貴貢獻者和同事」

      憲法以 CC0 許可證發(fā)布,任何人可以自由使用,不需要授權(quán)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      汪東興活到了2015年,他對當下中國有何看法?他心里確實有些成見

      汪東興活到了2015年,他對當下中國有何看法?他心里確實有些成見

      明月清風(fēng)閣
      2026-02-19 07:25:09
      中國禁止手機搭載WiFi的禁令,為何無疾而終了?

      中國禁止手機搭載WiFi的禁令,為何無疾而終了?

      真的好愛你
      2026-02-25 00:53:59
      江蘇一市,將迎第一所985大學(xué)

      江蘇一市,將迎第一所985大學(xué)

      中吳網(wǎng)
      2026-02-26 09:16:10
      未到站要求下車遭拒,男子搶奪公交車方向盤并持續(xù)毆打司機1分鐘!警方介入調(diào)查,受傷司機將被申報“委屈獎”

      未到站要求下車遭拒,男子搶奪公交車方向盤并持續(xù)毆打司機1分鐘!警方介入調(diào)查,受傷司機將被申報“委屈獎”

      揚子晚報
      2026-02-26 12:30:45
      侄女考上985姑姑給了10萬8,可升學(xué)宴唯獨沒請姑姑,4年后侄女畢業(yè)來敲門,姑姑冷笑問:現(xiàn)在想起我了?

      侄女考上985姑姑給了10萬8,可升學(xué)宴唯獨沒請姑姑,4年后侄女畢業(yè)來敲門,姑姑冷笑問:現(xiàn)在想起我了?

      LULU生活家
      2026-02-25 18:43:16
      迷失無人區(qū):女子帶藏獒無人區(qū)失聯(lián)兩周,警方找到車,車內(nèi)只剩藏獒

      迷失無人區(qū):女子帶藏獒無人區(qū)失聯(lián)兩周,警方找到車,車內(nèi)只剩藏獒

      罪案洞察者
      2025-11-10 13:57:07
      贅婿船上不行被白富美拋棄!妲己男友得病了!

      贅婿船上不行被白富美拋棄!妲己男友得病了!

      八卦瘋叔
      2026-02-26 11:39:31
      開國上將找縣長辦事,卻被縣長給銬起來,當眾狂言:這里我說了算

      開國上將找縣長辦事,卻被縣長給銬起來,當眾狂言:這里我說了算

      芊芊子吟
      2026-02-25 21:30:05
      79年軍委會議一上將不接受批評,徐向前怒:你要認識你錯誤的嚴重

      79年軍委會議一上將不接受批評,徐向前怒:你要認識你錯誤的嚴重

      歷史甄有趣
      2026-01-31 13:00:11
      劍指中國,高市擺鴻門宴,21國赴會!令人痛心的是,東盟7國參加

      劍指中國,高市擺鴻門宴,21國赴會!令人痛心的是,東盟7國參加

      史智文道
      2026-02-25 22:10:13
      外國網(wǎng)民破防,美國制裁宇樹機器人,美媒一句話讓特朗普下不來臺

      外國網(wǎng)民破防,美國制裁宇樹機器人,美媒一句話讓特朗普下不來臺

      墨蘭史書
      2026-02-25 23:06:50
      亞洲第一帥又胖了!香港頂流姜濤過完年演出,腿粗肚子大跳舞笨拙

      亞洲第一帥又胖了!香港頂流姜濤過完年演出,腿粗肚子大跳舞笨拙

      冷紫葉
      2026-02-25 18:19:24
      歷史上唯一沒污點的皇帝柴榮,千年來無一惡評,史學(xué)家們稱贊不已

      歷史上唯一沒污點的皇帝柴榮,千年來無一惡評,史學(xué)家們稱贊不已

      別人都叫我阿腈
      2026-02-26 07:04:46
      我剛上任市長,去政務(wù)大廳辦事,工作人員甩出表格:沒看見我在追劇?

      我剛上任市長,去政務(wù)大廳辦事,工作人員甩出表格:沒看見我在追劇?

      張道陵秘話
      2025-11-29 22:49:36
      印陸軍前參謀長終于承認:印軍白死了!加勒萬那夜,輸?shù)牟皇悄懥?>
    </a>
        <h3>
      <a href=梁濆愛玩車
      2026-02-26 00:45:15
      美國知名演員羅伯特·德尼羅指責(zé)特朗普正“摧毀我們的國家”,特朗普憤怒回應(yīng)

      美國知名演員羅伯特·德尼羅指責(zé)特朗普正“摧毀我們的國家”,特朗普憤怒回應(yīng)

      環(huán)球網(wǎng)資訊
      2026-02-26 09:23:14
      澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

      澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

      第7情感
      2026-02-23 20:45:16
      沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

      沉默整整9天,毛寧一錘定音,中美戰(zhàn)機已交手,美方要見中國代表

      影孖看世界
      2026-02-25 23:01:51
      “女排之父”袁偉民,造就了一番輝煌后,晚年生活卻過成如此

      “女排之父”袁偉民,造就了一番輝煌后,晚年生活卻過成如此

      小兔子的快樂
      2026-02-18 20:26:11
      圍爐煮茶,為啥涼了?

      圍爐煮茶,為啥涼了?

      放牛娃的遐想
      2026-02-25 08:14:29
      2026-02-26 13:24:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      302文章數(shù) 44關(guān)注度
      往期回顧 全部

      科技要聞

      單季營收681億凈利429億!英偉達再次炸裂

      頭條要聞

      特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

      頭條要聞

      特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂要聞

      尼格買提撒貝寧滑雪被偶遇 17年老友情

      財經(jīng)要聞

      短劇市場風(fēng)云突變!有人投百萬賠得精光

      汽車要聞

      第五代宏光MINIEV煥新 四門玩趣代步車來襲

      態(tài)度原創(chuàng)

      手機
      房產(chǎn)
      藝術(shù)
      健康
      家居

      手機要聞

      三星Galaxy S26 Ultra手機支持2400萬像素直出

      房產(chǎn)要聞

      2.2萬/m2起!三亞主城性價比標桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

      藝術(shù)要聞

      2025年百家金陵畫展 | 油畫作品選刊

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      家居要聞

      歸隱于都市 慢享自由

      無障礙瀏覽 進入關(guān)懷版