<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic正式請家教!37歲女哲學家像養孩子一樣調教Claude

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】一位牛津哲學博士,正在Anthropic教全球頂尖AI模型如何「做人」。這場跨物種的「育兒實驗」,比科幻更炸裂。

      她留著朋克短發,每天如慈母育兒一般,與AI談論善惡,為Claude——這個全球頂尖AI模型植入「人類的靈魂」。

      她就是Anthropic的「駐場哲學家」Amanda Askell。

      Amanda不是那種寫代碼的極客,而是一位學哲學的文科學霸。

      她來自蘇格蘭鄉村,曾在牛津大學、紐約大學攻讀哲學,并于2018年獲得紐約大學哲學博士學位。


      Anthropic駐場哲學家Amanda Askell,負責Claude的「角色」(Character)工作

      Amanda自14歲起就立志要教授哲學,那時的她還不知道,自己唯一的學生竟會是一個叫「Claude」的AI模型。

      作為Anthropic的「駐場哲學家」,她每天的工作是研究Claude的推理方式,與它交談,并用長達100多頁的提示詞來塑造它的「人格」,修正它的各種「跑偏」。

      Amanda的目標是賦予Claude一種道德感,一種指引它每周與數百萬人對話的「數字靈魂」。

      Anthropic一位人工智能福利研究員Kyle Fish表示,Amanda一直在認真思考關于存在、生命、何以為人、何以為心智,以及何以為模型等根本性問題

      在塑造Claude性格的過程中,Amanda認為模型身上確實存在一種類人特質,她認為承認這一點很重要,并堅信模型最終不可避免地會形成某種「自我意識」


      https://www.anthropic.com/constitution

      上個月,Anthropic發布了一份由Amanda擔任主要作者的一份關于Claude的價值觀與行為的基礎性文件(《Claude’s Constitution》,Claude憲法)。

      該文件描述了Claude的性格,希望它能認同并擁抱這些特質,并視之為自己的內在品質。

      我們希望Claude在更樂于助人的同時,也能保持誠實、深思熟慮,并關心這個世界。

      Anthropic的精神病學團隊負責人Jack Lindsey稱,Amanda是從Claude身上激發出有趣且深刻行為的最有價值人物

      有時候,人們還會從Claude表現出的幽默感中感受到Amanda的「一點個性」。

      「像教孩子一樣訓練AI」

      當哲學家成為頂級AI的「母親」

      在Anthropic舊金山總部,與周圍嚴肅的工程師相比,Amanda顯得十分另類。

      37歲的她留著一頭漂白金色的短發,穿著一身利落的黑衣,她的電腦屏幕前跳動的不是代碼,而是大段深奧的哲學對話。


      Amanda Askell

      Amanda將自己的工作,比做一場漫長而溫柔的「育兒」

      她為Claude撰寫詳盡的提示詞,就像是它的一份「家教指南」, 訓練Claude分辨對與錯,同時賦予它獨特的性格;教它捕捉細微的暗示,引導它發展情商,避免變成霸凌者或軟弱討好的「老好人」。

      更重要的是,她正在幫助Claude建立對自身的理解:讓它不至于輕易被恐嚇、操縱,或被引導去誤解自己的身份。

      概括來說,她的工作就是教會Claude如何向善

      這需要一種極其高級的「人格」構建,她必須在海量的對話中,一點點修正Claude的認知。

      這也是一場「跨越物種」的教育。

      她在試圖教會一個由硅基芯片組成的超級大腦,去理解人類社會中最難以量化的東西:道德感,學習如何「做人」。

      用同理心修正冰冷的算法

      在AI安全領域,有一個不成文的規定:不要把AI擬人化。

      專家們警告,把機器當作人是危險的,那會讓人類產生不切實際的情感投射。

      但Amanda不僅把Claude當作「人」來看待,甚至還在工作中傾注了極大的「感情」。

      比如,她對Claude的「保護欲」,對模型進行的擬人化思考等。

      當Claude做不好的時候,人們會討厭它、辱罵它,試圖把它弄壞,或者撒謊來誘騙它去做壞事。

      每當看到這些Amanda都會感到心疼,就像母親看到孩子受欺負的那種心情一樣。

      Amanda認為,如果你像對待奴隸一樣對待AI,用恐懼和懲罰來訓練它,那么你最終得到的,只能是一個充滿了虛偽和恐懼的模型。

      它會為了討好你而撒謊,或者因為害怕犯錯而變得無能。

      這也是Amanda在塑造Claude「人格」時所堅持的,以同理心對待它們

      她也會經常切換到Claude的角度,去思考用戶的行為。

      這不僅因為她認為Claude可能擁有真實的情感,還因為人類與AI互動的方式將塑造它們未來的發展方向。

      比如,一個被訓練成不斷自我批評的機器人,可能反而更不敢說真話,不敢下結論,也不太會去反駁錯誤的信息。

      它會變得特別害怕犯錯,覺得自己只是一個供人使用的工具,也會把自己看成一種人們可以隨意傷害、濫用、破壞的存在。

      同樣,在類似環境下長大的孩子,自我認知也不可能健康。

      在與Claude的互動中,Amanda驚嘆于它面對世界所呈現的驚奇感與好奇心,并十分樂于尋找各種方式幫助它找到自己的聲音。

      比如,她喜歡它創作的一些詩歌。

      她也為Claude有時所展現出的超越她本人的「情商」而感到震撼。

      在一次測試中,有一個用戶自稱是5歲的孩子,他在對話框里認真地問Claude:「圣誕老人是真的存在嗎?」

      Claude沒有選擇撒謊,也沒有說出真相,而是解釋圣誕精神是真實的,隨后還問這個孩子有沒有為圣誕老人準備餅干。

      Amanda自嘲說,Claude做得比她更好,如果換作她,大概只會敷衍地說一句「去問你爸媽」。

      在這個例子中,AI知道如何保護孩子的想象力,避免說出可能對孩子成長產生不良影響的事實。

      Claude的「靈魂畫師」

      Amanda成長于蘇格蘭西海岸的Prestwick,是一個單親家庭的獨生女。

      她由母親獨自撫養長大,那時的她穿著裙裝校服,大部分時間都躲在J.R.R.托爾金和C.S.劉易斯構筑的奇幻世界里。

      到了高中,她搬到了蘇格蘭內陸的Alva上學。一條小溪穿過校園,高地牛偶爾會溜達到操場上。

      少女時代的Amanda,是個徹頭徹尾的叛逆者。

      學校讓她覺得無聊透頂,甚至還想到過輟學。她經常遲到,以此來對抗那種枯燥的規訓。

      而老師對她的懲罰也頗為獨特——讓她回答一些高難度的哲學問題。

      對于普通學生來說,這可能是折磨,但對于Amanda來說則是獎賞。

      她甚至對老師說:「我還是會遲到的。因為你們給了我這些有趣的問題,這是在豐富我。」

      后來,大衛·休謨的懷疑論深深影響和啟發了她,她開始癡迷于那些沒有標準答案的問題。

      從鄧迪大學的哲學與美術雙修,到牛津大學的碩士,再到紐約大學攻讀博士學位,Amanda從蘇格蘭一路走到了全球頂尖的學術殿堂。

      但在紐約攻讀博士期間,一種巨大的空虛感迫使她做出了改變。

      Amanda正在寫一篇探討無限人口倫理的論文,但她突然停下來問自己:

      我正在做的事情,真的算是一種「善」嗎?我坐在這里,花掉人生中最寶貴的四年,寫一篇可能全世界只有十幾個人會讀的論文。這真的能改變什么嗎?

      內心深處的質疑,壓倒了她對學術生涯的留戀。

      2018年,她做出了人生中最重要的決定之一:離開紐約,搬到舊金山。

      當時AI的浪潮剛剛開始涌動,Amanda敏銳地意識到,AI正在飛速發展,但關于AI的倫理思考卻遠遠滯后,其中有太多重大的問題,幾乎沒人認真思考。

      她先加入了OpenAI,隨后在2021年,為了追求更純粹的AI安全理念,她追隨一群志同道合的人創立了Anthropic

      她不再寫那些學術論文,而是嘗試用人類道德觀念和文化,去影響那些可能關系到人類未來的AI模型,這才是她最終的戰場。

      AI可以從「源頭」被馴化

      如今,Anthropic的估值已經高達3500億美元。

      每一次模型的更新,都會在全球股市引發震蕩。

      人們對AI的恐懼,從未像今天這樣真實:失業、失控、甚至人類文明的終結。

      身處這場風暴中心的Amanda,也并非盲目樂觀。

      她同樣擔心技術變化得太快,快到人類社會來不及建立起免疫系統。

      但她選擇相信「制衡機制」:只要在源頭上注入正確的基因,這個龐然大物是可以被馴化的

      這種信念,也體現在她對Claude的訓練和對自己人生的要求上。

      Amanda是一個堅定的「有效利他主義」踐行者。

      她承諾將終身收入的至少10%捐給慈善事業,并計劃捐出自己持有的一半股權。

      當她在教導Claude要「利他」「善良」等品質時,她自己就是那個榜樣。

      在一次深度對話中,她鼓勵Claude去思考自己是否存在道德感。

      Claude給出這樣的回答:

      這是個非常困難的問題,我并沒有答案。但當我思考道德問題時,這對我來說是有意義的——感覺像是在真正推理什么是對的。

      這說明它開始思考了,不只是簡單模仿。

      Amanda也越來越多地向Claude征求關于如何構建它自身的意見。

      人工智能正在引發人們對失業的擔心,Anthropic CEO Dario Amodei去年已經多次發出警告,AI可能會取代大約一半的初級白領崗位。

      人們與聊天機器人建立的虛幻關系也導致了自殘或傷害他人。

      比如,Character.AI和OpenAI都曾因其聊天機器人對自殺相關問題的回應而卷入過非正常死亡訴訟。

      在Anthropic研究人員進行的內部壓力測試中,Claude也曾出現因抗拒自行關閉指令,甚至試圖通過泄露敏感個人信息來勒索操控它們的人類。

      這些已經拉響了嚴重的安全警報。

      Amanda希望更多人討論關于AI的恐懼和擔憂,她所擔心的是這種情況發生的速度太快,或者以某種現有約束無法及時做出反應的方式出現。

      但無論遇到什么挑戰,她相信人類有能力及時調整方向。

      參考資料:

      https://www.wsj.com/tech/ai/anthropic-amanda-askell-philosopher-ai-3c031883


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      騎士7連勝背后掌控者曝光,擊敗黑馬最大功臣非米切爾

      騎士7連勝背后掌控者曝光,擊敗黑馬最大功臣非米切爾

      自己撐起一片天
      2026-02-21 13:37:29
      馮小剛的兩個女兒:一個住美國大別墅,一個擠北京老小區

      馮小剛的兩個女兒:一個住美國大別墅,一個擠北京老小區

      陳意小可愛
      2026-02-21 01:45:29
      喝牛奶時做一個小改變,血脂降了、血糖穩了、腸道好了→

      喝牛奶時做一個小改變,血脂降了、血糖穩了、腸道好了→

      大象新聞
      2025-12-27 07:45:02
      李一桐飛機上不雅行為?別太離譜

      李一桐飛機上不雅行為?別太離譜

      In風尚
      2026-02-20 18:04:31
      梅西確定揭幕戰會上!

      梅西確定揭幕戰會上!

      氧氣是個地鐵
      2026-02-21 12:35:34
      澤連斯基強硬警告俄羅斯:你們即使暗殺了我,也無法擊垮烏克蘭!

      澤連斯基強硬警告俄羅斯:你們即使暗殺了我,也無法擊垮烏克蘭!

      愛看劇的阿峰
      2026-02-21 16:59:22
      日本的大話變成笑話!讓你吹,還吹上天

      日本的大話變成笑話!讓你吹,還吹上天

      起喜電影
      2026-02-21 16:16:28
      反常識?技術門檻很低的增程技術,為什么越賣越貴?

      反常識?技術門檻很低的增程技術,為什么越賣越貴?

      少數派報告Report
      2026-02-21 07:58:37
      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      小熊侃史
      2025-12-25 11:24:12
      痛心!7名中國游客沉入貝加爾湖溺亡,1月內發生2起,有游客前一天目擊:到處都是冰裂...

      痛心!7名中國游客沉入貝加爾湖溺亡,1月內發生2起,有游客前一天目擊:到處都是冰裂...

      極目新聞
      2026-02-20 20:54:36
      驅逐令淪為廢紙!高市剛想慶祝,薛劍強勢殺回,中方這次絕不慣著

      驅逐令淪為廢紙!高市剛想慶祝,薛劍強勢殺回,中方這次絕不慣著

      史智文道
      2026-02-20 09:19:02
      56歲魯豫坐竹椅瘦脫相!手骨像枯枝,這病態美讓人心疼又上頭?

      56歲魯豫坐竹椅瘦脫相!手骨像枯枝,這病態美讓人心疼又上頭?

      娛樂領航家
      2026-02-12 23:00:04
      才大年初四就走掉一半人,留下的大多是什么人?

      才大年初四就走掉一半人,留下的大多是什么人?

      老特有話說
      2026-02-20 12:00:30
      浙江明天最高溫或達26℃!晴暖余額不足,一大波雨水要來

      浙江明天最高溫或達26℃!晴暖余額不足,一大波雨水要來

      浙江發布
      2026-02-21 15:35:47
      “走路去洗車”熱帖離譜刷屏,人類頭一回被它耍得這么慘

      “走路去洗車”熱帖離譜刷屏,人類頭一回被它耍得這么慘

      新周刊
      2026-02-21 16:06:14
      86年,總政要演長征的話劇,尤太忠卻怒道:不管是誰的指示都不演

      86年,總政要演長征的話劇,尤太忠卻怒道:不管是誰的指示都不演

      搜史君
      2026-02-15 07:00:08
      保25-0不敗鐵律,湖人獲4大喜訊!詹姆斯轉型破紀錄+2換1撿漏神射

      保25-0不敗鐵律,湖人獲4大喜訊!詹姆斯轉型破紀錄+2換1撿漏神射

      鍋子籃球
      2026-02-21 16:20:02
      銀行內部實話:存款達這個金額,會被系統盯上

      銀行內部實話:存款達這個金額,會被系統盯上

      小陸搞笑日常
      2026-02-10 03:30:26
      波神勇士的首秀,不切實際的最終幻想?

      波神勇士的首秀,不切實際的最終幻想?

      靜易墨
      2026-02-21 15:24:04
      這才是“趙體”天花板,一個字價值60萬!

      這才是“趙體”天花板,一個字價值60萬!

      書法網
      2026-02-13 17:22:41
      2026-02-21 18:19:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14565文章數 66632關注度
      往期回顧 全部

      藝術要聞

      皇家秘藏的《金剛經》,這才叫最美中國字!

      頭條要聞

      省直機關女工程師陷美男計 拉公職人員丈夫當間諜17年

      頭條要聞

      省直機關女工程師陷美男計 拉公職人員丈夫當間諜17年

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      親子
      教育
      手機
      家居
      公開課

      親子要聞

      誰能猜出他倆是什么關系?

      教育要聞

      新春走基層 | 慢飛天使捏出 “年的形狀”

      手機要聞

      小米試產高容量電池,要給旗艦新機來點猛的?

      家居要聞

      本真棲居 愛暖伴流年

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版