![]()
新智元報(bào)道
編輯:傾傾
【新智元導(dǎo)讀】AI不僅能回答問題,還能采訪人類了。Anthropic讓模型與1250名真實(shí)用戶深度對(duì)話,自動(dòng)寫提綱、追問、做聚類分析,最后畫出一張「人類情緒雷達(dá)圖」。這一次,人類成了AI的研究對(duì)象。
很難想象,有一天AI真的開始采訪人類了。
內(nèi)容也不是「你今天過得怎么樣」這種日常閑聊,而是遵循一套完整的訪談方法。
自己寫提綱,追問,做主題聚類、情緒分析,最后給出跨行業(yè)的「人類情緒雷達(dá)圖」。
這就是Anthropic最近發(fā)布的Interviewer,一個(gè)帶著未來氣息的工具。
它在一周內(nèi)和1250名真實(shí)的職場(chǎng)人、創(chuàng)作者、科學(xué)家對(duì)話。
所有細(xì)節(jié)都被記錄下來,再被AI壓成可量化的結(jié)構(gòu)。
這是一張AI時(shí)代的「群體畫像」,也是大模型第一次真正走進(jìn)人的心里。
AI會(huì)采訪人了,而且比人類還專業(yè)
Anthropic推出的Interviewer,看上去是一個(gè)普通的功能更新,實(shí)際卻悄悄跨過了一條技術(shù)線。
不只是回答問題的模型,而是能像一位受過專業(yè)訓(xùn)練的研究者。
它帶著明確的假設(shè)與研究目標(biāo),主動(dòng)發(fā)起訪談、實(shí)時(shí)追問、整理情緒,并最終把所有內(nèi)容轉(zhuǎn)成可量化的數(shù)據(jù)。
![]()
在過去,這套流程只能靠人類研究團(tuán)隊(duì)完成,如今首次被AI接手。
訪談從一個(gè)看似簡(jiǎn)單的問題開始,背后有完整的規(guī)劃過程。
Interviewer會(huì)根據(jù)研究目標(biāo)自動(dòng)寫出訪談提綱。哪些主題重要、應(yīng)該在哪里追問、哪些情緒信號(hào)需要捕捉,都在模型內(nèi)部提前被組織好。
然后,它會(huì)以一個(gè)自然的開場(chǎng)進(jìn)入對(duì)話:
![]()
這是一場(chǎng)持續(xù)10–15分鐘的深度訪談。
AI會(huì)根據(jù)回答調(diào)整節(jié)奏;當(dāng)用戶猶豫、繞開時(shí),它會(huì)及時(shí)把對(duì)話拉回主線。
在訪談結(jié)束之后,Interviewer會(huì)把完整的訪談?dòng)涗浗唤o分析器,自動(dòng)做主題聚類、提取關(guān)鍵觀點(diǎn)、識(shí)別情緒傾向,并根據(jù)職業(yè)、行業(yè)、角色生成一套可視化的「情緒雷達(dá)圖」。
![]()
Anthropic的自動(dòng)主題聚類工具Clio。用虛構(gòu)的對(duì)話示例來說明Clio的分析步驟概述
過去研究團(tuán)隊(duì)需要數(shù)周才能完成的質(zhì)性工作,現(xiàn)在AI能在規(guī)模化場(chǎng)景里穩(wěn)定產(chǎn)出。
Anthropic采訪了1250人,并將訪談內(nèi)容匿名公開,讓外部研究者也能使用這批數(shù)據(jù)。
根據(jù)受訪者反饋,這個(gè)工具的穩(wěn)定性遠(yuǎn)超預(yù)期:超過97%的參與者給出了高滿意度評(píng)價(jià),幾乎所有人都覺得訪談「準(zhǔn)確捕捉了自己的想法」。
這項(xiàng)研究發(fā)掘出AI的另一種可能性:自第一次大規(guī)模問卷誕生以來,人類的質(zhì)性研究方法第一次出現(xiàn)了擴(kuò)展。
對(duì)于AI行業(yè)來說,這是另一個(gè)方向的突破——不僅能理解文本,還能理解人。
1250份訪談,AI第一次看見人的復(fù)雜
在結(jié)果出來之前,人們都以為自己能猜到大家對(duì)AI的看法。
事實(shí)卻是,不同職業(yè)里的人,正以完全不一樣的方式迎接同一個(gè)未來。
![]()
Anthropic將1250份訪談按主題聚類后,繪制的情緒傾向氣泡圖。藍(lán)色越多代表越悲觀,黃色越多代表越樂觀,氣泡越大代表該主題提及人數(shù)越多
普通職場(chǎng)人:要效率,也要體面
在普通職場(chǎng)人的訪談里,談到最多的是「效率」。
他們的描述出奇地一致:AI能節(jié)省時(shí)間,讓某些煩瑣的工作輕松下來,甚至重新讓人看到一點(diǎn)點(diǎn)「掌控感」。
高達(dá)86%的受訪者說它讓工作變快,65%對(duì)現(xiàn)在的使用狀況感到滿意。
加快流程、減少機(jī)械任務(wù),這是他們最直接的體驗(yàn)。
但當(dāng)訪談持續(xù)深入,另一個(gè)更隱蔽的情緒開始浮出來——他們害怕顯得自己「太依賴AI」。
69%的受訪者坦言,自己會(huì)刻意壓低使用痕跡,擔(dān)心被同事認(rèn)為不夠?qū)I(yè)、郵件像AI代寫、從而影響自己在團(tuán)隊(duì)里的位置。
這種矛盾也體現(xiàn)在數(shù)據(jù)里:他們?cè)谠L談中把自己的AI使用描述為協(xié)作式的:
我還是主要做主導(dǎo),只是讓AI加快一些程序。
但Anthropic對(duì)Claude使用記錄的分析顯示,更大比例的使用其實(shí)是自動(dòng)化——把任務(wù)直接交給模型完成,然后再自己稍作調(diào)整。
即便如此,他們依然會(huì)反復(fù)強(qiáng)調(diào)「關(guān)鍵的部分還得我來做」,并把這稱作「監(jiān)督AI、管理流程、保留判斷」。
![]()
受訪者的自我描述與實(shí)際使用之間的差異。上方為「協(xié)作」,下方為「自動(dòng)化」。藍(lán)色越深表示任務(wù)更復(fù)雜
數(shù)據(jù)也說明,人們?cè)诿枋鲎约菏褂肁I的方式時(shí),會(huì)更傾向于強(qiáng)調(diào)「控制感」,但實(shí)際行為里自動(dòng)化比例更高。
創(chuàng)作者:被效率推著跑
在1250名創(chuàng)作者的訪談里,幾乎每個(gè)情緒點(diǎn)都成對(duì)出現(xiàn)——效率與焦慮并行,靈感與身份危機(jī)并存。
![]()
創(chuàng)作者樣本的情緒主題可視化。藍(lán)色越多代表越悲觀,黃色越多代表越樂觀,氣泡越大代表該主題提及人數(shù)越多。來源:Anthropic創(chuàng)作者群體訪談分析
攝影師的修片周期從12周縮到3周,以前根本做不到的效率現(xiàn)在成了常規(guī)。
內(nèi)容寫作者描述自己一天能完成過往兩倍的產(chǎn)量;音樂制作人會(huì)讓模型給出一長(zhǎng)串詞組,然后從中找靈感。
這些例子說明,AI的確把創(chuàng)作的前期門檻和后期流程都?jí)嚎s了。
但是效率越高,他們反而越不安。
70%的創(chuàng)作者擔(dān)心客戶會(huì)覺得自己的作品「太像AI生成」,擔(dān)心品牌受損,擔(dān)心被同行視為不再堅(jiān)持原創(chuàng)。
更扎心的是收入。配音行業(yè)的某些工種已經(jīng)被模型直接頂?shù)簦划a(chǎn)品攝影正在加速被替換。
有創(chuàng)意總監(jiān)坦言:
我知道我用AI的每一次,都意味著某個(gè)攝影師再少了一天的收入。
創(chuàng)作者一邊覺得AI是工具,說自己仍然掌握最終決定權(quán),但下一句又會(huì)不自覺承認(rèn):有時(shí)候,它給的方向比我想到的還清晰。
![]()
創(chuàng)作者樣本的六維情緒雷達(dá)圖。可以看到滿意度很高,但信任和安全感較弱,擔(dān)憂明顯高于其他群體
科學(xué)家:不擔(dān)心被替代,但不敢把核心交出
科學(xué)家們不像創(chuàng)作者那樣焦慮經(jīng)濟(jì)壓力,也不像普通職場(chǎng)人那樣擔(dān)心「形象問題」。
他們的最大顧慮是可靠性。79%的科學(xué)家明確表示:在重要任務(wù)上,AI還不夠穩(wěn)定,不足以承擔(dān)生成假說或設(shè)計(jì)實(shí)驗(yàn)的責(zé)任;27%認(rèn)為模型的理論能力仍明顯不足。
于是,他們更多在文獻(xiàn)綜述、代碼調(diào)試、論文寫作這些環(huán)節(jié)使用AI。
而決定實(shí)驗(yàn)方向、判斷數(shù)據(jù)異常、根據(jù)細(xì)微現(xiàn)象推斷這些關(guān)鍵步驟,仍保留在人工手中。
科學(xué)家們也不太擔(dān)心失業(yè)。
他們經(jīng)常舉出的例子是那些無法被數(shù)字化的tacit knowledge:細(xì)胞培養(yǎng)顏色的微妙變化、某些儀器的「操作手感」、實(shí)驗(yàn)室里未寫入SOP的經(jīng)驗(yàn)判斷。
這些任務(wù),機(jī)器根本無法感知。
![]()
科學(xué)家對(duì)AI的不同研究環(huán)節(jié)態(tài)度分布。藍(lán)色越多越悲觀,黃色越多越樂觀,氣泡越大代表該主題提及人數(shù)越多
有趣的是,他們并不排斥AI,相反,91%的科學(xué)家期待未來有一個(gè)真正的AI研究伙伴。
他們的不信任,是來自技術(shù)的不成熟,而不是職業(yè)焦慮。
![]()
科學(xué)家樣本的六維情緒雷達(dá)圖。滿意度高、挫折明顯、信任偏低,擔(dān)憂相對(duì)較弱
AI照亮了每個(gè)職業(yè)的「脆弱中心」
把這三類人的訪談擺在一起時(shí),就會(huì)發(fā)現(xiàn)情緒的差異已經(jīng)不足以解釋他們的選擇。
這些態(tài)度背后,其實(shí)是他們各自工作結(jié)構(gòu)里的壓力點(diǎn)。
普通職場(chǎng)人之所以小心翼翼,是因?yàn)樗麄兩硖幍氖歉叨纫蕾囉∠蠊芾淼慕M織環(huán)境。
AI對(duì)他們來說不是一個(gè)純粹的工具,而是一種會(huì)改變「別人如何看我的專業(yè)性」的信號(hào)。
他們的謹(jǐn)慎,不是來自對(duì)技術(shù)的恐懼,而是來自對(duì)關(guān)系網(wǎng)里位置松動(dòng)的害怕。
創(chuàng)作者的緊張感來自完全不同的結(jié)構(gòu):他們的收入、風(fēng)格、作品價(jià)值,本質(zhì)上都在市場(chǎng)中直接競(jìng)爭(zhēng)。
AI對(duì)他們?cè)斐傻膲毫Σ皇且灰茫恰赣昧酥螅瑫?huì)不會(huì)削弱我所出售的那部分人格與原創(chuàng)性」。
科學(xué)家的態(tài)度則屬于另一端:他們的專業(yè)身份不靠「可見的成果速度」來維持,而是靠長(zhǎng)期積累的判斷力與可靠性。
AI在這里不是競(jìng)爭(zhēng)者,而是一種可能犯錯(cuò)的系統(tǒng)。
他們的謹(jǐn)慎更多來自學(xué)科本身——錯(cuò)誤的代價(jià)太高,無法輕易托付出去。
如果把這三種結(jié)構(gòu)擺在一起,就會(huì)看到一個(gè)更本質(zhì)、更深刻的分野:每個(gè)群體真正關(guān)注的,都不是AI有多強(qiáng)大,而是AI觸碰了他們哪一塊「不可替代的核心」。
AI本身沒有惡意,也沒有傾向,它只是把每個(gè)人最脆弱的那塊悄悄顯了形。
同樣的技術(shù)落在不同的工作結(jié)構(gòu)里,卻引發(fā)了三種完全不同的心理震動(dòng)。
所以,這三類人對(duì)AI的態(tài)度差異,并不是技術(shù)本身造成的,而是由他們各自的職業(yè)結(jié)構(gòu)、評(píng)價(jià)體系與生存方式?jīng)Q定的。
AI只是讓這些隱性的分野第一次浮出水面。
未來的AI不只是更聰明,而是更懂人
訪談只是能看得見的部分,真正關(guān)鍵的是那些一直被忽略的「關(guān)系變量」。
Anthropic真正想要的,是過去所有模型開發(fā)者都看不見、卻極其關(guān)鍵的一部分:人們?cè)诹奶齑翱谥猓绾魏虯I建立關(guān)系。
Anthropic之前的經(jīng)濟(jì)指數(shù)只能分析聊天行為本身,卻無法觸達(dá)用戶對(duì)技術(shù)的感受、期望與邊界感。
而恰恰是這些看不見的變量,才是決定大模型未來影響力的最關(guān)鍵部分。
Anthropic Interviewer是他們第一次試圖補(bǔ)上這一塊。
它放棄了傳統(tǒng)問卷那樣預(yù)設(shè)問題的做法,而是采用深度訪談的方式,讓用戶在對(duì)話中自然地把隱含的信息說出來:
他們?nèi)绾纹胶庑逝c身份,他們?nèi)绾谓忉屪约旱腁I使用方式,他們?cè)趽?dān)心什么,又愿意交出什么。
這些內(nèi)容不會(huì)出現(xiàn)在聊天記錄里,但卻會(huì)決定人們,愿不愿意繼續(xù)使用 AI、能信不信任它、允許它進(jìn)入工作流的哪個(gè)部分。
對(duì)Anthropic來說,這些「隱性變量」不僅影響產(chǎn)品迭代,也影響他們?nèi)绾卫斫馊伺c模型的合作關(guān)系會(huì)往哪里走。
這一研究真正想回答的,是當(dāng)AI越來越像工作伙伴,它要如何被訓(xùn)練,才能進(jìn)入不同人的生活,而不破壞原有的結(jié)構(gòu)。
這1250份訪談,是Anthropic第一次把視角徹底放回人身上。
未來的模型,將更像是從這種「人與AI的關(guān)系」中長(zhǎng)出來的,而不只是從技術(shù)里長(zhǎng)出來。
這一輪深度訪談,把一個(gè)靜默而深刻的事實(shí)呈現(xiàn)在臺(tái)面上:
AI并不是在取代誰(shuí),它是在以一種最直接的方式,逼著不同的人去回答同一個(gè)問題——我在工作里的核心到底是什么?
普通職場(chǎng)人在關(guān)系里找答案,創(chuàng)作者在作品里找答案,科學(xué)家在可靠性里找答案。
Anthropic正在做的,就是把這些隱藏在工作背后的情緒與心理邊界收集下來,讓未來的模型不只滿足于回應(yīng)任務(wù),更能對(duì)使用它的人保持足夠的敏感。
1250份訪談只是一個(gè)開始。
而我們,也正在通過這些訪談,慢慢看清自己正在成為怎樣的群體。
參考資料:
https://www.anthropic.com/research/anthropic-interviewer?source=i_email&medium=email&content=Nov2024ClaudeStyles&messageTypeId=140367
秒追ASI
?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點(diǎn)亮星標(biāo),鎖定新智元極速推送!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.