![]()
![]()
(圖/《機械姬》電影劇照)
越是在這樣的環境下,女性越需要勇敢發聲,即便沒有被提問,也要主動尋找機會表達觀點、融入討論,讓自己的光芒被看見。
?記者 | 潘文捷
?編輯 | Felicia
北京的一個傍晚,林詠華在辦公室里接待了我。她微笑著說,自己身為女性,一路走來,得到了許多的鼓勵和支持。她帶領團隊做系統性的創新,也參與和組織了不少行業女性的活動。
林詠華對計算機技術的熱愛,始于她在廣州本地少年宮上的編程啟蒙課。從AppleⅡ上的LOGO語言,到中華學習機上的C語言,她早早便沉浸于代碼天地中。為了支持她的興趣,母親不惜花掉半年薪水為她購置了一臺“286電腦”。于是,她不再滿足于常規操作,而是癡迷于鉆研底層技巧,例如如何優化有限的內存,讓黑白屏幕呈現出模擬彩色的效果。高中時代,管財務的母親被手抄工資條折磨得眼花,便“委托”女兒幫忙。林詠華一邊備戰高考,一邊通過自學,編寫出了一套用于記賬發薪的程序。
后來,林詠華在西安交通大學就讀,當時她雖然擁有保研名額,但需要找到愿意接收她的導師。她找到系里最有名且以嚴厲著稱的導師——殷勤業。當時,實驗室里主要是男生。殷勤業給了林詠華一個月時間去解決一個難題,以此考察她的動手能力。林詠華成功解決了難題之后,殷勤業同意接收她。“在我后續整個研究生學習過程中,殷老師對我的要求很嚴格,但也給了我很多支持。”林詠華說。
![]()
(圖/作者提供)
進入職場后,林詠華有十六七年都在IBM中國研究院工作。“我很幸運,因為IBM本身很鼓勵女性走上技術崗位、技術領導崗位。我的上級領導,包括我的mentor(導師),都很幫助我成長。”當時IBM的董事長、首席執行官羅睿蘭是一位女性,她在整個公司發起了托舉技術領域女性的計劃。
林詠華在IBM晉升到技術領域的最高崗位——杰出工程師(Distinguished Engineer)。“羅睿蘭女士通過多年的努力,成為IBM首位女性董事長,她也希望有更多的女性能像她這樣,走上領導崗位。我相信這是她希望能夠幫助更多女性成長的原因。”林詠華說道。
2018年,林詠華被IBM總部任命為IBM中國研究院院長。她不僅是該院成立以來首位在中國本土成長起來的院長,也是首位女性院長。這是標志著其個人職業成就與公司人才發展的重要里程碑。
為了推動AI領先的科研成果實現產業落地,林詠華加入了非營利性研究機構——北京智源人工智能研究院(下文簡稱“智源”),現擔任該研究院的副院長兼總工程師。
在接受《新周刊》的采訪時,林詠華談到了身為一名技術型女性,她如何幫助其他女性共同成長,也談到了目前她在人工智能領域的一些重要關切和取得的突破。
![]()
女性該怎么“推銷”自己?
新周刊:你在IBM中國研究院得到了大量的支持和幫助,你自己后來有做類似的工作嗎?
林詠華:我在2017年牽頭成立了IEEE女工程師協會北京分會。當時依托IBM中國研究院與眾多高校的緊密合作,我們在產學研領域具備了一定影響力,也借此為女性技術人才——無論是科研人員還是工程師——搭建起一個專屬平臺。2019年我們舉辦了首屆論壇,之后每年延續。如今我已不再擔任會長職務了。
這類組織在海外起步較早,例如英偉達GTC大會就設有“女性免費、男性付費”的交流派對,以此吸引更多女性參與。我們創立IEEE女工程師協會北京分會之初,國內還鮮有專門面向女性科技工作者的平臺;但如今,包括中國計算機學會在內的多家學會,以及國內許多行業的重要會議,都已設立專門針對女性開發者與研究人員的分論壇,為她們創造交流與見面的機會。
在這些會議上,議題往往更偏向“軟性”。參與者中既有經驗豐富的分享者,也有不少剛剛步入職場或學術領域的年輕女性,她們常帶著困惑而來,或希望拓展人脈。我們的分享雖然會涉及技術,但更多時候是探討技術女性如何充實自我、突破局限,更清晰地認識自身優勢,看見自己未來可能成為的樣子。
![]()
(圖/來源網站unsplash)
新周刊:很多女性初入職場,可能不是很自信,不知道怎么展現自己。
林詠華:我很早就注意到這個問題。剛入職場時,每個人都會經歷從表現平平到逐漸出色、從無人知曉到被人認可的過程。確實有人天生自信,不管做得怎樣都信心滿滿,但大多數人——尤其是中國人——性格較為謙虛內斂,在職業起步階段,自信心往往還沒建立起來。
信心不是一天養成的。那時我意識到,人如果一直不敢表達自己,只會被困在囚籠里。剛參加工作那幾年,我經常逼自己在會上必須至少發言一次,就這樣一點點把自信建立起來。
當時常有一些從美國來的資深研究員主持圓桌討論,他們都是我們敬仰的領域專家。IBM也會優先推薦女性研究人員參加討論。但即便被安排坐到圓桌邊,如果自己不主動發言,也是白白浪費機會。為了給專家留下印象,便于日后能有合作的機會,我只能一次次逼迫自己開口。
新周刊:我看到你在過往的采訪中說,同樣是坐在桌子前,但如果不主動“推銷”自己,第一個被提問的人往往不會是女性,尤其是在技術領域。你是怎么打破這個局面的?女性應該如何主動“推銷”自己?
林詠華:我相信很多女性技術工作者都經歷過類似的局面:坐在會議桌前,如果桌上沒有名牌或職務說明,別人往往會默認這些女性從事的是非技術類崗位,或是擔任非技術類崗位的領導。我們必須承認,現實中的數據確實如此。尤其在技術類崗位領導層,女性占比低于20%。所以為了不“猜錯”被提問者的職務,人們往往會先向男性提問。
越是在這樣的環境下,女性越需要勇敢發聲,即便沒有被提問,也要主動尋找機會表達觀點、融入討論,讓自己的光芒被看見。謝麗爾·桑德伯格所著的《向前一步——女性,工作及領導意志》中對我最重要的提醒就是:開會時不要坐在后排,不要因為沒被點名而慶幸“逃過一劫”,而是應該主動“向前一步”。這不僅是對女性的鼓勵,對男性同樣適用。
![]()
《向前一步——女性,工作及領導意志》
[美]謝麗爾?桑德伯格 著
顏箏 譯
中信出版社,2013-6
新周刊:參加女性會議和參加普通會議有什么不一樣?
林詠華:在當前高校計算機專業中,本科生的男女比例常維持在7∶3,有的學校女性的占比甚至更低;進入技術職場后,女性的占比會進一步下降。這也導致技術會議中男性常占80%甚至90%以上。若一位女性本身性格并不外向,在這樣的環境中往往更難主動參與交流。
男性之間可能通過一個拍肩就可以展開對話,而女性技術人員往往缺乏破冰的勇氣。但在純女性場合中,她們更容易放松,也能更快建立起有效聯結。女性會議雖不能替代無性別導向的會議,卻能讓參會者——尤其是學生、青年教師或企業職員——更直接地與院士、教授或技術領袖交流,拓展研究、實習或項目合作的機會。無論男女,融入技術社區、拓展專業人脈都同樣重要。
新周刊:我看到你在一個采訪中說:“說起來有一陣子我對智源還挺自豪的,當時智源內部的AI系統、AI大模型評測、語言大模型團隊的負責人都是女性。”為什么智源有很多女性擔任團隊負責人?有什么重要的特點或長處能助力她們晉升到這些位置?智源有支持女性的舉措嗎?
林詠華:我是在2022年發現這個現象的。那時,我們的數據研究組經理是女性,AI系統組經理是女性,語言模型組經理是女性,AI評測組經理也是女性。我在一次IEEE女工程師協會年會上,特意把她們的照片放在一起,很自豪地告訴大家,智源大模型團隊從上到下不同層級的領導大都是女性。但這并不是刻意安排的。
我們的人數不多,因此并未刻意推動這類項目,畢竟它們需要大量參與者。坦白說,今天的女性仍須同時承擔工作與家庭的雙重責任。相較于國內一些大廠,智源為有需要的同事提供了更加靈活的工作條件。在這一靈活體制下,受益更多的無疑是女性同事。
![]()
(圖/來源網站unsplash)
新周刊:你認為,身處行業之中,個體是否應該關注自己的性別身份?
林詠華:不需要太關注這件事,否則很容易先把自己矮了半截。但是無論女性還是男性,“向前一步”的做法其實都適用——去表達,更主動地去承擔一些責任。
![]()
AI硬件的創新還遠遠沒到滯緩期
新周刊:智源發布的CCI4.0已經成為全球范圍內具有影響力的高質量中英文數據集。對于數據集中可能存在的各種偏見(例如文化、性別、地域等),你們是怎么識別、評估和處理的?在構建如此大規模、高質量的數據集時,你們面臨的最大技術挑戰是什么?
林詠華:原始的數據的確會有很多不同的價值觀、偏見等。我們會訓練特定的模型,設計各種規則,對數據集進行清洗和過濾。經過清洗和過濾之后,可以大幅減少這些問題對數據集的影響。但是畢竟數據集為中英雙語,規模超過30TB,無法保證每一行數據都無誤或來源準確。作為數據集的提供方,我們正憑借自有技術能力努力做得更好。
打造開源數據集,最難的是預判用戶需求。用戶遍布千行百業,眾口難調。今年我們采取了兩項重要措施:其一,為CCI數據集打上詳盡的標簽,僅質量維度便分為高、中、低三級,用戶可按標簽自行過濾;其二,推出工具平臺“數據魔方”,從“我們猜用戶要什么”轉為“用戶自己定義要什么”。用戶只需用一兩句自然語言描述自己的需求,平臺即可從海量數據中即時聚合符合條件的數據集并提供下載服務,讓每位應用開發者或行業模型開發者都能取用所需數據。我們近期還會開源一項重要的具身智能數據集RoboCOIN,這是全球本體數最多、標注最細、使用最便捷的雙臂機器人操作數據集。
![]()
(圖/《機械姬》電影劇照)
新周刊:為什么需要提供低質量的數據集?
林詠華:對于特別低質量的數據,我們會直接過濾,但是總會有通過打分來區分的稍低質量的數據。大模型在學習的時候,不能完全依靠高質量數據——如果只見過高質量數據,日后的容錯性就比較低。比如,很多時候可能會有一些同音字錯誤,如果大模型只學習了正確的寫法,當咱們問的問題里頭摻雜了幾個同音錯字,它可能就回答不出來了。
同樣,我們不僅需要提供成功的數據,也得提供一些失敗的數據。見過失敗的數據,模型才能夠自我糾錯。例如讓它去拿一瓶水,可能它會將水推倒,那它就知道這瓶水倒了之后,接下來要干什么;如果永遠只是正向地告訴它這瓶水該這么拿,那么萬一這瓶水倒了,它就不知道該怎么做了。
新周刊:普通人使用AI工具時,常常很難判斷各家AI工具的優劣。能否談談你們在AI大模型評測方面的理念和方法論?一個客觀、科學的評測體系對于引導大模型技術健康發展有多重要?
林詠華:我們一直認為,大模型評測的核心是“以評促優”,即通過評測推動模型變得更加優秀。因此在我們看來,打榜(即讓模型在公開的測試平臺或榜單上進行“考試”或“擂臺PK”,用分數或排名來展示自己當前的能力水平)本身是一件特別次要的事情。如今,眾多榜單反復測試的,很多都是常識問答題、數學題、編程題等。邏輯答題能力雖然重要,但如果評測始終圍繞這類能力打轉,行業便容易忽視對新能力的探索。我們的理念始終是:有能力去設計更新穎的評測維度,可以挖掘模型尚未暴露的問題,并引導大模型企業向這些新能力進發。
智源大模型評測團隊自2022年起就持續挖掘和評估大模型能力。語言模型剛興起時,我們已著手相關工作。2024年,我們多次發版公布結果,并與北京市海淀區教委合作,邀請海淀區教師出了一系列覆蓋小學三年級至高中三年級、涵蓋多科目的K12新題,確保這些資料是模型從未見過的,再評測模型的測試結果,并與人類智力水平——例如海淀區學生的平均水平,進行對比。
今年年初,我們決定啟動全新的推理邏輯評測,原因在于當前大模型的能力已邁上新臺階,沿用舊有評估方法已難以挖掘更多問題。因此,自今年3月開始,我們花費了大半年時間投入全新的、針對邏輯推理能力的題庫建設,其中大量題目需人工主觀評定,耗時極長。我們針對DeepSeek等模型的邏輯推理的新特性——先輸出長段思考過程,再給出結論——搭建了評測集、評測方法和評測基準。我們也剛發布了一套全新的邏輯推理評測體系。
![]()
(圖/來源網站unsplash)
當前用戶普遍關心的是,面對復雜的、未收錄的提問,模型能否答對。但是,模型輸出推理需消耗大量token,成本最終仍會折算到消費者或企業的賬單上。因此,新評測不僅比較哪種大模型能在邏輯推理上攻克更陌生、更復雜的問題,還要比較哪種大模型能用更少的token、更低的成本給出正確答案。
再舉一個例子。大模型有時候輸出的答案是對的,但“思考”或者推理的過程可能全是錯的;也有一些情況中,過程是對的,但輸出的結果卻是錯的。其實很多時候,這不光是用戶關心的問題,大模型企業也很關心——企業方也想從評測里知道,現在大模型普遍存在什么樣的問題。
新周刊:你強調打破中心化、封閉的“煙囪式”生態,是什么意思?
林詠華:AI硬件的形態還遠遠沒有收斂。把人腦跟AI芯片對比,人腦可以用百萬分之一的功耗、萬分之一的訓練數據量,就達到與現在大模型持平的智力水平。這說明,人腦無論是在結構的高效性還是在學習方法的高效性上,仍然遠優于現有的AI芯片架構或算法模式。正因如此,硬件的顛覆性創新還將持續。
![]()
(圖/作者提供)
問題在于,每一款芯片從設計到批量落地,投資都高達幾億元甚至更多。如果上層的軟件完全用不起來或者不能適配,新的芯片就無法被大范圍、便捷地使用,投資也就打了水漂。這樣的話,試問誰還敢再投資下一款創新芯片?這必然阻礙芯片的創新,也阻礙AI能力的提升。
因此,我們希望打造一個開放的計算生態:底層是各種AI芯片,上層是各種AI算法和模型,中間原本是煙囪式垂直割裂的軟件生態,現在我們希望與業界一起打造統一開源的基礎軟件棧,讓創新的大模型算法可以用同一套技術棧運行各種AI硬件。
這樣做的好處有二:第一,開發者、用戶、企業可以按需選用芯片,選擇多了,芯片的價格自然下降,使用門檻更低;第二,制作AI硬件的企業和芯片創新企業可以專注于下一代架構創新,而上面的軟件棧由社區共同推進,實現產業分工。
這項技術相當具有挑戰性。我們目前正在聯合多個科研機構的力量,共同打造一套統一開源、面向多種AI芯片的系統軟件棧——眾智FlagOS,向下要兼顧不同芯片的架構,并讓每種芯片都能極致發揮其性能。然而,“統一”與“極致”之間天然存在矛盾——如果只追求統一,所有芯片可能只能停留在中位性能;如果放棄統一,單一芯片雖可做到極致,卻失去了通用性。如何平衡兩者,是設計上的核心難點。
這是從芯片角度出發的思考。向上層看,還存在用戶開發語言發散的問題。用戶可能直接在語言層開發AI算法,而語言層本身正逐漸發散成多種編程語言。我們無法強迫開發者只能使用某一種語言。因此,中間技術棧既要平衡下方芯片的差異,又要兼顧上方用戶對各類開發語言的選擇需求。
新周刊:一種常見的憂慮是把人類與AI對立起來,擔憂AI有朝一日會替代或毀滅人類。也有像唐娜·哈拉維這樣的女性思想家會用“后人類主義”確立起新的開放式框架,換一個角度去思考人機之間的情感聯結。從一個技術實踐者的角度看,你如何看待人類與AI的未來?
![]()
《類人猿、賽博格和女人:自然的重塑》
[美]唐娜·哈拉維 著
陳靜 譯
河南大學出版社,2016-12
林詠華:我始終認為未來必然是人機協同。例如智源在打造眾智FlagOS技術棧的過程中,為加快迭代,讓生態更蓬勃,我們正在大量使用大模型和AI自動化方式,使技術棧對算法場景的覆蓋迭代速度更快。
這個過程本質上就是人機協同:我們構建的技術棧本身服務于AI發展,未來將孕育出更好的芯片與算法;同時,我們也用AI來加速技術棧自身的迭代。今年,我們發布了名為Triton-Copilot的自動化AI工具,用于幫助大模型的開發人員自動生成Triton語言的算子。我們非常相信人機協同的價值。
當然,其中確有必須守住的紅線。若在某些場景下刻意用AI作惡,必然引發災難性后果。這也正是當前人工智能學術界與產業界已形成的共識:AI安全與“AI向善”必須深深刻進所有從業者的腦海,大家共同守住這一底線。所謂“道高一尺,魔高一丈”,因此AI安全研究不可或缺。智源也已確立AI安全的研究方向,專門探討“矛與盾”的問題。
696期雜志
《她世紀2.0》已上市
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.