科大訊飛股份有限公司AI研究院副院長,認知智能全國重點實驗室的青年領軍人才,首個國產自主可控、效果業界一流的訊飛星火大模型研發者之一......這一串沉甸甸的榮譽成果,來自年僅34歲的青年劉權。
“90后”劉權十余年的“科創路”走得堅定、艱難,卻熠熠閃光。
敢闖“無人之境”
“剛開始研究時,該領域參與的學校和研究者都比較少,知識庫沒有現成可獲取的,技術本身和系統評價都是難題。”劉權說。
2012年,劉權加入了中國科大語音及語言信息處理國家工程研究中心,開展自然語言處理(Natural Language Processing,以下簡稱“NLP”)方向的研究。
當時他所在的實驗室,同屆十幾名研究生同學都選擇了語音識別、語音合成等熱門和實驗室優勢方向,他獨獨鐘情于自然語言處理。導師曾語重心長地勸他:“如果選擇這一方向,畢業可能有風險,你考慮清楚了嗎?”
劉權沒有太多猶豫,因為興趣愛好堅定了自己的選擇。“在研一導師安排的一個項目中接觸了半年文本處理技術后,自己對從事自然語言技術研究的熱情快速上升,讓機器理解人類語言這件事情非常有趣。”劉權說。
2014年,科大訊飛開啟“超腦計劃”,希望全面打造認知智能引擎,實現“從讓機器能聽會說、到能理解會思考”。同年,劉權成為了“超腦計劃”的一號研究員。“當時正值深度學習技術飛速發展的初期,感知智能技術取得了大幅突破,NLP領域也正在掀起一輪技術革新。”劉權告訴記者,基于深度學習的自然語言處理技術不斷發展與突破,也逐步應用在科大訊飛多項產品中,“舉個例子,汽車智能導航系統中,保證系統收到語音并識別成文本后,能夠理解文本語義與用戶意圖、完成對話系統響應及回復,就是我當時的工作之一。”
2017至2022年,劉權主導研發了業界首個支持全雙工自由交互的中文語音對話系統,并在智能汽車、智慧家庭等場景實現了大規模應用落地。
五個月 培育“最聰明”的大模型
2022年11月底,ChatGPT橫空出世,就像是一顆巨石,在全球人工智能領域激蕩起陣陣漣漪。劉權是訊飛研究院內第一位“觸摸”漣漪的人。
“在相關領域深耕了很久,看到這個成果,我非常興奮。它不僅可以智能回答人類的各類問題,在大量自然語言處理任務上的效果也非常驚艷。”回憶起當時的場景,劉權的語氣仍有些激動。興奮之余,壓力也接踵而至。
新的挑戰出現了。時代的浪潮中,不進則退,只有迎頭趕上。那年年底,依托認知智能全國重點實驗室,在公司的支持和統一調度下,劉權牽頭帶領團隊,開展訊飛星火大模型核心研發攻關工作。
“第一個模型訓練完成后效果很不理想。”劉權記得,2023年春節后回來的那次測試,讓整個團隊都有些緊張,“精心培育的幼苗,長勢卻不盡如人意。可時間緊、任務重,大家一刻都不敢松懈。”
經過連續數周的高強度攻關,持續不斷地更新迭代,三個多月的時間,他們不僅克服算力被限等諸多困難,還創新性地提出無監督數據高效構建及處理方法、有監督指令自進化方法、行業知識融合學習算法等技術,促使大模型的測試分數從30多分一路攀升到70分。
3月底,這項成果在企業內部會議上第一次“公開亮相”。“那天,董事長和各位領導都在現場。大家現場對研發的訊飛星火大模型雛形系統提了不少問題,我們做了現場測試和效果展示。”回憶起兩年前的那天,劉權印象深刻,仿佛就在昨日,“模型對答如流,現場也響起了掌聲。那一刻,大家都很激動。”
這次成功亮相,也敲定了訊飛星火大模型的發布日期——2023年5月6日。當年8月,《麻省理工科技評論》對中國主流大模型能力的評測報告中,訊飛星火大模型V2.0以81.5分(百分制計)的成績在本次評測中登頂,當時被譽為中國“最聰明”的大模型。
讓國產大模型“持續向前”
今年11月6日,深度推理大模型訊飛星火X1.5發布,在全國產算力平臺上攻克MoE模型全鏈路訓練效率,在模型參數小一倍的情況下對標國外領先水平,其多語言能力超130種,為世界提供第二選擇,并推動教育、醫療等行業大模型能力升級。在自主可控的技術底座技術上,科大訊飛發布了融合AI+麥克風陣列、AI+揚聲器陣列等軟硬件一體的解決方案以及多模態交互能力,更圍繞“更懂你的AI”發布或升級了教育、醫療、汽車、辦公等多個領域的AI新產品。
“我們大模型最難得的不僅是‘聰明’,還有‘自主可控’。”劉權告訴記者,訊飛星火大模型是迄今為止唯一在國產化算力上訓練且持續進步的大模型,走了一條最難但最“安全”的路——訊飛與華為聯合構建國產算力平臺。一直以來,訊飛星火大模型在全國產化平臺上完成多次迭代升級,在研發上受限多、難度大,但在國產自主可控上具有無可比擬的優勢。
“大模型研發不是三兩年就能分出勝負的,AI這條路還有很長的路要走。”劉權說。在當前激烈的中美AI科技競爭態勢下,國產化算力上訓練大模型的過程極為艱苦,需要適配和優化的工作極多、周期很長,為保持大模型競爭力需要付出額外的巨大努力,同時需要有昂揚的奮進精神和創新意識。
現在,訊飛研究院在大模型研究領域的青年研究團隊,已經從當時的數十名拓展到數百名,過去幾年,他們完成了訊飛星火大模型的十余次重大迭代升級。目前,他們采取“雙線作戰”的方式:一方面在底座模型層持續創新,確保訊飛星火大模型在行業內的領先地位;另一方面深入教育、醫療等垂直領域,讓AI為更多行業賦能。“不在乎一時快慢,重要的是持續向前。”劉權說。(見習記者 陳 璐)
![]()
劉權(右一)和研究團隊成員
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.