![]()
除了卷價格,參與者還需努力提升自身的“護城河”。
文|何彬 編|張弘一
出品|數智Tech
國內大模型陷入了“冰火兩重天”。
一面是OpenAI發出封禁郵件、冷臉“脫鉤”,另一面是國產大模型摩拳擦掌、“搬家搶客”。
近日,包括通義千問、文心一言、騰訊混元、商湯科技、智譜AI、百川智能、月之暗面、零一萬物、MiniMax等在內的國產大模型均表示要開放接口,以降價或免費的方式兼容OpenAI。
繼今年5月底結束價格戰,大模型從“厘”跨入“免費”時代以來,頗有硝煙再起之勢。但數智Tech在調研了多位AI大模型行業人士后,發現B端開發者的“遷徙”意愿并不高,多數仍在觀望,“OpenAI的檢測技術和范圍尚不明確,暫時不會有太多行動。”
一位獨立開發者告訴數智Tech,“OpenAI的措施主要針對B端‘套殼’大模型開發商,限制執行地沒想象中嚴格,仍可使用海外服務器或通過創建反向代理來訪問ChatGPT的API。”
某大廠技術總監認為,短時間內國內創業者和開發者不會貿然“搬家”,“畢竟在語料數據和對比效果上,OpenAI提供的代碼和分析邏輯數據相對優質。”
有受訪者進一步對數智Tech表示,OpenAI的購買成本不高,開發者在沒被完全屏蔽掉時,更替意愿不強。目前GPT-4 API的收費標準是每一千個Prompt token收費0.03美元,每一千個Completion token收費0.06美元。
商星環科技創始人孫元浩也指出,目前國產大模型卷價格對企業用戶幫助不大,因為它們對模型的精準度要求更高,市場上最大參數的模型也未必能達到。
大模型好用與否的關鍵在于高質量語料。不論是數據集質量還是維度,國內大模型的行業數據和企業專屬數據還不夠豐富,且用戶增長乏力。加上精準度不高,導致行業人士“搬遷”意愿低。
種種制約下,國產大模型的高質量成長,似乎又陷入了一個“惡循環”。
有從業者稱,如果數據庫中缺乏有用的語料,大模型往往只學到“皮毛”,生成答案也只是“泛泛而談”。一旦在訓練過程中學習到了不精確的內容,大模型生成的答案就會“變形”。加上大模型是基于概率生成答案,沒有足量的優質數據做支撐,國產大模型很難保證返回答案的正確性。
大模型的下個階段,競爭只會更激烈。參與者要想不被推下“牌桌”,除了卷價格,還必須要努力提升自身的“護城河”。在應用場景落地層面,因模型精準度不高和效果不佳,它們還有漫長的一段路要走。
01
模型精度,
不是聯網就能做到
這次OpenAI關停API接口,在一些人看來是機遇,“為國產大模型打開了一扇窗。”
一位從事電商數據分析工作的人士向數智Tech透露,其所在公司正與幾家國產大模型接觸,“技術上國產大模型已達標,且中文語料的理解力較強,不足的數據質量部分還需產業上下游打通。同時,國產大模型目前都能提供免費的定制化技術和客戶服務,不論是從成本還是覆蓋范圍上看,都能滿足中型體量企業的需求”。
一位正與該電商公司接觸作的國產大模型企業內部員工告訴數智Tech,為了優化模型精度,逃離價格“內卷”,公司自去年開始就在研究并借鑒谷歌的檢索文檔技術,今年上線的最新版本將部署“先檢索再生成”的RAG (Retrieval and Generation)技術來提高文本準確率。
目前已有多家國產大模型公司如百融云創、智譜AI等已引入RAG技術。海外的英特爾也在今年5月表示,Llama 270B模型將搭配RAG技術用以強化私有LLM應用。
所謂RAG,即傳統的生成模型嚴重依賴于內部記憶,通過調取模型訓練的數據來生成文本或解答問題。這樣一來,數據準確率存在局限性。
我們可以理解成,傳統的生成模型就像一位老牌廚師,腦子里自有一套食譜,在廚房里只需按照記憶的菜譜進行烹飪即可。
當RAG模型處理任務時,則像一位手邊有手機的廚師,他隨時調取互聯網里海量的食譜和調味方法,靈活將其應用在烹飪的料理中。通過RAG模式訓練的大模型,不僅能兼容傳統語料訓練中的反應力和表達力,且能調用語料庫外海量的文本和圖片模態,結合過往習得的歸納、總結、判斷能力,提高回答的準確性,壓縮用戶的信息篩選和理解時間,從而提高利用效能。
不過該人士也指出,對于尚處在成長階段的國產大模型而言,如何保證檢索質量和生成一致性,并不是聯網就能做到。
首先,在檢索質量方面,如何訓練一個高質量的檢索模型就是挑戰。該從業者解釋道,雖然目前行業內普遍采用的密集向量檢索模型(BERT)能夠提高檢索結果的相關性,但其計算復雜度高,訓練和推理需大量的計算和電力資源。
雖然結合傳統的檢索方法(如BM25)和現代的深度學習檢索模型可以綜合優勢,但兩者如何有效融合也是一個難點。
他表示,盡管多輪檢索和重排序機制可以提高檢索質量,但也增加了系統的復雜性和計算成本。要想實現上下文敏感檢索,還需對模型進行復雜優化;在反饋機制方面,如何收集和利用用戶反饋數據,也需更有效的策略和技術手段;在生成一致性方面,為了對生成的回答進行一致性驗證,需在模型中引入一致性檢查機制。但額外訓練一個一致性判別模型,就意味著企業要投入額外的資源和數據。
同時,一致性檢查機制雖然可以通過約束生成保持內容一致性,但也可能限制生成模型的靈活性和多樣性。
就如何提高模型對于不同模態信息整合和校對的一致性層面,他提出,未來國產大模型還需建立多任務學習框架來提高模型的泛化能力。但多任務學習訓練復雜度高,且不同任務間的干擾,也是亟待解決的問題。
種種制約因素下,AI廠商還需持續性大量投入AB test來提高檢索質量和一致性。
02
從多模態到跨模態,
“微調”決定應用效果
當模型精度的議題被提上日程,大模型的應用效果該如何提升?
以醫療領域為例,一位AI大模型從業者向數智Tech稱,其所在公司今年的訓練重點,是進行醫學影像圖片分割參數的微調。
他解釋道,醫療一個高敏感度的領域,不同疾病和不同器官的醫學影像特征差異顯著。而傳統預訓練模型往往是在大規模通用數據集上訓練的,不經過細顆粒化的微調,在醫學影像上應用效果的偏差很大。
目前在醫學AI領域已經實現了多模態解析醫學影像。但模型在解析過程中,如何讓它實現除了接受、處理文本和圖像信息外,還能實現文本和圖像內容二者的跨模態解析,是這一輪參數微調的關鍵。
一言以蔽之,多模態涉及不同影像和文本數據的解析,而跨模態則專注于不同影像和文本之間進行的數據轉換和信息融合。從多模態到跨模態過程中,微調成了決定應用效果的關鍵一環。
以醫學影像方向為例,要想實現跨模態良好的應用效果呈現,從數據預處理開始,就需對不同模態的圖像進行二次標準化替換,提高影像的分辨率,并進行圖像配準,使得同一解剖結構在不同影像圖片(X光片、CT、核磁共振等)中實現毫米級對應。并通過旋轉、縮放、平移等操作方式增加數據量,增強模型精準度。
面對人體復雜的器官和組織結構,在微調預訓練過程中,開發者們還需要在訓練中不斷通過卷積神經網絡(CNN)提取圖像特征,并針對不同模態定制特征提取器,然后在下個階段進行不同層次的特征融合。
“早期要在數據輸入階段進行文本融合,中期則是圖像融合,后期則要在初步分類后對多模態進行雙向融合。”該從業者稱,要實現絲滑的融合,微調技術是“壓艙石”。
此外,在模型預訓練微調時期,模型開發者們還需針對如腫瘤檢測、器官分割等不同任務,進一步優化模型參數,并運用遷移技術和標注影像數據集,將預訓練模型應用到新的數據集上,減少訓練時間并提高模型性能。
跨模態學習本質上是通過技術將一種模態的圖像生成另一種模態的圖像或文本,從而實現模態間的轉換。這就要求開發者們在微調過程中不斷引入新技術(如循環一致性損失技術, CycleGAN),并使用跨模態匹配網絡,如跨模態對比學習,來訓練模型適應不同模態間的共同特征,從而確保轉換后的圖像能夠順利還原為原模態。
盡管微調聽起來像是在原有基礎上添磚加瓦,但實際操作并不比初始輕松。“尤其醫療行業,對誤差容錯率低,基礎模型難培育應有場景的一大根本就是顆粒太粗,不能產生直接的落地效果。”該從業者表示。
要想實現跨模態轉換,他認為開發者們需在微調階段,大批量大規模地對同一患者的不同部位進行多次多角度拍攝,以喂養模型。等到了數據標注階段,還需要投入大量具備專業知識的醫學相關人員做輔助,標注和校對過程繁瑣,全權依賴人力,在這一過程中容易引入誤差。
其次,由于不同模態的圖像有不同的成像原理,圖像特征差異難對齊,圖像的空間分辨率和對比度差異大,都為模型微調增加了工作復雜性。
此外,模型微調對算力資源也是一大挑戰,特別是在進行多模態融合和跨模態轉換時,訓練復雜的深度學習模型需要長時間計算,且容易不穩定。
需要注意的是,機器深度學習往往是黑箱模型,開發者們難向客戶解釋其決策具體過程。在醫療領域,如何開發具有可視效果的解釋模型以便醫生們理解和信任,也是醫療AI模型的探索和實現商業化落地的一大關鍵。
“當前國產大模型已初具規模,不論是行業型還是通用型AI,參數微調都將成為下一階段各大廠商的‘護城河’。”該人士稱,不僅是醫療大模型,目前針對B端市場的行業AI整體處于成長期,隨著數據的海量增加,算法模型愈加復雜,應用場景的落地效果會在探索中逐步顯現,市場更應該集體減緩焦慮,扎根和縱深行業。
他表示,如果把國產AI比作一輛多功能汽車,前兩年基本實現了能跑,現在到了需要對這輛車進行個性化調整,增加用戶體驗感的時候。而‘微調’就像是根據車主的駕駛習慣和常用路線,調整座椅、設置導航偏好等,只有這樣,這輛汽車才得開地舒服、舒心。”
如今處于爆發前夜的國產大模型,一手抓模型技術,一手抓商業價值。在爭分奪秒的卷拼中,誰能真正落地應用,產出利潤,誰才能笑到最后。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.