背景:新品發布期的用戶聲音亟待結構化洞察
2025 年 10 月,華為正式發布 Mate 80 系列旗艦手機,涵蓋 Mate 80、Mate 80 Pro、Mate 80 RS 以及延續經典的 Mate X2 折疊屏機型。作為國產高端智能手機的代表,該系列一經亮相便在全球科技圈引發熱議。我們團隊通過 YouTube Data API 采集了與“Mate 80”相關的數百個熱門視頻下的全部評論數據。
初步統計顯示,僅一周內就收集到 超過 2.1 萬條原始評論,內容涵蓋產品功能評價、價格討論、競品對比、購買意向等豐富維度。然而,這些數據高度非結構化:語言混雜(中英夾雜)、表達隨意(如“M80P太頂了!”、“mate80pro衛星通話救命”)、情緒隱晦(如“等第一批用戶踩雷”實為觀望態度)。更關鍵的是,大量評論與 Mate 80 無關——例如討論 iPhone 16、榮耀 Magic7,甚至與手機完全無關的廣告或表情包。
面對海量噪聲數據,傳統人工閱讀或通用 NLP 工具已無法滿足高效、精準的分析需求。我們需要一個能自動識別具體機型、準確判斷情感傾向、提煉核心關注點的智能系統,并在極低成本下快速落地。
目標定義:構建輕量級、高精度的輿情分析流水線
基于業務訴求,我們明確了三大核心目標:
精準過濾:僅保留明確提及 Mate 80 系列(含 Pro/RS/X2 等子型號)的評論;
細粒度分析:區分不同機型的情感分布與功能關注點;
結構化輸出:生成可直接用于匯報的中文分析報告,包含情感比例、典型語句、熱門維度及各型號聲量。
技術選型:為什么選擇 LazyLLM?
在評估多個方案后,我們決定采用 LazyLLM + DeepSeek 大模型 的組合。原因如下:
開發效率高:LazyLLM 提供統一接口封裝主流大模型(包括 DeepSeek),無需處理認證、重試、流式響應等底層細節;
靈活性強:支持自定義 Prompt,可精確引導模型輸出所需 JSON 結構;
成本可控:結合本地預處理,實現“一次調用、全局分析”的批處理模式。
這一架構完美契合我們的“輕量、精準、低成本”原則。
落地過程:從數據清洗到智能洞察 第一階段:本地規則引擎實現精準過濾
我們首先構建了一個本地型號識別模塊。考慮到用戶寫法多樣(如 “Mate80Pro”、“Mate 80 Pro”、“m80 rs”),我們采用“標準化+最長匹配”策略:
定義標準型號列表:["Mate 80 RS", "Mate 80 Pro", "Mate 80", "Mate X2"];
將評論和型號均去除空格并轉小寫;
按型號長度降序匹配,確保“Mate 80 Pro”不會被誤判為“Mate 80”。
大量評論與 Mate 80 無關——例如討論 iPhone 16、榮耀 Magic7,甚至與手機完全無關的廣告或表情包等(如下圖)
![]()
真正聚焦于 Mate 80 系列的評論散落在海量噪聲之中,且表達形式高度非結構化,因此,我們統一提取所有明確提及 Mate 80 及其子型號(如 Pro、RS、X2)的評論進行分析。
核心代碼如下:
return found if found else ["Unknown"]隨后,我們在主流程中調用該函數進行批量篩選:
return entries該模塊在本地運行,不依賴任何外部 API,2.1 萬條評論僅需 3 秒即可完成過濾。最終,系統從 21,451 條原始評論中精準提取出 274 條有效評論,過濾率達 98.7%。
![]()
第二階段:設計結構化 Prompt 引導大模型輸出
我們將 274 條評論截取前 200 條(兼顧代表性與 token 限制),拼接成一段上下文,并精心設計中文 Prompt,明確要求模型:
統計正面/負面/中性情感數量及占比;
為每類情感提供 2 條原始評論示例;
從預設維度(如衛星通信、操作系統、價格等)中選出熱度最高的 5 項;
分別統計各具體機型的提及次數;
所有輸出字段必須為簡體中文,且為標準 JSON 格式。
這一設計確保了 LLM 的輸出可直接解析,無需后處理。
Prompt 構建代碼如下:
return prompt第三階段:單次調用完成全局分析
通過 LazyLLM 的 OnlineChatModule,我們僅用一行代碼完成 DeepSeek 調用:
raw_output = llm(prompt)為確保結果可靠,我們還加入了安全解析邏輯:
result = {"原始LLM輸出": raw_output}整個過程耗時約 4 秒,消耗約 10,000 tokens,成本僅為 ¥0.0015(約 0.15 分錢)如下圖(0.23包含其他請求)
![]()
第四階段:結果驗證與業務賦能
系統輸出清晰展示了關鍵洞察:
Mate X2 是絕對討論焦點,占相關評論的 98%(196/200),Mate 80 系列幾乎未被提及。
正面情緒為主(62.5%),用戶稱贊其“無折痕折疊設計”和“硬件領先三星”。
負面主要集中在價格與生態:高價(約 $2700)、無 Google 服務、不支持手寫筆和防水,被指“性價比低”。
中性評論多為混淆或詢問,如誤問“Mate 80 Pro 尺寸”,反映新品認知度不足。
高頻維度:折疊屏、價格、系統、設計、相機——聚焦硬件形態與生態短板,Mate 80 新特性尚未進入海外討論視野。
最終生成的 JSON 報告示例如下:
}價值總結:小投入撬動大洞察
本次項目從需求提出到完成僅用 1 日,卻實現了傳統方式難以企及的分析深度與速度。更重要的是,它驗證了一種可復用的輕量化大模型應用范式:本地規則做“減法”,大模型做“加法”,用規則過濾噪聲,用智能提煉價值。
未來,該框架將擴展至 Pura 系列、平板、穿戴設備等產品線,成為我們用戶聲音監測的標準化工具。而這一切的起點,正是 LazyLLM 所提供的極簡開發體驗與強大問題解決能力。
版權聲明:本文作者@Y
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.