1. 可靈AI升級至3.0版本,實現多模態一體化并新增智能分鏡
可靈AI正式升級至3.0版本,推出可靈3.0模型系列,實現多模態輸入輸出一體化,重新定義AI視頻工作流。視頻3.0模型在敘事與控制方面深度進化,新增智能分鏡功能,可自動調度景別與機位。
→早讀課解讀:AI視頻生成正從“單點生成”邁向“一體化創作管線”,通過智能分鏡等高級敘事控制,開始介入傳統上由導演和剪輯師負責的創作核心環節。
→行動建議:視頻創作者、小型制作團隊可嘗試利用其一體化工作流和智能分鏡功能,從構思到成片的效率,尤其是快速制作口播視頻、短視頻劇本等。
2. 面壁智能開源全雙工交互模型MiniCPM-o 4.5
面壁智能開源新一代全模態模型MiniCPM-o 4.5,模型具備”邊看、邊聽、主動說”的全雙工交互能力,讓人機交互從回合制升級為即時自由對話。
→早讀課解讀:人機交互模式迎來重大革新,從“一問一答”的回合制升級為更自然的“同時聽說、主動交互”的全雙工模式,為機器人、虛擬人等應用帶來更擬人的交互體驗。
→行動建議:開發對話機器人、虛擬助手、智能座艙交互的團隊可集成此模型,打造打斷、搶話、主動發起對話等更自然流暢的交互體驗。
3. 支付寶推出AI眼鏡掃福功能,拓展無感交互場景
支付寶在2026年春節推出的AI眼鏡掃福功能,該功能通過無手機操作和智能交互,提升了用戶體驗,并擴展了集福的范圍和獎勵內容。
→早讀課解讀:傳統線上營銷活動與AR眼鏡等新型硬件結合,創造出“無感交互、虛實融合”的新玩法,是拓展線下流量入口、提升用戶參與度的創新嘗試。
→行動建議:品牌營銷、線下零售可關注此類“AR硬件+IP活動”的結合,探索利用可穿戴設備打造沉浸式、游戲化的線下互動體驗。
4. 上海AI實驗室開源萬億參數科學多模態大模型Intern-S1-Pro
上海AI實驗室開源了萬億參數科學多模態大模型Intern-S1-Pro。模型采用MoE架構,總參數1萬億,激活參數220億。基于“通專融合”SAGE技術,具備奧賽級數理推理能力,可精準解析多模態科學內容,覆蓋化學、材料、生命、地球、物理等學科。
→早讀課解讀:超大規模科學大模型開源,將頂級數理推理與多學科專業知識深度融合,為科研工作提供了強大的“AI協作者”,有望加速跨學科的科學發現。
→行動建議:高校、科研院所、企業研發部門的研究人員可嘗試將其用于文獻解析、實驗數據分析、假設生成與科學計算等,提升科研效率。
5. 華為Mate 80系列推送系統更新,引入AI消除屏幕摩爾紋功能
華為Mate 80系列手機推送了HarmonyOS 6.0.0.130SP17系統更新,引入了AI消除屏幕摩爾紋功能,提升了影像處理能力,并優化了星閃和定位性能。
→早讀課解讀:手機系統更新深入影像處理的專業痛點(摩爾紋),并結合自研連接技術(星閃)的優化,體現了軟硬件協同深耕用戶體驗細節的能力。
→行動建議:攝影師、內容創作者等高頻拍攝屏幕的用戶將直接受益于此功能;普通用戶可關注星閃技術在近場傳輸、物聯網連接方面的體驗提升。
6. Mistral AI推出高精度語音轉文本模型Voxtral Transcribe 2
Mistral AI推出的新一代語音轉文本模型Voxtral Transcribe 2,包含兩個版本。Voxtral Mini支持13種語言的高精度轉錄,具備說話人分離、詞級時間戳和上下文偏置功能,適合批量轉錄。
→早讀課解讀:語音轉文本模型在準確性、語言覆蓋及實用功能(如說話人分離、詞級時間戳)上持續進步,為企業級會議記錄、媒體內容生產等場景提供了更成熟的解決方案。
→行動建議:有會議記錄、訪談整理、內容字幕生成等需求的企業或團隊,可評估此模型在多語言、多人場景下的轉錄準確性與效率,考慮集成至工作流。
在這個星球,你可以更加系統的學習AIGC相關知識:
1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;
2. ChatGPT和AI繪畫最直接變現案例;
3. 與200+行業先行者鏈接,積累你的專屬人脈資源;
4. 社群保姆級一站式服務,包教包會包討論;
現在加入,立享99元早鳥價優惠,星球用戶每漲100人,價格上調100元,直到恢復499元原價!
這個風口抓不抓的住,就看你愿不愿意邁出第一步了!
越晚加入成本越貴!最后兩個名額又要漲價了!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.