1. 阿里巴巴投30億元啟動(dòng)“千問(wèn)”項(xiàng)目,重塑消費(fèi)習(xí)慣
阿里巴巴投入30億元啟動(dòng)“千問(wèn)”項(xiàng)目,旨在通過(guò)AI技術(shù)重塑用戶(hù)消費(fèi)習(xí)慣,并挑戰(zhàn)現(xiàn)有APP模式,推動(dòng)AI與實(shí)際交易鏈路的深度融合。
→早讀課解讀:電商巨頭正以巨額投入,通過(guò)“千問(wèn)”項(xiàng)目探索以自然語(yǔ)言交互為核心的“對(duì)話(huà)即交易”新范式,意圖繞過(guò)傳統(tǒng)APP的復(fù)雜界面與操作,直接以AI理解用戶(hù)需求并完成服務(wù)閉環(huán)。
→行動(dòng)建議:內(nèi)容創(chuàng)作者、服務(wù)提供商可關(guān)注其開(kāi)放能力,思考如何將自身服務(wù)轉(zhuǎn)化為可被AI調(diào)用的“技能”;用戶(hù)可嘗試適應(yīng)更直接的對(duì)話(huà)式消費(fèi)。
2. 靈光App升級(jí)“閃應(yīng)用”,集成API工具提升效率
靈光App通過(guò)升級(jí)“閃應(yīng)用”功能,新增了“上傳圖片生應(yīng)用”和“桌面小組件”,并集成了近20項(xiàng)API工具,提升了用戶(hù)創(chuàng)建個(gè)性化小工具的效率和體驗(yàn)。
→早讀課解讀:無(wú)代碼應(yīng)用生成從“文字描述”擴(kuò)展到“視覺(jué)輸入”,通過(guò)集成豐富的API工具和桌面小組件,讓普通人能像搭積木一樣構(gòu)建實(shí)用工具,極大提升了個(gè)人生產(chǎn)力工具的創(chuàng)造自由度與使用黏性。
→行動(dòng)建議:非技術(shù)背景的業(yè)務(wù)人員、運(yùn)營(yíng)人員可嘗試?yán)么斯δ埽瑢⒅貜?fù)性工作流程(如數(shù)據(jù)監(jiān)控、內(nèi)容同步)快速轉(zhuǎn)化為自動(dòng)化小工具,提升日常效率。
3. 階躍星辰發(fā)布專(zhuān)為Agent設(shè)計(jì)的開(kāi)源模型Step 3.5 Flash
階躍星辰發(fā)布新一代開(kāi)源基座模型 Step 3.5 Flash,專(zhuān)為 Agent 場(chǎng)景設(shè)計(jì)。模型采用稀疏 MoE 架構(gòu),具備 1960 億參數(shù),每個(gè) token 僅激活約 110 億參數(shù),支持 256K 上下文長(zhǎng)度。
→早讀課解讀:模型架構(gòu)針對(duì)智能體任務(wù)進(jìn)行專(zhuān)項(xiàng)優(yōu)化,在保持超大規(guī)模參數(shù)容量的同時(shí),通過(guò)稀疏激活機(jī)制實(shí)現(xiàn)高能效推理與超長(zhǎng)上下文處理,為復(fù)雜、長(zhǎng)鏈條的智能體應(yīng)用提供了理想的底層模型。
→行動(dòng)建議:開(kāi)發(fā)復(fù)雜智能體、自動(dòng)化工作流應(yīng)用的團(tuán)隊(duì)可重點(diǎn)評(píng)估此模型,尤其適合需要處理長(zhǎng)文檔、多步驟規(guī)劃與決策的場(chǎng)景。
4. Vidu Q3發(fā)布,專(zhuān)為影視級(jí)短視頻創(chuàng)作設(shè)計(jì)
Vidu Q3 作為全球首個(gè)支持16秒音視頻直出的AI視頻生成模型,專(zhuān)為漫劇、短劇、影視劇創(chuàng)作設(shè)計(jì)。模型實(shí)現(xiàn)聲畫(huà)同步高清直出,支持多鏡頭自由切換、多語(yǔ)言對(duì)話(huà)與文字渲染,具備電影級(jí)視聽(tīng)張力。
→早讀課解讀:AI視頻生成正從“生成素材片段”邁向“直接輸出準(zhǔn)專(zhuān)業(yè)級(jí)敘事短片”,在時(shí)長(zhǎng)、畫(huà)質(zhì)、音畫(huà)同步及鏡頭語(yǔ)言上滿(mǎn)足影視工業(yè)的初步要求,大幅降低短片創(chuàng)作門(mén)檻。
→行動(dòng)建議:短視頻創(chuàng)作者、小型影視工作室、廣告公司可嘗試用其快速制作劇情短片、產(chǎn)品廣告等,低成本產(chǎn)出高質(zhì)量視頻內(nèi)容。
5. xAI發(fā)布Grok Imagine 1.0,提升AI視頻生成質(zhì)量與效率
馬斯克旗下xAI公司發(fā)布Grok Imagine 1.0,實(shí)現(xiàn)AI視頻生成技術(shù)重大突破。該版本支持生成10秒720p高清視頻,音頻質(zhì)量顯著提升,大幅縮短高質(zhì)量視頻創(chuàng)作時(shí)間。
→早讀課解讀:頂級(jí)AI實(shí)驗(yàn)室在視頻生成的畫(huà)質(zhì)、音質(zhì)與生成速度上取得同步突破,使得高質(zhì)量短視頻的快速產(chǎn)出成為可能,加速了AI視頻在社交、營(yíng)銷(xiāo)等場(chǎng)景的普及。
→行動(dòng)建議:社交媒體運(yùn)營(yíng)、內(nèi)容營(yíng)銷(xiāo)團(tuán)隊(duì)可關(guān)注此類(lèi)工具,用于快速制作吸引眼球的高清短視頻內(nèi)容,提升內(nèi)容更新頻率與視覺(jué)質(zhì)量。
6. 宇樹(shù)科技開(kāi)源機(jī)器人專(zhuān)用VLA大模型UnifoLM-VLA-0
宇樹(shù)科技宣布開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作大模型UnifoLM-VLA-0。模型基于Qwen2.5-VL-7B架構(gòu),通過(guò)340小時(shí)真機(jī)數(shù)據(jù)訓(xùn)練,融合2D/3D空間感知與動(dòng)力學(xué)預(yù)測(cè)能力,突破傳統(tǒng)VLM在物理交互中的局限。
→早讀課解讀:機(jī)器人專(zhuān)用大模型開(kāi)源,結(jié)合了視覺(jué)語(yǔ)言理解與真實(shí)的物理交互數(shù)據(jù),使機(jī)器人能更好地理解指令并與物理世界進(jìn)行安全、精準(zhǔn)的交互,是具身智能落地的關(guān)鍵一步。
→行動(dòng)建議:機(jī)器人研發(fā)人員、高校實(shí)驗(yàn)室可基于此模型,加速開(kāi)發(fā)能理解自然語(yǔ)言指令并完成復(fù)雜操作任務(wù)的機(jī)器人原型。
在這個(gè)星球,你可以更加系統(tǒng)的學(xué)習(xí)AIGC相關(guān)知識(shí):
1. ChatGPT和AI繪畫(huà)(Midjourney+Stable Diffusion+Photoshop beta)基礎(chǔ)+進(jìn)階全攻略;
2. ChatGPT和AI繪畫(huà)最直接變現(xiàn)案例;
3. 與200+行業(yè)先行者鏈接,積累你的專(zhuān)屬人脈資源;
4. 社群保姆級(jí)一站式服務(wù),包教包會(huì)包討論;
現(xiàn)在加入,立享99元早鳥(niǎo)價(jià)優(yōu)惠,星球用戶(hù)每漲100人,價(jià)格上調(diào)100元,直到恢復(fù)499元原價(jià)!
這個(gè)風(fēng)口抓不抓的住,就看你愿不愿意邁出第一步了!
越晚加入成本越貴!最后兩個(gè)名額又要漲價(jià)了!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.