
—— ·要點速覽· ——
1、清華開源 TurboDiffusion:AI 視頻生成最高提速 200 倍,單張 RTX 5090 秒出大片
2、阿里通義 Qwen-lmage-Edit-2511 圖像編輯 AI 模型開源,支持兩人隔空“合照”
3、騰訊混元推出 ETC 領域首款 AI 智能體,問題解決率達 90%
4、人形機器人概念股漲幅擴大 浙江榮泰午后漲停
更聚焦的科技行業交流群,捕捉每一條科技動態,誠摯邀請創業者、發燒友加入我們。微信掃碼進群:
進群后,你有機會得到:
最新、最熱的科技資訊;
最精準的行業資源對接;
論壇、沙龍、企業游學門票。
![]()
1、國產一體化航天任務仿真設計軟件研發商「星邑空間」完成3億元Pre-A輪融資,由深創投領投,開源思創、盛景資本、智宸財富等跟投。
星邑空間是一家國產一體化航天任務仿真設計軟件研發商,公司以“航天測運控+”為發展理念,聚焦航天器測運控服務、空間操控軟件、航天測運控網一體化解決方案三大主營業務,致力于為國內外客戶提供專業、優質、可靠的航天器測運控服務及相關軟硬件產品。
2、具身智能機器人研發應用服務商「云深處科技」完成數億元Pre-IPO融資,由上海國盛集團領投,京東跟投。
云深處科技是一家具身智能機器人研發應用服務商,專注于人形、四足機器人及其核心零部件的自主研發、精益生產、全球銷售與專業服務。公司堅持自主創新,構建了“感知-決策-執行”全鏈路技術體系,其核心的多模態環境感知、跨場景具身導航、AI驅動的感控融合運動控制等新技術,已在多個新場景中應用落地。其自主研發的“絕影”系列機器人在電站、工廠、管廊巡檢、以及應急救援、消防偵查、未來科研等多種應用環境中落地應用,曾在地下管廊服務亞運,參與新加坡國家電網項目,實戰參演應急使命抗震救災、燃爆偵察實戰演習。
3、零碳運力超充快換解決方案提供商「智鋰物聯」完成1億元B輪融資,由九智資本領投。
智鋰物聯是一家零碳運力超充快換解決方案提供商,公司具備新能源重卡換電整體解決方案及軟硬件設備的供應能力。國內首家集電池PACK、車載換電系統、換電裝備、換電運營優化、電池安全監管于一體的數字化重卡換電能源運營解決方案提供商。
4、AI智能備考系統研發商「登榜教育」完成天使輪融資。
登榜教育是一家AI智能備考系統研發商,聚焦軍隊文職招錄考試專業化培訓,業務高度契合國家國防現代化建設與人才強國戰略,精準把握招錄政策動態與命題規律,形成“應試輔導+崗位勝任力培養”的差異化服務模式。
5、多模態感知和AI計算解決方案提供商「一目科技」完成數億元D2輪融資,由博原資本領投,中網投、順為資本、TCL創投跟投。
一目科技是一家多模態感知和AI計算解決方案提供商。公司打造了以微光譜AI芯片和流體識別傳感器為核心的多模態感知+AI計算解決方案,它將物理世界信號轉化為數字世界信號,傳送給目標用戶,幫助家電、水務、機器人、生命科學等多個產業實現智慧升級。一目科技的多模態感知+AI計算解決方案已廣泛應用于智慧水務、智慧家居(智慧凈飲、智慧洗滌)、生命科學等領域,并已打入了TCL、惠而浦、松下等頭部白電廠商的供應鏈。
![]()
1、清華開源 TurboDiffusion:AI 視頻生成最高提速 200 倍,單張 RTX 5090 秒出大片
12 月 25 日消息,清華大學 TSAIL 實驗室聯合生數科技推出開源視頻生成加速框架 TurboDiffusion,該框架能在保持視頻質量的前提下,將端到端擴散生成的推理速度提升 100 至 200 倍。
在技術方面,TurboDiffusion 為實現極致的推理速度,采用了 SageAttention 和 SLA(稀疏線性注意力機制)來加速注意力計算,顯著降低了模型處理高分辨率視頻時的算力開銷。
其次,團隊引入了 rCM(時間步蒸餾)技術,有效減少了擴散模型的采樣步數。這些技術方案的深度融合,讓模型在保持生成效果一致性的基礎上,大幅削減了計算延遲。 GitHub 頁面公布的實測數據展示了驚人的性能躍升。在單張 RTX 5090 顯卡上測試 Wan-2.1-T2V-1.3B-480P 模型,生成 5 秒視頻的原版耗時為 184 秒,而 TurboDiffusion 僅需 1.9 秒。對于參數量更大的 Wan-2.2-I2V-A14B-720P 模型,原版生成耗時高達 4549 秒(約 1.2 小時),TurboDiffusion 將其壓縮至 38 秒。
附上相關檢測結果如下:即便是在 Wan-2.1-14B-480P 模型上,耗時也從 1676 秒驟降至 9.9 秒,速度遠超目前市面上的FastVideo等加速方案。
TurboDiffusion 目前已提供多種規格的模型權重下載,并針對不同硬件進行了針對性優化。針對 RTX 5090、RTX 4090 等顯存有限的消費級顯卡,團隊提供了量化版(Quantized)權重,并建議開啟線性層量化功能;而對于擁有 80GB 以上顯存的 H100 等工業級顯卡,則推薦使用非量化版本以獲得最佳效果。(36氪)
2、阿里通義 Qwen-lmage-Edit-2511 圖像編輯 AI 模型開源,支持兩人隔空“合照”
12 月 25 日消息,阿里通義千問今日宣布 Qwen-Image-Edit-2511 正式開源。 Qwen-Image-Edit 是阿里通義團隊推出的圖像編輯模型。2511 版本中著重進行了包括一致性提升在內的多項增強,新版本的整體生成質量、尤其是人物生成質量,得到顯著提升。
Qwen-Image-Edit-2511 的主要特性包括:提升了角色一致性 集成了 Lora 能力,例如打光、多場景 提升了工業設計能力 提升了幾何推理能力 從具體案例來看,Qwen-Image-Edit-2511 提升了角色的一致性在 Qwen-Image-Edit-2511 中,角色的一致性獲得了提升,模型可以依據輸入肖像圖進行具有想象力的編輯,并維持輸入肖像的人物一致性。
此外,Qwen-Image-Edit-2511 的多人合照的一致性也進一步提升了。Qwen-Image-Edit-2509 相比于 Qwen-Image-Edit 提升了單人合照的一致性,而 Qwen-Image-Edit-2511 又進一步提升了多人合照的一致性,這種一致性使得可以輸入兩張人物照片,并返回一致性很好的合照。
Qwen-Image-Edit-2511 的一個新的特色是集成了部分社區的有趣 Lora Qwen-Image-Edit。Qwen-Image-Edit-2511 集成了這些 Lora,因此基礎模型本身就具備一些 Lora 效果。(IT之家)
3、騰訊混元推出 ETC 領域首款 AI 智能體,問題解決率達 90%
12 月 25 日消息,騰訊混元今日官宣推出 ETC 領域首款 AI 智能體。據介紹,基于混元大模型,騰訊云和安徽驛路微行科技有限公司聯合推出 ETC「助手 Agent」,通過文本或語音發出指令,智能體可精準理解并高效執行。
官方數據顯示,自今年 4 月啟動內測以來,該智能體已服務超百萬用戶,問答準確率達 95%、問題解決率達 90%。ETC 助手基于騰訊混元大模型,融合多模態交互技術,不僅可以通過傳統的文本輸入方式提問,更可體驗 AI 增強的語音交互方式獲取 ETC 服務。 例如,用戶發出“開啟暢行模式”的指令,智能體會調高設備靈敏度,獲得設備快識別、高速快抬桿的通行體驗。
從騰訊混元官方獲悉,ETC 領域首款 AI 智能體可通過 105 種狀態監測算法實時采集設備運行數據,并借助語音交互與關鍵狀態播報;在執行層,既可作為行業百科答疑解惑,也能實現語音直接控制設備。(鈦媒體)
![]()
1、人形機器人概念股漲幅擴大 浙江榮泰午后漲停
![]()
人形機器人概念股漲幅擴大,浙江榮泰午后漲停,埃夫特、拓斯達漲超14%,力星股份漲超9%。(東方財富Choice數據)
![]()
“ 一句話,AI 手機怎么搞,需要產業的廣泛共識,需要 Super Agent 和 Super App 之間的共識。”
朋友,來這場峰會瞅瞅。
更多干貨分享敬請注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.