網易首頁 > 網易號 > 正文申請入駐

開源數字人大盤點，有沒有你在用的

2026-02-02 08:24:07　來源: 星哥玩云

廣東舉報

分享至

開源數字人大盤點，有沒有你在用的

這些項目里，有沒有你已經在用了的？

數字人技術在 2024–2025 年迎來爆發，從“能動嘴”到“能演戲”，從“能對話”到“能直播”，開源生態也在快速成熟。

下面這份清單覆蓋了當前 GitHub 上最具代表性的開源數字人項目，涵蓋驅動模型、視頻生成、音頻合成、虛擬主播系統、端側方案等多個方向。

01. Hallo3（復旦開源）

Hallo3 是復旦團隊推出的新一代開源數字人生成框架，主打高保真、自然流暢的面部驅動效果。項目基于先進的生成式視覺模型，能夠精準捕捉音頻與表情之間的對應關系，實現逼真的口型、眼神與面部細節同步。相比傳統方法，Hallo3 在表情細膩度、動作連貫性和視頻質量上都有明顯提升，非常適合科研人員、開發者以及內容創作者進行二次開發或模型訓練。其代碼結構清晰、可擴展性強，是當前國內學術界最具代表性的數字人開源項目之一。

地址： https://github.com/fudan-generative-vision/hallo3

STAR數：1.4k+

定位： 高質量數字人視頻生成框架
亮點：

? 復旦團隊出品，學術背景強
? 支持高保真面部驅動
? 適合科研、二次開發、模型訓練

適用場景： 數字人研究、視頻生成算法驗證

2. LatentSync（字節跳動開源）

LatentSync 是字節跳動開源的高精度音頻驅動數字人框架，專注解決“嘴型不準、節奏不穩”這一行業痛點。它通過潛空間同步技術，將音頻特征與視頻生成過程深度綁定，使得口型與語音的對應關系更加自然、準確。項目在短視頻、虛擬主播、教育講解等場景中表現出色，尤其適合對口型同步要求極高的應用。LatentSync 的模型推理速度快、效果穩定，開源后受到大量開發者關注，是當前數字人口型驅動領域的標桿級項目。

地址： https://github.com/bytedance/LatentSync

STAR數：5.4k+

定位： 高同步性數字人口型驅動
亮點：

? 字節跳動開源，技術成熟度高
? 主打“音頻驅動 → 高精度口型同步”
? 適合短視頻、虛擬主播、教育內容

適用場景： 需要“嘴型精準同步”的數字人場景

3. EchoMimic V2（阿里開源）

EchoMimic V2 是阿里螞蟻團隊推出的數字人表情與動作模仿框架，相比前代版本在自然度、細節還原和驅動穩定性上全面升級。它支持音頻驅動、視頻模仿等多種模式，能夠生成更貼近真人的表情變化和頭部動作。項目在“擬真人”數字人方向表現突出，適合用于主持、講解、客服等需要高可信度的場景。其模型結構經過深度優化，推理效率更高，適合本地部署或云端服務，是阿里在數字人領域最具代表性的開源成果之一。

地址： https://github.com/antgroup/echomimic_v2

STAR數：4.5k+

定位： 高質量表情與動作模仿
亮點：

? EchoMimic 升級版，效果更自然
? 支持多模態驅動（音頻/視頻）
? 適合做“擬真人”數字人

適用場景： 數字人主持、講解、客服

4. Sonic（騰訊 & 浙大開源）

地址： https://github.com/jixiaozhong/Sonic

STAR數：3.2k+

定位： 實時數字人驅動
亮點：

? 騰訊 + 浙大聯合
? 強調實時性，延遲極低
? 適合直播、互動場景

適用場景： 虛擬主播、實時互動數字人

5. HunyuanVideo（騰訊開源）

HunyuanVideo 是騰訊混元大模型體系中的視頻生成模型，支持文生視頻、圖生視頻、動作生成等多種能力。雖然它不是專門的數字人框架，但在數字人背景生成、動作補全、場景擴展等方面有極高價值。模型能夠生成高分辨率、長時序的視頻內容，畫面穩定性和細節表現都處于行業領先水平。對于希望打造“數字人 + 視頻生成”一體化內容的開發者來說，HunyuanVideo 是一個非常強大的底層工具，適合創作短片、廣告、虛擬場景等內容。

大視頻生成模型的系統框架

地址： https://github.com/Tencent/HunyuanVideo

STAR數：11.7k+

定位： 文生視頻 / 視頻生成大模型
亮點：

? 騰訊混元體系的一部分
? 支持高質量視頻生成
? 可用于數字人背景、動作生成

適用場景： 數字人視頻增強、背景生成、動作生成

6. AIGCPanel

AIGCPanel 是一個簡單易用的一站式AI數字人系統，支持視頻合成、聲音合成、聲音克隆，簡化本地模型管理、一鍵導入和使用AI模型。

地址： https://github.com/modstart-lib/aigcpanel

STAR數：4.5k+

定位： 一站式數字人系統
亮點：

? 集成視頻合成、聲音合成、聲音克隆
? 本地模型管理非常方便
? 一鍵導入模型，適合非技術用戶

適用場景： 企業/個人快速搭建數字人系統

7. AI-Vtuber（虛擬主播系統）

Luna AI 是一款結合了最先進技術的虛擬AI主播。它的核心是一系列高效的人工智能模型和平臺，包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、訊飛星火、智譜AI、谷歌Bard、通義星塵、阿里云百煉（通義千問、百川、月之暗面、零一萬物、MiniMax）、千帆大模型（文心一言）、Gemini、Kimi Chat、koboldcpp、FastGPT、Ollama、One-API、AnythingLLM、LLM_TPU、Dify、火山引擎（豆包）。這些模型既可以在本地運行，也可以通過云端服務提供支持。當然，為了讓對話照進現實，還結合了多模態模型，包括 Gemini、glm-4v 的圖像識別能力，獲取電腦畫面進行分析講解。

地址： https://github.com/Ikaros-521/AI-Vtuber

STAR數：4.3k+

定位： 全功能虛擬 AI 主播
亮點：

? 支持 GPT、Claude、通義、文心、Gemini 等幾十種模型
? 支持本地模型（Ollama、text-generation-webui）
? 支持多模態識別（如 Gemini、GLM-4V）
? 能讀取電腦畫面做講解（非常強）

適用場景：

? 24 小時 AI 直播
? 游戲主播
? 教育講解
? 虛擬客服

8. JoyGen

JoyGen 是一個多模態數字人生成框架，支持音頻驅動、視頻驅動等多種方式，主打自然、穩定的數字人生成效果。項目結構清晰，易于二次開發，適合科研團隊和開發者進行自定義訓練或擴展。JoyGen 在表情細節、頭部動作和嘴型同步方面表現均衡，是一個“上手快、效果穩”的數字人方案。對于內容創作者來說，它能快速生成高質量數字人視頻；對于開發者來說，它是一個優秀的研究與工程結合的開源項目。

地址： https://github.com/JOY-MM/JoyGen

STAR數：419

定位： 多模態數字人生成框架
亮點：

? 支持音頻驅動、視頻驅動
? 效果自然，適合內容創作
? 結構清晰，適合二次開發

適用場景： 內容創作、短視頻數字人

9. Duix-Avatar

地址： https://github.com/duixcom/Duix-Avatar

STAR數：12.2k+

定位： 高質量數字人生成
亮點：

? Duix 系列主力項目
? 支持高保真面部驅動
? 效果接近商業級

適用場景： 商業數字人、品牌 IP、虛擬主持

10. Duix Mobile

Duix-Mobile 是 Duix 系列的移動端版本，主打“輕量化 + 端側可運行”。它能夠在手機等移動設備上生成數字人視頻，非常適合 App 內嵌數字人助手、小程序數字人、移動端內容創作等場景。項目對模型進行了深度壓縮與優化，在保證效果的同時顯著降低算力需求。對于希望在移動端落地數字人功能的開發者來說，Duix-Mobile 是目前最成熟的開源方案之一。

地址： https://github.com/duixcom/Duix-Mobile

STAR數：7.8k+

定位： 端側數字人（手機可跑）
亮點：

? 主打“輕量 + 端側可用”
? 適合移動端應用、App 內嵌數字人
? 性能優化優秀

適用場景：

? 手機 App 數字人
? 小程序數字人
? 端側 AI 助手

總結：不同需求怎么選？

需求

推薦項目

高質量數字人視頻

Hallo3、Duix-Avatar、EchoMimic V2

口型同步最強

LatentSync

實時互動/直播

Sonic、AI-Vtuber

文生視頻/動作生成

HunyuanVideo

一站式數字人系統

AIGCPanel

移動端數字人

Duix-Mobile

多模態虛擬主播

AI-Vtuber

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.