# ViGent - 数字人口播视频生成系统 基于 **MuseTalk + EdgeTTS** 的开源数字人口播视频生成系统。 > 📹 上传静态人物视频 → 🎙️ 输入口播文案 → 🎬 自动生成唇形同步视频 --- ## ✨ 功能特性 - 🎬 **唇形同步** - MuseTalk v1.5 驱动,AI 生成自然口型 - 🎙️ **TTS 配音** - EdgeTTS 多音色支持(云溪、晓晓等) - 📱 **一键发布** - Playwright 自动发布到抖音、小红书、B站等 - 🖥️ **Web UI** - Next.js 现代化界面 ## 🛠️ 技术栈 | 模块 | 技术 | |------|------| | 前端 | Next.js 14 + TypeScript + TailwindCSS | | 后端 | FastAPI + Python 3.10 | | 唇形同步 | MuseTalk v1.5 (GPU) | | TTS | EdgeTTS | | 视频处理 | FFmpeg | | 自动发布 | Playwright | --- ## 📂 项目结构 ``` ViGent/ ├── backend/ # FastAPI 后端 │ ├── app/ │ │ ├── api/ # API 路由 │ │ ├── services/ # 核心服务 (TTS, LipSync, Video) │ │ └── core/ # 配置 │ ├── requirements.txt │ └── .env.example ├── frontend/ # Next.js 前端 │ └── src/app/ ├── models/ # AI 模型 │ └── MuseTalk/ # 唇形同步模型 │ └── DEPLOY.md # MuseTalk 部署指南 └── Docs/ # 文档 ├── task_complete.md └── DevLogs/ ``` --- ## 🚀 快速开始 ### 1. 克隆项目 ```bash git clone <仓库地址> /home/rongye/ProgramFiles/ViGent cd /home/rongye/ProgramFiles/ViGent ``` ### 2. 安装后端 ```bash cd backend python -m venv venv source venv/bin/activate # Windows: venv\Scripts\activate pip install -r requirements.txt cp .env.example .env ``` ### 3. 安装前端 ```bash cd frontend npm install ``` ### 4. 安装 MuseTalk (服务器) 详见 [models/MuseTalk/DEPLOY.md](models/MuseTalk/DEPLOY.md) ```bash cd models/MuseTalk # 按照 DEPLOY.md 步骤安装 ``` ### 5. 启动服务 ```bash # 终端 1: 后端 (端口 8006) cd backend && source venv/bin/activate uvicorn app.main:app --host 0.0.0.0 --port 8006 # 终端 2: 前端 (端口 3002) cd frontend npm run dev -- -p 3002 ``` --- ## 🖥️ 服务器配置 **目标服务器**: Dell PowerEdge R730 | 配置 | 规格 | |------|------| | CPU | 2× Intel Xeon E5-2680 v4 (56 线程) | | 内存 | 192GB DDR4 | | GPU | 2× NVIDIA RTX 3090 24GB | | 存储 | 4.47TB | **GPU 分配**: - GPU 0: 其他服务 - GPU 1: MuseTalk 唇形同步 --- ## 🌐 访问地址 | 服务 | 地址 | |------|------| | 视频生成 | http://服务器IP:3002 | | 发布管理 | http://服务器IP:3002/publish | | API 文档 | http://服务器IP:8006/docs | --- ## 📖 文档 - [MuseTalk 部署指南](models/MuseTalk/DEPLOY.md) - [开发日志](Docs/DevLogs/) - [任务进度](Docs/task_complete.md) --- ## 📄 License MIT