1.5 KiB
1.5 KiB
ViGent - 数字人口播视频生成系统
基于 MuseTalk + EdgeTTS 的开源数字人口播视频生成系统
功能
- 📹 上传静态人物视频,生成口播视频(唇形同步)
- 🎙️ TTS 配音 / 声音克隆
- 💬 自动生成字幕
- 📱 一键发布到多个社交平台
技术栈
| 模块 | 技术 |
|---|---|
| 前端 | Next.js 14 |
| 后端 | FastAPI + Celery |
| 唇形同步 | MuseTalk (GPU1) |
| TTS | EdgeTTS |
| 视频处理 | FFmpeg |
| 自动发布 | Playwright |
项目结构
/home/rongye/ProgramFiles/ViGent/
├── backend/ # FastAPI 后端
├── frontend/ # Next.js 前端
├── models/ # AI 模型 (MuseTalk)
└── deploy.sh # 一键部署脚本
服务器部署 (Dell R730)
# 进入部署目录
cd /home/rongye/ProgramFiles/ViGent
# 一键部署
chmod +x deploy.sh
./deploy.sh
启动服务
# 后端 API (端口 8000)
cd /home/rongye/ProgramFiles/ViGent/backend
source venv/bin/activate
uvicorn app.main:app --host 0.0.0.0 --port 8000
# 前端 UI (端口 3000)
cd /home/rongye/ProgramFiles/ViGent/frontend
npm run dev
GPU 配置
| GPU | 用途 |
|---|---|
| GPU 0 (RTX 3090 24GB) | 其他服务 |
| GPU 1 (RTX 3090 24GB) | MuseTalk 唇形同步 |
访问地址
- 视频生成: http://服务器IP:3000
- 发布管理: http://服务器IP:3000/publish
- API 文档: http://服务器IP:8000/docs
License
MIT