Files
ViGent/README.md
2026-01-15 15:55:07 +08:00

139 lines
3.0 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# ViGent - 数字人口播视频生成系统
基于 **MuseTalk + EdgeTTS** 的开源数字人口播视频生成系统。
> 📹 上传静态人物视频 → 🎙️ 输入口播文案 → 🎬 自动生成唇形同步视频
---
## ✨ 功能特性
- 🎬 **唇形同步** - MuseTalk v1.5 驱动AI 生成自然口型
- 🎙️ **TTS 配音** - EdgeTTS 多音色支持(云溪、晓晓等)
- 📱 **一键发布** - Playwright 自动发布到抖音、小红书、B站等
- 🖥️ **Web UI** - Next.js 现代化界面
## 🛠️ 技术栈
| 模块 | 技术 |
|------|------|
| 前端 | Next.js 14 + TypeScript + TailwindCSS |
| 后端 | FastAPI + Python 3.10 |
| 唇形同步 | MuseTalk v1.5 (GPU) |
| TTS | EdgeTTS |
| 视频处理 | FFmpeg |
| 自动发布 | Playwright |
---
## 📂 项目结构
```
ViGent/
├── backend/ # FastAPI 后端
│ ├── app/
│ │ ├── api/ # API 路由
│ │ ├── services/ # 核心服务 (TTS, LipSync, Video)
│ │ └── core/ # 配置
│ ├── requirements.txt
│ └── .env.example
├── frontend/ # Next.js 前端
│ └── src/app/
├── models/ # AI 模型
│ └── MuseTalk/ # 唇形同步模型
│ └── DEPLOY.md # MuseTalk 部署指南
└── Docs/ # 文档
├── task_complete.md
└── DevLogs/
```
---
## 🚀 快速开始
### 1. 克隆项目
```bash
git clone <仓库地址> /home/rongye/ProgramFiles/ViGent
cd /home/rongye/ProgramFiles/ViGent
```
### 2. 安装后端
```bash
cd backend
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
pip install -r requirements.txt
cp .env.example .env
```
### 3. 安装前端
```bash
cd frontend
npm install
```
### 4. 安装 MuseTalk (服务器)
详见 [models/MuseTalk/DEPLOY.md](models/MuseTalk/DEPLOY.md)
```bash
cd models/MuseTalk
# 按照 DEPLOY.md 步骤安装
```
### 5. 启动服务
```bash
# 终端 1: 后端 (端口 8006)
cd backend && source venv/bin/activate
uvicorn app.main:app --host 0.0.0.0 --port 8006
# 终端 2: 前端 (端口 3002)
cd frontend
npm run dev -- -p 3002
```
---
## 🖥️ 服务器配置
**目标服务器**: Dell PowerEdge R730
| 配置 | 规格 |
|------|------|
| CPU | 2× Intel Xeon E5-2680 v4 (56 线程) |
| 内存 | 192GB DDR4 |
| GPU | 2× NVIDIA RTX 3090 24GB |
| 存储 | 4.47TB |
**GPU 分配**:
- GPU 0: 其他服务
- GPU 1: MuseTalk 唇形同步
---
## 🌐 访问地址
| 服务 | 地址 |
|------|------|
| 视频生成 | http://服务器IP:3002 |
| 发布管理 | http://服务器IP:3002/publish |
| API 文档 | http://服务器IP:8006/docs |
---
## 📖 文档
- [MuseTalk 部署指南](models/MuseTalk/DEPLOY.md)
- [开发日志](Docs/DevLogs/)
- [任务进度](Docs/task_complete.md)
---
## 📄 License
MIT