148 lines
3.8 KiB
Markdown
148 lines
3.8 KiB
Markdown
# ViGent 数字人口播系统 - 开发任务清单
|
||
|
||
**项目**:ViGent 数字人口播视频生成系统
|
||
**服务器**:Dell R730 (2× RTX 3090 24GB)
|
||
**更新时间**:2026-01-15
|
||
**整体进度**:95%(MuseTalk 推理环境修复完成,生成帧验证通过)
|
||
|
||
## 📖 快速导航
|
||
|
||
| 章节 | 说明 |
|
||
|------|------|
|
||
| [已完成任务](#-已完成任务) | Day 1-3 完成的功能 |
|
||
| [后续规划](#️-后续规划) | 待办项目 |
|
||
| [进度统计](#-进度统计) | 各模块完成度 |
|
||
| [里程碑](#-里程碑) | 关键节点 |
|
||
| [时间线](#-时间线) | 开发历程 |
|
||
|
||
**相关文档**:
|
||
- [Day 日志](file:///d:/CodingProjects/Antigravity/ViGent/Docs/DevLogs/) (Day1-3)
|
||
- [部署指南](file:///d:/CodingProjects/Antigravity/ViGent/Docs/DEPLOY_MANUAL.md)
|
||
|
||
---
|
||
|
||
## ✅ 已完成任务
|
||
|
||
### 阶段一:核心功能验证
|
||
- [x] EdgeTTS 配音集成
|
||
- [x] FFmpeg 视频合成
|
||
- [x] MuseTalk 唇形同步 (代码集成)
|
||
- [x] 端到端流程验证
|
||
|
||
### 阶段二:后端 API 开发
|
||
- [x] FastAPI 项目搭建
|
||
- [x] 视频生成 API
|
||
- [x] 素材管理 API
|
||
- [x] 文件存储管理
|
||
|
||
### 阶段三:前端 Web UI
|
||
- [x] Next.js 项目初始化
|
||
- [x] 视频生成页面
|
||
- [x] 发布管理页面
|
||
- [x] 任务状态展示
|
||
|
||
### 阶段四:社交媒体发布
|
||
- [x] Playwright 自动化框架
|
||
- [x] Cookie 管理功能
|
||
- [x] 多平台发布 UI
|
||
- [ ] 定时发布功能
|
||
|
||
### 阶段五:部署与文档
|
||
- [x] 手动部署指南 (DEPLOY_MANUAL.md)
|
||
- [x] 一键部署脚本 (deploy.sh)
|
||
- [x] 环境配置模板 (.env.example)
|
||
- [x] 项目文档 (README.md)
|
||
- [x] 端口配置 (8006/3002)
|
||
|
||
### 阶段六:MuseTalk 服务器部署 (Day 2-3)
|
||
- [x] conda 环境配置 (musetalk)
|
||
- [x] 模型权重下载 (~7GB)
|
||
- [x] subprocess 调用方式实现
|
||
- [x] 健康检查功能
|
||
- [x] 实际推理调用验证 (Day 3 修复)
|
||
|
||
---
|
||
|
||
## 🛤️ 后续规划
|
||
|
||
### 🔴 优先待办
|
||
- [ ] 视频合成最终验证 (MP4生成)
|
||
- [ ] 端到端流程完整测试
|
||
- [ ] 社交媒体发布测试
|
||
|
||
### 🟠 功能完善
|
||
- [ ] 定时发布功能
|
||
- [ ] 批量视频生成
|
||
- [ ] 字幕样式编辑器
|
||
|
||
### 🔵 长期探索
|
||
- [ ] 声音克隆 (GPT-SoVITS)
|
||
- [ ] Docker 容器化
|
||
- [ ] Celery 分布式任务队列
|
||
|
||
---
|
||
|
||
## 📊 进度统计
|
||
|
||
### 总体进度
|
||
```
|
||
███████████████████░ 95%
|
||
```
|
||
|
||
### 各模块进度
|
||
|
||
| 模块 | 进度 | 状态 |
|
||
|------|------|------|
|
||
| 后端 API | 100% | ✅ 完成 |
|
||
| 前端 UI | 100% | ✅ 完成 |
|
||
| TTS 配音 | 100% | ✅ 完成 |
|
||
| 视频合成 | 100% | ✅ 完成 |
|
||
| 唇形同步 | 98% | ✅ 推理环境修复,帧生成成功 |
|
||
| 社交发布 | 80% | 🔄 框架完成,待测试 |
|
||
| 服务器部署 | 98% | ✅ 依赖修复,待最终联调 |
|
||
|
||
---
|
||
|
||
## 🎯 里程碑
|
||
|
||
### Milestone 1: 项目框架搭建 ✅
|
||
**完成时间**: Day 1
|
||
**成果**:
|
||
- FastAPI 后端 + Next.js 前端
|
||
- EdgeTTS + FFmpeg 集成
|
||
- 视频生成端到端验证
|
||
|
||
### Milestone 2: 服务器部署 ✅
|
||
**完成时间**: Day 3
|
||
**成果**:
|
||
- PyTorch 2.0.1 + MMLab 环境修复
|
||
- 模型目录重组与权重补全
|
||
- MuseTalk 推理成功运行
|
||
|
||
---
|
||
|
||
## 📅 时间线
|
||
|
||
```
|
||
Day 1: 项目初始化 + 核心功能 ✅ 完成
|
||
- 后端 API 框架
|
||
- 前端 UI
|
||
- TTS + 视频合成
|
||
- 社交发布框架
|
||
- 部署文档
|
||
|
||
Day 2: 服务器部署 + MuseTalk ✅ 完成
|
||
- 端口配置 (8006/3002)
|
||
- MuseTalk conda 环境初始化
|
||
- subprocess 调用实现
|
||
- 健康检查验证
|
||
|
||
Day 3: 环境修复与验证 ✅ 完成
|
||
- PyTorch 降级 (2.5 -> 2.0.1)
|
||
- MMLab 依赖全量安装
|
||
- 模型权重补全 (dwpose, syncnet)
|
||
- 目录结构修复 (symlinks)
|
||
- 推理脚本验证 (生成593帧)
|
||
```
|
||
|