文档重构

2026-01-06 17:29:46 +08:00
parent 2ecfb39508
commit 13e261c2a8
5 changed files with 210 additions and 762 deletions
--- a/服务器技术栈.md
+++ b/服务器技术栈.md
@@ -10,7 +10,7 @@
  WebSocket: 用于音频/视频流的实时双向传输 (websockets 库)
  HTTP: 用于控制指令和状态查询

- 新一代 AI 交互管道 (Day 21+ 架构)
+- 新一代 AI 交互管道 (Day 28+ 架构)
  大语言模型 (LLM): GLM-4.6v-Flash (通过 zai-sdk 调用智谱 AI，支持多模态视觉理解)
  语音识别 (ASR): SenseVoiceSmall (通过 funasr 本地部署，高精度中文识别)
  语音活动检测 (VAD): Silero VAD (PyTorch 实现，含 300ms 环形缓冲，抗噪能力强)
@@ -18,6 +18,10 @@

 - 计算机视觉 (CV)
  核心引擎: Ultralytics YOLO (YOLO11 / YOLOv8)
+  模型矩阵: 
+    - 盲道导航: yolo11l-seg-blind.engine
+    - 室内导盲: yolo11l-seg-indoor14.engine (14类)
+    - 红绿灯: yolov8n.engine
  任务类型: 目标检测 (Detection) + 语义分割 (Segmentation)
  推理加速: TensorRT (NVIDIA 深度学习推理引擎，FP16半精度 + .engine 模型文件)
  图像处理: