feat: API文档、文本自动分段、音色配置、批量并发

- 新增 API.md 完整接口文档
- 智能文本分段:长文本按段落/句子/标点边界自动切分(≤2000字/段),逐段TTS后ffmpeg拼接
- /api/tts 支持 voice 参数指定音色
- httpTts JSON 配置增加 style 和 voice 字段
- 批量生成改用并发(Semaphore 3路)
- 新增 /health 健康检查端点
- TTS 试听前端增加音色输入
- 清理 import,修复端口不一致
This commit is contained in:
sunruiling
2026-03-27 14:37:43 +08:00
parent 82624afe68
commit 30544f7f42
6 changed files with 680 additions and 47 deletions

View File

@@ -30,10 +30,16 @@ docker compose up -d
### Web 管理界面 (`/`)
- 📖 书籍管理(添加/删除)
- 📑 章节管理(添加/编辑/删除)
- 🎙️ TTS 试听(支持风格设置)
- ⚡ 单章/批量音频生成
- 🎙️ TTS 试听(支持风格 + 音色设置)
- ⚡ 单章/批量音频生成(自动分段拼接)
- ⚙️ 配置查看
### 核心特性
- **智能文本分段**: 长文本自动在句末/段落边界切分≤2000字/段),逐段生成后拼接
- **多风格支持**: 开心、悲伤、东北话、像个大将军... 任意组合
- **音色切换**: 支持指定不同音色voice 参数)
- **并发批量生成**: 限制 3 路并发,快速完成整本书
### 听书 App 接口
| 接口 | 方法 | 说明 |
@@ -72,7 +78,16 @@ docker compose up -d
| `MIMO_API_ENDPOINT` | ❌ | `https://api.xiaomimimo.com/v1/chat/completions` | API 地址 |
| `MIMO_TTS_MODEL` | ❌ | `mimo-v2-audio-tts` | 模型名称 |
| `MIMO_VOICE` | ❌ | `mimo_default` | 默认音色 |
| `SERVER_PORT` | ❌ | `17200` | 服务端口 |
| `SERVER_PORT` | ❌ | `3333` | 服务端口 |
## 📖 API 文档
完整 API 文档见 [**API.md**](./API.md),包含:
- 所有接口的请求/响应格式
- 参数说明与错误码
- MiMo TTS 风格参考大全
- 文本自动分段机制说明
## MiMo TTS 风格参考