feat: API文档、文本自动分段、音色配置、批量并发
- 新增 API.md 完整接口文档 - 智能文本分段:长文本按段落/句子/标点边界自动切分(≤2000字/段),逐段TTS后ffmpeg拼接 - /api/tts 支持 voice 参数指定音色 - httpTts JSON 配置增加 style 和 voice 字段 - 批量生成改用并发(Semaphore 3路) - 新增 /health 健康检查端点 - TTS 试听前端增加音色输入 - 清理 import,修复端口不一致
This commit is contained in:
21
README.md
21
README.md
@@ -30,10 +30,16 @@ docker compose up -d
|
||||
### Web 管理界面 (`/`)
|
||||
- 📖 书籍管理(添加/删除)
|
||||
- 📑 章节管理(添加/编辑/删除)
|
||||
- 🎙️ TTS 试听(支持风格设置)
|
||||
- ⚡ 单章/批量音频生成
|
||||
- 🎙️ TTS 试听(支持风格 + 音色设置)
|
||||
- ⚡ 单章/批量音频生成(自动分段拼接)
|
||||
- ⚙️ 配置查看
|
||||
|
||||
### 核心特性
|
||||
- **智能文本分段**: 长文本自动在句末/段落边界切分(≤2000字/段),逐段生成后拼接
|
||||
- **多风格支持**: 开心、悲伤、东北话、像个大将军... 任意组合
|
||||
- **音色切换**: 支持指定不同音色(voice 参数)
|
||||
- **并发批量生成**: 限制 3 路并发,快速完成整本书
|
||||
|
||||
### 听书 App 接口
|
||||
|
||||
| 接口 | 方法 | 说明 |
|
||||
@@ -72,7 +78,16 @@ docker compose up -d
|
||||
| `MIMO_API_ENDPOINT` | ❌ | `https://api.xiaomimimo.com/v1/chat/completions` | API 地址 |
|
||||
| `MIMO_TTS_MODEL` | ❌ | `mimo-v2-audio-tts` | 模型名称 |
|
||||
| `MIMO_VOICE` | ❌ | `mimo_default` | 默认音色 |
|
||||
| `SERVER_PORT` | ❌ | `17200` | 服务端口 |
|
||||
| `SERVER_PORT` | ❌ | `3333` | 服务端口 |
|
||||
|
||||
## 📖 API 文档
|
||||
|
||||
完整 API 文档见 [**API.md**](./API.md),包含:
|
||||
|
||||
- 所有接口的请求/响应格式
|
||||
- 参数说明与错误码
|
||||
- MiMo TTS 风格参考大全
|
||||
- 文本自动分段机制说明
|
||||
|
||||
## MiMo TTS 风格参考
|
||||
|
||||
|
||||
Reference in New Issue
Block a user