README.md

# 🎙️ TTS Proxy Service

小米 MiMo TTS 音频转换代理服务，提供实时 TTS 接口和 Web 管理界面。

## 架构

```
听书 App / curl ──HTTP──▶ 本服务 ──API──▶ 小米 MiMo TTS
                         │
                         ├── 智能文本分段（>2000字自动切分拼接）
                         ├── TTS 自动重试（5xx 错误最多重试 3 次）
                         └── MP3 缓存
```

## 快速启动

```bash
# 1. 配置 API Key
cp .env.example .env
# 编辑 .env 填入 MIMO_API_KEY

# 2. 启动
docker compose up -d

# 3. 访问
# 管理界面: http://your-server:3333
# TTS 接口: http://your-server:3333/api/tts
```

## 核心功能

### POST `/api/tts` — 实时 TTS

文本进 → MP3 出。支持 JSON 和 Form 两种格式，长文本自动分段拼接。

```bash
# JSON 格式
curl -X POST http://localhost:3333/api/tts \
  -H "Content-Type: application/json" \
  -d '{"text": "你好世界", "style": "开心", "voice": ""}' \
  -o output.mp3

# Form 格式（百度兼容）
curl -X POST http://localhost:3333/api/tts \
  -d "tex=你好世界" \
  -o output.mp3
```

### GET `/health` — 健康检查

### 管理接口（需 Bearer Token）

| 接口 | 方法 | 说明 |
|------|------|------|
| `/admin/api/preview` | POST | TTS 试听，返回音频 URL |
| `/admin/api/config` | GET | 查看当前配置 |

## 接入听书 App

在 App 中配置 TTS 音频源：

- **URL**: `http://your-server:3333/api/tts`
- **Method**: POST
- **Body**: `{"text": "{{speakText}}"}`
- **Content-Type**: `audio/mpeg`

App 模板变量：`{{speakText}}`（文本）、`{{speakSpeed}}`（语速 5-50）

> App 只能动态传文本。voice/style 需在 JSON body 中写死，或通过其他客户端调用时传入。

## 环境变量

| 变量 | 必填 | 默认值 | 说明 |
|------|------|--------|------|
| `MIMO_API_KEY` | ✅ | - | MiMo TTS API Key |
| `MIMO_API_ENDPOINT` | ❌ | `https://api.xiaomimimo.com/v1/chat/completions` | API 地址 |
| `MIMO_TTS_MODEL` | ❌ | `mimo-v2-audio-tts` | 模型名称 |
| `MIMO_VOICE` | ❌ | `mimo_default` | 默认音色 |
| `API_TOKEN` | ❌ | - | 管理接口 Bearer Token（留空则不鉴权） |

## MiMo TTS 风格参考

| 类别 | 示例 |
|------|------|
| 情感 | 开心 / 悲伤 / 生气 / 平静 |
| 语速 | 语速慢 / 语速快 / 悄悄话 |
| 角色 | 像个大将军 / 像个小孩 / 孙悟空 |
| 方言 | 东北话 / 四川话 / 台湾腔 / 粤语 |

## 不使用 Docker

```bash
pip install -r requirements.txt
# 系统需安装 ffmpeg
export MIMO_API_KEY=your_key
cd app && python main.py
```
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								# 🎙️ TTS Proxy Service
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								小米 MiMo TTS 音频转换代理服务，提供实时 TTS 接口和 Web 管理界面。
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								## 架构
 								```
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								听书 App / curl ──HTTP──▶ 本服务 ──API──▶ 小米 MiMo TTS
 								                         │
 								                         ├── 智能文本分段（>2000字自动切分拼接）
 								                         ├── TTS 自动重试（5xx 错误最多重试 3 次）
 								                         └── MP3 缓存
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
+								```
 								## 快速启动
 								```bash
 								# 1. 配置 API Key
 								cp .env.example .env
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								# 编辑 .env 填入 MIMO_API_KEY
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								# 2. 启动
 								docker compose up -d
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								# 3. 访问
 								# 管理界面: http://your-server:3333
 								# TTS 接口: http://your-server:3333/api/tts
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
+								```
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								## 核心功能
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								### POST `/api/tts` — 实时 TTS
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								文本进 → MP3 出。支持 JSON 和 Form 两种格式，长文本自动分段拼接。
-												feat: API文档、文本自动分段、音色配置、批量并发

- 新增 API.md 完整接口文档
- 智能文本分段：长文本按段落/句子/标点边界自动切分（≤2000字/段），逐段TTS后ffmpeg拼接
- /api/tts 支持 voice 参数指定音色
- httpTts JSON 配置增加 style 和 voice 字段
- 批量生成改用并发（Semaphore 3路）
- 新增 /health 健康检查端点
- TTS 试听前端增加音色输入
- 清理 import，修复端口不一致

											
										
										
											2026-03-27 14:37:43 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								```bash
 								# JSON 格式
 								curl -X POST http://localhost:3333/api/tts \
 								  -H "Content-Type: application/json" \
 								  -d '{"text": "你好世界", "style": "开心", "voice": ""}' \
 								  -o output.mp3
 								# Form 格式（百度兼容）
 								curl -X POST http://localhost:3333/api/tts \
 								  -d "tex=你好世界" \
 								  -o output.mp3
 								```
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								### GET `/health` — 健康检查
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								### 管理接口（需 Bearer Token）
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								| 接口 | 方法 | 说明 |
 								|------|------|------|
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								| `/admin/api/preview` | POST | TTS 试听，返回音频 URL |
 								| `/admin/api/config` | GET | 查看当前配置 |
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								## 接入听书 App
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								在 App 中配置 TTS 音频源：
 								- **URL**: `http://your-server:3333/api/tts`
 								- **Method**: POST
 								- **Body**: `{"text": "{{speakText}}"}`
 								- **Content-Type**: `audio/mpeg`
 								App 模板变量：`{{speakText}}`（文本）、`{{speakSpeed}}`（语速 5-50）
 								> App 只能动态传文本。voice/style 需在 JSON body 中写死，或通过其他客户端调用时传入。
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								## 环境变量
 								| 变量 | 必填 | 默认值 | 说明 |
 								|------|------|--------|------|
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								| `MIMO_API_KEY` | ✅ | - | MiMo TTS API Key |
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
+								| `MIMO_API_ENDPOINT` | ❌ | `https://api.xiaomimimo.com/v1/chat/completions` | API 地址 |
 								| `MIMO_TTS_MODEL` | ❌ | `mimo-v2-audio-tts` | 模型名称 |
 								| `MIMO_VOICE` | ❌ | `mimo_default` | 默认音色 |
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								| `API_TOKEN` | ❌ | - | 管理接口 Bearer Token（留空则不鉴权） |
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								## MiMo TTS 风格参考
 								| 类别 | 示例 |
 								|------|------|
 								| 情感 | 开心 / 悲伤 / 生气 / 平静 |
 								| 语速 | 语速慢 / 语速快 / 悄悄话 |
 								| 角色 | 像个大将军 / 像个小孩 / 孙悟空 |
 								| 方言 | 东北话 / 四川话 / 台湾腔 / 粤语 |
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								## 不使用 Docker
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
 								```bash
 								pip install -r requirements.txt
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								# 系统需安装 ffmpeg
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
+								export MIMO_API_KEY=your_key
-												refactor: 精简架构，去掉书籍管理，核心 TTS 代理

- 去掉 books/chapters CRUD、SQLAlchemy、SQLite 依赖
- 核心只剩 /api/tts + 智能分段 + 自动重试
- 新增 API_TOKEN 环境变量，管理接口 Bearer Token 鉴权
- 管理接口精简为 preview + config
- 前端重写：TTS 试听 + 配置查看 + 接口文档
- Dockerfile/docker-compose 清理，去掉数据库卷

											
										
										
											2026-03-27 15:10:58 +08:00
+								cd app && python main.py
-												first commit: TTS Book Service with MiMo TTS integration

											
										
										
											2026-03-27 13:41:07 +08:00
+								```