feat: add mastery feature to recitation wheel

2025-11-02 23:46:11 +08:00
parent eddbe71849
commit cad03268f3
14 changed files with 439 additions and 617 deletions
--- a/README.md
+++ b/README.md
@@ -55,12 +55,17 @@
 - **数据管理器**：统一的数据访问接口

 ### OCR识别技术
- **Tesseract OCR**：开源OCR引擎，支持中英文
- **PaddleOCR**：百度开源OCR，中文识别优秀
- **EasyOCR**：简单易用的多语言OCR库
+- **Tesseract OCR**：开源OCR引擎，支持中英文（**默认，轻量级，推荐**）
+- **PaddleOCR**：百度开源OCR，中文识别优秀（可选，需要PaddlePaddle，占用内存较大）
+- **EasyOCR**：简单易用的多语言OCR库（可选，需要PyTorch，占用内存很大）
 - **OpenCV**：图像预处理和增强
 - **PIL/Pillow**：图像处理和格式转换

+**注意**：默认配置仅使用Tesseract OCR（轻量级，无需深度学习框架）。如需使用PaddleOCR或EasyOCR：
+1. 取消注释`requirements.txt`中对应依赖
+2. 安装依赖：`pip install paddleocr` 或 `pip install easyocr`
+3. 在OCR模块配置中添加对应引擎到`ocr_methods`列表
+
 ### 机器学习
 - **scikit-learn**：推荐算法实现
 - **pandas/numpy**：数据处理和分析
@@ -153,13 +158,16 @@ python -c "from config.api_keys import get_api_status_report; print(get_api_stat
 - **macOS**: `brew install tesseract`
 - **Linux**: `sudo apt-get install tesseract-ocr`

-#### 其他OCR引擎
+#### 其他OCR引擎（可选，需要深度学习框架）
 ```bash
-# PaddleOCR（推荐，中文识别效果好）
+# PaddleOCR（可选，需要PaddlePaddle，占用内存较大）
 pip install paddleocr

-# EasyOCR（简单易用）
+# EasyOCR（可选，需要PyTorch，占用内存很大，通常需要1-2GB）
 pip install easyocr
+
+# 注意：安装后需要在OCR模块配置中添加对应引擎：
+# self.ocr_methods = ['tesseract', 'paddleocr']  # 添加需要的引擎
 ```

 ### 4. 配置环境