feat: add mastery feature to recitation wheel

This commit is contained in:
赵杰 Jie Zhao (雄狮汽车科技)
2025-11-02 23:46:11 +08:00
parent eddbe71849
commit cad03268f3
14 changed files with 439 additions and 617 deletions

View File

@@ -55,12 +55,17 @@
- **数据管理器**:统一的数据访问接口
### OCR识别技术
- **Tesseract OCR**开源OCR引擎支持中英文
- **PaddleOCR**百度开源OCR中文识别优秀
- **EasyOCR**简单易用的多语言OCR库
- **Tesseract OCR**开源OCR引擎支持中英文**默认,轻量级,推荐**
- **PaddleOCR**百度开源OCR中文识别优秀可选需要PaddlePaddle占用内存较大
- **EasyOCR**简单易用的多语言OCR库可选需要PyTorch占用内存很大
- **OpenCV**:图像预处理和增强
- **PIL/Pillow**:图像处理和格式转换
**注意**默认配置仅使用Tesseract OCR轻量级无需深度学习框架。如需使用PaddleOCR或EasyOCR
1. 取消注释`requirements.txt`中对应依赖
2. 安装依赖:`pip install paddleocr``pip install easyocr`
3. 在OCR模块配置中添加对应引擎到`ocr_methods`列表
### 机器学习
- **scikit-learn**:推荐算法实现
- **pandas/numpy**:数据处理和分析
@@ -153,13 +158,16 @@ python -c "from config.api_keys import get_api_status_report; print(get_api_stat
- **macOS**: `brew install tesseract`
- **Linux**: `sudo apt-get install tesseract-ocr`
#### 其他OCR引擎
#### 其他OCR引擎(可选,需要深度学习框架)
```bash
# PaddleOCR推荐,中文识别效果好
# PaddleOCR可选需要PaddlePaddle占用内存较大
pip install paddleocr
# EasyOCR简单易用
# EasyOCR可选需要PyTorch占用内存很大通常需要1-2GB
pip install easyocr
# 注意安装后需要在OCR模块配置中添加对应引擎
# self.ocr_methods = ['tesseract', 'paddleocr'] # 添加需要的引擎
```
### 4. 配置环境