Initial commit: 个性化饮食推荐助手 - 包含OCR识别、AI分析、现代化界面等功能
This commit is contained in:
237
OCR_USAGE_GUIDE.md
Normal file
237
OCR_USAGE_GUIDE.md
Normal file
@@ -0,0 +1,237 @@
|
||||
# OCR热量识别功能使用指南
|
||||
|
||||
## 功能概述
|
||||
|
||||
OCR热量识别功能允许用户通过拍摄或上传包含食物信息的图片,自动识别其中的热量信息,大大简化了餐食记录的过程。
|
||||
|
||||
## 主要特性
|
||||
|
||||
### 1. 多OCR引擎支持
|
||||
- **Tesseract OCR**: 开源OCR引擎,支持中英文识别
|
||||
- **PaddleOCR**: 百度开源OCR,对中文识别效果优秀
|
||||
- **EasyOCR**: 简单易用的OCR库,支持多语言
|
||||
|
||||
### 2. 智能验证机制
|
||||
- **多级验证**: 结合OCR结果、食物数据库和用户学习数据
|
||||
- **置信度评估**: 为每个识别结果提供置信度评分
|
||||
- **用户修正**: 支持用户手动修正识别结果
|
||||
|
||||
### 3. 学习优化系统
|
||||
- **用户反馈学习**: 记录用户修正,提高后续识别准确性
|
||||
- **数据库匹配**: 与内置食物数据库进行智能匹配
|
||||
- **模式识别**: 识别多种热量表示格式
|
||||
|
||||
## 使用方法
|
||||
|
||||
### 1. 启动OCR功能
|
||||
|
||||
#### 在移动端界面:
|
||||
1. 打开应用,进入"记录"页面
|
||||
2. 在食物输入框右侧找到"📷"按钮
|
||||
3. 点击按钮打开OCR识别界面
|
||||
|
||||
#### 在桌面端界面:
|
||||
1. 在主界面选择"OCR热量识别"功能
|
||||
2. 或通过菜单栏访问OCR功能
|
||||
|
||||
### 2. 上传图片
|
||||
|
||||
1. 点击"选择图片"按钮
|
||||
2. 选择包含食物信息的图片文件
|
||||
3. 支持的格式:JPG、JPEG、PNG、BMP、GIF
|
||||
4. 图片将显示在预览区域
|
||||
|
||||
### 3. 开始识别
|
||||
|
||||
1. 确认图片选择正确后,点击"开始识别"按钮
|
||||
2. 系统将使用多个OCR引擎进行识别
|
||||
3. 识别过程中会显示进度条和状态信息
|
||||
4. 识别完成后显示结果
|
||||
|
||||
### 4. 查看和编辑结果
|
||||
|
||||
#### 识别结果表格:
|
||||
- **食物名称**: 识别到的食物名称
|
||||
- **热量**: 识别到的热量数值(卡路里)
|
||||
- **置信度**: 识别结果的置信度(0-1)
|
||||
- **来源**: 数据来源(OCR、数据库、用户确认)
|
||||
|
||||
#### 详细信息:
|
||||
- OCR识别过程详情
|
||||
- 各引擎的识别结果
|
||||
- 处理时间和整体置信度
|
||||
|
||||
#### 建议:
|
||||
- 系统提供的改进建议
|
||||
- 识别准确性提示
|
||||
- 手动输入建议
|
||||
|
||||
### 5. 编辑和确认结果
|
||||
|
||||
#### 编辑结果:
|
||||
1. 双击表格中的任意行或选择后点击"编辑结果"
|
||||
2. 在弹出的对话框中修改食物名称、热量和置信度
|
||||
3. 点击"保存"确认修改
|
||||
|
||||
#### 确认结果:
|
||||
1. 检查所有识别结果是否正确
|
||||
2. 点击"确认结果"按钮
|
||||
3. 系统将保存到餐食记录中
|
||||
|
||||
## 识别准确性优化
|
||||
|
||||
### 1. 图片质量要求
|
||||
|
||||
#### 推荐条件:
|
||||
- **清晰度**: 图片清晰,文字可读
|
||||
- **对比度**: 文字与背景对比明显
|
||||
- **角度**: 文字水平,避免倾斜
|
||||
- **光照**: 光线充足,避免阴影
|
||||
|
||||
#### 避免的情况:
|
||||
- 模糊不清的图片
|
||||
- 文字过小或过大的图片
|
||||
- 严重倾斜的图片
|
||||
- 光线过暗或过亮的图片
|
||||
|
||||
### 2. 文字格式支持
|
||||
|
||||
#### 支持的热量表示格式:
|
||||
- `130卡路里`
|
||||
- `155 kcal`
|
||||
- `52千卡`
|
||||
- `42大卡`
|
||||
- `110 KJ` (千焦)
|
||||
- `76卡`
|
||||
|
||||
#### 支持的食物名称:
|
||||
- 中文食物名称:米饭、鸡蛋、苹果等
|
||||
- 英文食物名称:rice、egg、apple等
|
||||
- 混合格式:米饭 130卡路里
|
||||
|
||||
### 3. 提高识别准确性的技巧
|
||||
|
||||
#### 图片预处理:
|
||||
- 确保图片中的文字清晰可见
|
||||
- 避免复杂的背景干扰
|
||||
- 保持文字区域的完整性
|
||||
|
||||
#### 结果验证:
|
||||
- 仔细检查识别结果
|
||||
- 及时修正错误信息
|
||||
- 利用数据库匹配功能
|
||||
|
||||
#### 学习优化:
|
||||
- 经常使用修正功能
|
||||
- 系统会学习您的修正习惯
|
||||
- 提高后续识别的准确性
|
||||
|
||||
## 故障排除
|
||||
|
||||
### 1. 常见问题
|
||||
|
||||
#### 识别失败:
|
||||
- **原因**: 图片质量差、OCR引擎不可用
|
||||
- **解决**: 检查图片质量,确保OCR依赖已安装
|
||||
|
||||
#### 识别结果不准确:
|
||||
- **原因**: 图片模糊、文字格式特殊
|
||||
- **解决**: 重新拍摄清晰图片,手动修正结果
|
||||
|
||||
#### 无法打开OCR界面:
|
||||
- **原因**: 依赖包未安装、模块初始化失败
|
||||
- **解决**: 检查requirements.txt中的依赖是否已安装
|
||||
|
||||
### 2. 依赖安装
|
||||
|
||||
确保已安装以下依赖包:
|
||||
|
||||
```bash
|
||||
pip install pytesseract>=0.3.10
|
||||
pip install opencv-python>=4.8.0
|
||||
pip install paddleocr>=2.7.0
|
||||
pip install easyocr>=1.7.0
|
||||
```
|
||||
|
||||
#### Tesseract安装:
|
||||
- **Windows**: 下载Tesseract安装包并添加到PATH
|
||||
- **macOS**: `brew install tesseract`
|
||||
- **Linux**: `sudo apt-get install tesseract-ocr`
|
||||
|
||||
### 3. 性能优化
|
||||
|
||||
#### 提高识别速度:
|
||||
- 使用较小的图片文件
|
||||
- 选择清晰的图片
|
||||
- 避免过于复杂的图片
|
||||
|
||||
#### 提高识别准确性:
|
||||
- 使用标准格式的食物标签
|
||||
- 保持文字清晰可读
|
||||
- 及时修正错误结果
|
||||
|
||||
## 技术架构
|
||||
|
||||
### 1. 模块结构
|
||||
|
||||
```
|
||||
modules/ocr_calorie_recognition.py # OCR识别模块
|
||||
gui/ocr_calorie_gui.py # OCR GUI界面
|
||||
test_ocr_system.py # 测试脚本
|
||||
```
|
||||
|
||||
### 2. 核心组件
|
||||
|
||||
#### OCRCalorieRecognitionModule:
|
||||
- 多OCR引擎集成
|
||||
- 图片预处理
|
||||
- 热量信息提取
|
||||
- 数据库匹配
|
||||
- 用户学习系统
|
||||
|
||||
#### OCRCalorieGUI:
|
||||
- 图片上传界面
|
||||
- 识别结果展示
|
||||
- 结果编辑功能
|
||||
- 用户交互处理
|
||||
|
||||
### 3. 数据流程
|
||||
|
||||
1. **图片上传** → 图片预处理
|
||||
2. **OCR识别** → 多引擎并行识别
|
||||
3. **文本提取** → 热量信息解析
|
||||
4. **数据库匹配** → 食物信息验证
|
||||
5. **用户确认** → 结果保存和学习
|
||||
|
||||
## 未来改进计划
|
||||
|
||||
### 1. 功能增强
|
||||
- 支持更多图片格式
|
||||
- 增加批量识别功能
|
||||
- 支持手写文字识别
|
||||
- 集成营养信息识别
|
||||
|
||||
### 2. 性能优化
|
||||
- 优化识别算法
|
||||
- 提高处理速度
|
||||
- 减少内存占用
|
||||
- 支持GPU加速
|
||||
|
||||
### 3. 用户体验
|
||||
- 改进界面设计
|
||||
- 增加语音输入
|
||||
- 支持离线识别
|
||||
- 提供更多个性化选项
|
||||
|
||||
## 联系支持
|
||||
|
||||
如果您在使用OCR功能时遇到问题,请:
|
||||
|
||||
1. 查看本文档的故障排除部分
|
||||
2. 运行测试脚本检查系统状态
|
||||
3. 检查依赖包是否正确安装
|
||||
4. 提供详细的错误信息和截图
|
||||
|
||||
---
|
||||
|
||||
*最后更新: 2024年12月*
|
||||
Reference in New Issue
Block a user