Initial commit: 个性化饮食推荐助手 - 包含OCR识别、AI分析、现代化界面等功能

2025-09-25 14:20:11 +01:00
commit aea5f6bf74
27 changed files with 14015 additions and 0 deletions
--- a/OCR_USAGE_GUIDE.md
+++ b/OCR_USAGE_GUIDE.md
@@ -0,0 +1,237 @@
+# OCR热量识别功能使用指南
+
+## 功能概述
+
+OCR热量识别功能允许用户通过拍摄或上传包含食物信息的图片，自动识别其中的热量信息，大大简化了餐食记录的过程。
+
+## 主要特性
+
+### 1. 多OCR引擎支持
+- **Tesseract OCR**: 开源OCR引擎，支持中英文识别
+- **PaddleOCR**: 百度开源OCR，对中文识别效果优秀
+- **EasyOCR**: 简单易用的OCR库，支持多语言
+
+### 2. 智能验证机制
+- **多级验证**: 结合OCR结果、食物数据库和用户学习数据
+- **置信度评估**: 为每个识别结果提供置信度评分
+- **用户修正**: 支持用户手动修正识别结果
+
+### 3. 学习优化系统
+- **用户反馈学习**: 记录用户修正，提高后续识别准确性
+- **数据库匹配**: 与内置食物数据库进行智能匹配
+- **模式识别**: 识别多种热量表示格式
+
+## 使用方法
+
+### 1. 启动OCR功能
+
+#### 在移动端界面：
+1. 打开应用，进入"记录"页面
+2. 在食物输入框右侧找到"📷"按钮
+3. 点击按钮打开OCR识别界面
+
+#### 在桌面端界面：
+1. 在主界面选择"OCR热量识别"功能
+2. 或通过菜单栏访问OCR功能
+
+### 2. 上传图片
+
+1. 点击"选择图片"按钮
+2. 选择包含食物信息的图片文件
+3. 支持的格式：JPG、JPEG、PNG、BMP、GIF
+4. 图片将显示在预览区域
+
+### 3. 开始识别
+
+1. 确认图片选择正确后，点击"开始识别"按钮
+2. 系统将使用多个OCR引擎进行识别
+3. 识别过程中会显示进度条和状态信息
+4. 识别完成后显示结果
+
+### 4. 查看和编辑结果
+
+#### 识别结果表格：
+- **食物名称**: 识别到的食物名称
+- **热量**: 识别到的热量数值（卡路里）
+- **置信度**: 识别结果的置信度（0-1）
+- **来源**: 数据来源（OCR、数据库、用户确认）
+
+#### 详细信息：
+- OCR识别过程详情
+- 各引擎的识别结果
+- 处理时间和整体置信度
+
+#### 建议：
+- 系统提供的改进建议
+- 识别准确性提示
+- 手动输入建议
+
+### 5. 编辑和确认结果
+
+#### 编辑结果：
+1. 双击表格中的任意行或选择后点击"编辑结果"
+2. 在弹出的对话框中修改食物名称、热量和置信度
+3. 点击"保存"确认修改
+
+#### 确认结果：
+1. 检查所有识别结果是否正确
+2. 点击"确认结果"按钮
+3. 系统将保存到餐食记录中
+
+## 识别准确性优化
+
+### 1. 图片质量要求
+
+#### 推荐条件：
+- **清晰度**: 图片清晰，文字可读
+- **对比度**: 文字与背景对比明显
+- **角度**: 文字水平，避免倾斜
+- **光照**: 光线充足，避免阴影
+
+#### 避免的情况：
+- 模糊不清的图片
+- 文字过小或过大的图片
+- 严重倾斜的图片
+- 光线过暗或过亮的图片
+
+### 2. 文字格式支持
+
+#### 支持的热量表示格式：
+- `130卡路里`
+- `155 kcal`
+- `52千卡`
+- `42大卡`
+- `110 KJ` (千焦)
+- `76卡`
+
+#### 支持的食物名称：
+- 中文食物名称：米饭、鸡蛋、苹果等
+- 英文食物名称：rice、egg、apple等
+- 混合格式：米饭 130卡路里
+
+### 3. 提高识别准确性的技巧
+
+#### 图片预处理：
+- 确保图片中的文字清晰可见
+- 避免复杂的背景干扰
+- 保持文字区域的完整性
+
+#### 结果验证：
+- 仔细检查识别结果
+- 及时修正错误信息
+- 利用数据库匹配功能
+
+#### 学习优化：
+- 经常使用修正功能
+- 系统会学习您的修正习惯
+- 提高后续识别的准确性
+
+## 故障排除
+
+### 1. 常见问题
+
+#### 识别失败：
+- **原因**: 图片质量差、OCR引擎不可用
+- **解决**: 检查图片质量，确保OCR依赖已安装
+
+#### 识别结果不准确：
+- **原因**: 图片模糊、文字格式特殊
+- **解决**: 重新拍摄清晰图片，手动修正结果
+
+#### 无法打开OCR界面：
+- **原因**: 依赖包未安装、模块初始化失败
+- **解决**: 检查requirements.txt中的依赖是否已安装
+
+### 2. 依赖安装
+
+确保已安装以下依赖包：
+
+```bash
+pip install pytesseract>=0.3.10
+pip install opencv-python>=4.8.0
+pip install paddleocr>=2.7.0
+pip install easyocr>=1.7.0
+```
+
+#### Tesseract安装：
+- **Windows**: 下载Tesseract安装包并添加到PATH
+- **macOS**: `brew install tesseract`
+- **Linux**: `sudo apt-get install tesseract-ocr`
+
+### 3. 性能优化
+
+#### 提高识别速度：
+- 使用较小的图片文件
+- 选择清晰的图片
+- 避免过于复杂的图片
+
+#### 提高识别准确性：
+- 使用标准格式的食物标签
+- 保持文字清晰可读
+- 及时修正错误结果
+
+## 技术架构
+
+### 1. 模块结构
+
+```
+modules/ocr_calorie_recognition.py  # OCR识别模块
+gui/ocr_calorie_gui.py            # OCR GUI界面
+test_ocr_system.py                # 测试脚本
+```
+
+### 2. 核心组件
+
+#### OCRCalorieRecognitionModule:
+- 多OCR引擎集成
+- 图片预处理
+- 热量信息提取
+- 数据库匹配
+- 用户学习系统
+
+#### OCRCalorieGUI:
+- 图片上传界面
+- 识别结果展示
+- 结果编辑功能
+- 用户交互处理
+
+### 3. 数据流程
+
+1. **图片上传** → 图片预处理
+2. **OCR识别** → 多引擎并行识别
+3. **文本提取** → 热量信息解析
+4. **数据库匹配** → 食物信息验证
+5. **用户确认** → 结果保存和学习
+
+## 未来改进计划
+
+### 1. 功能增强
+- 支持更多图片格式
+- 增加批量识别功能
+- 支持手写文字识别
+- 集成营养信息识别
+
+### 2. 性能优化
+- 优化识别算法
+- 提高处理速度
+- 减少内存占用
+- 支持GPU加速
+
+### 3. 用户体验
+- 改进界面设计
+- 增加语音输入
+- 支持离线识别
+- 提供更多个性化选项
+
+## 联系支持
+
+如果您在使用OCR功能时遇到问题，请：
+
+1. 查看本文档的故障排除部分
+2. 运行测试脚本检查系统状态
+3. 检查依赖包是否正确安装
+4. 提供详细的错误信息和截图
+
+---
+
+*最后更新: 2024年12月*