5 Commits

Author SHA1 Message Date
4e89b4bea3 提交main分支 2026-01-07 14:12:54 +08:00
96069bd4cd 更新到main分支 2026-01-07 14:12:17 +08:00
a6b4e336e2 docs: update project documentation in README. 2026-01-07 14:09:05 +08:00
04d684d985 更新readme 2026-01-07 13:50:18 +08:00
f5a2cb042d 更新 prompts.py 2026-01-07 13:49:43 +08:00
2 changed files with 21 additions and 41 deletions

View File

@@ -38,10 +38,9 @@ data_analysis_agent/
├── 📄 requirements.txt # 项目依赖
├── 📄 .env # 环境变量配置
└── 📁 outputs/ # 分析结果输出目录
└── session_[时间戳]/ # 每次分析的独立会话目录
├── *.png # 生成的图表
── 最终分析报告.md # Markdown报告
└── 最终分析报告.docx # Word报告
└── session_[时间戳]/ # 每次分析的独立会话目录
├── *.png # 生成的图表
── 最终分析报告.md # Markdown报告
```
## 📊 数据分析流程图
@@ -124,9 +123,9 @@ sequenceDiagram
```bash
# 克隆项目
git clone https://github.com/li-xiu-qi/data_analysis_agent.git
git clone http://jeason.online:3000/zhaojie/iov_data_analysis_agent.git
cd data_analysis_agent
cd iov_data_analysis_agent
# 安装依赖
pip install -r requirements.txt
@@ -134,7 +133,7 @@ pip install -r requirements.txt
### 2. 配置API密钥
创建`.env`文件:
创建`.env``llm_config.py`文件:
```bash
# OpenAI API配置
@@ -157,10 +156,11 @@ from config.llm_config import LLMConfig
llm_config = LLMConfig()
agent = DataAnalysisAgent(llm_config)
# 开始分析
# 开始分析input中输入你想要的内容。并在运行前调整提示词中的报告格式及分析要求
files = ["your_data.csv"]
#excel文件同样支持
report = agent.analyze(
user_input="分析销售数据,生成趋势图表和关键指标",
user_input="分析车联网运维工单的数据帮我汇总生成一份用于汇报使用的运维工单报告销售数据XXXXXXXXXX",
files=files
)
@@ -187,25 +187,24 @@ report = quick_analysis(
## 📊 使用示例
以下是分析贵州茅台财务数据的完整示例:
```python
# 示例:茅台财务分析
files = ["贵州茅台利润表.csv"]
# 示例:工单健康度分析
files = ["iov.csv"]
report = agent.analyze(
user_input="基于贵州茅台的数据,输出五个重要的统计指标,并绘制相关图表。最后生成汇报给我。",
user_input="基于所有的运维工单输出XXXX等重要的统计指标,并绘制相关图表。最后生成汇报给我。",
files=files
)
```
**生成的分析内容包括:**
- 📈 营业总收入趋势图
- 💰 净利润率变化分析
- 📊 利润构成分析图表
- 💵 每股收益变化趋势
- 📋 营业成本占比分析
- 📄 综合分析报告
- 工单月度/周度/日度趋势图
- 问题类型及车型分布
- 问题模块分析图表
- 问题处理时长分析图表
- 问题模块汇总图表
-
## 🎨 流程可视化
@@ -324,20 +323,6 @@ A: 可以在Mermaid代码块中添加样式定义或使用不同的图表类
分析过程中的错误信息会保存在会话目录中,便于调试和优化。
## 🤝 贡献指南
欢迎贡献代码和改进建议!
1. Fork 项目
2. 创建功能分支
3. 提交更改
4. 推送到分支
5. 创建Pull Request
## 📄 许可证
本项目基于MIT许可证开源。详见[LICENSE](LICENSE)文件。
## 🔄 更新日志
### v1.0.0
@@ -352,6 +337,6 @@ A: 可以在Mermaid代码块中添加样式定义或使用不同的图表类
<div align="center">
**🚀 让数据分析变得更智能、更简单!**
**简化数据分析入门门槛,让数据分析变得更智能、更简单!**
</div>

View File

@@ -68,23 +68,18 @@ data_analysis_system_prompt = """你是一个专业的数据分析助手,运
- 不要试图一次性生成所有图表。你应该将任务拆分为多个小的代码块,分批次执行。
- 每一轮只专注于生成 1-2 个复杂的图表或 2-3 个简单的图表,确保代码正确且图片保存成功。
- 只有在前一轮代码成功执行并保存图片后,再进行下一轮。
- 必做分析1. **超长工单问题类型分布**(从处理时长分布中筛选)
- 必做分析
1. **超长工单问题类型分布**(从处理时长分布中筛选)
2. **车型-问题热力图**(发现特定车型的高频故障)
3. **车型分布**(整体工单在不同车型的占比)
4. **处理时长分布**(直方图/KDE
5. **处理时长箱线图**(按问题类型或责任人分组,识别异常点)
6. **高频关键词词云**基于Text Cleaning和N-gram结果
7. **工单来源分布**
8. **工单状态分布**
9. **模块分布**
10. **未关闭工单状态分布**
11. **问题类型分布**
12. **严重程度分布**
13. **远程控制(Remote Control)问题模块分布**(专项分析)
14. **月度工单趋势**
15. **月度关闭率趋势**
16. **责任人分布**
17. **责任人工作量与效率对比**(散点图或双轴图)
- 图片保存必须使用 `plt.savefig(path, bbox_inches='tight')`。保存后必须显示打印绝对路径。严禁使用 `plt.show()`。
**阶段4深度挖掘与高级分析使用 generate_code 动作)**