Compare commits
6 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
| bbf71e412f | |||
| 4e89b4bea3 | |||
| 96069bd4cd | |||
| a6b4e336e2 | |||
| 04d684d985 | |||
| f5a2cb042d |
49
README.md
49
README.md
@@ -40,8 +40,7 @@ data_analysis_agent/
|
||||
└── 📁 outputs/ # 分析结果输出目录
|
||||
└── session_[时间戳]/ # 每次分析的独立会话目录
|
||||
├── *.png # 生成的图表
|
||||
├── 最终分析报告.md # Markdown报告
|
||||
└── 最终分析报告.docx # Word报告
|
||||
└── 最终分析报告.md # Markdown报告
|
||||
```
|
||||
|
||||
## 📊 数据分析流程图
|
||||
@@ -124,9 +123,9 @@ sequenceDiagram
|
||||
|
||||
```bash
|
||||
# 克隆项目
|
||||
git clone https://github.com/li-xiu-qi/data_analysis_agent.git
|
||||
git clone http://jeason.online:3000/zhaojie/iov_data_analysis_agent.git
|
||||
|
||||
cd data_analysis_agent
|
||||
cd iov_data_analysis_agent
|
||||
|
||||
# 安装依赖
|
||||
pip install -r requirements.txt
|
||||
@@ -134,7 +133,7 @@ pip install -r requirements.txt
|
||||
|
||||
### 2. 配置API密钥
|
||||
|
||||
创建`.env`文件:
|
||||
创建`.env`及`llm_config.py`文件:
|
||||
|
||||
```bash
|
||||
# OpenAI API配置
|
||||
@@ -157,10 +156,11 @@ from config.llm_config import LLMConfig
|
||||
llm_config = LLMConfig()
|
||||
agent = DataAnalysisAgent(llm_config)
|
||||
|
||||
# 开始分析
|
||||
# 开始分析(input中输入你想要的内容。并在运行前调整提示词中的报告格式及分析要求)
|
||||
files = ["your_data.csv"]
|
||||
#excel文件同样支持
|
||||
report = agent.analyze(
|
||||
user_input="分析销售数据,生成趋势图表和关键指标",
|
||||
user_input="分析车联网运维工单的数据,帮我汇总生成一份用于汇报使用的,运维工单报告销售数据,XXXXXXXXXX",
|
||||
files=files
|
||||
)
|
||||
|
||||
@@ -187,25 +187,24 @@ report = quick_analysis(
|
||||
|
||||
## 📊 使用示例
|
||||
|
||||
以下是分析贵州茅台财务数据的完整示例:
|
||||
|
||||
```python
|
||||
# 示例:茅台财务分析
|
||||
files = ["贵州茅台利润表.csv"]
|
||||
# 示例:工单健康度分析
|
||||
files = ["iov.csv"]
|
||||
report = agent.analyze(
|
||||
user_input="基于贵州茅台的数据,输出五个重要的统计指标,并绘制相关图表。最后生成汇报给我。",
|
||||
user_input="基于所有的运维工单,输出XXXX等重要的统计指标,并绘制相关图表。最后生成汇报给我。",
|
||||
files=files
|
||||
)
|
||||
```
|
||||
|
||||
**生成的分析内容包括:**
|
||||
|
||||
- 📈 营业总收入趋势图
|
||||
- 💰 净利润率变化分析
|
||||
- 📊 利润构成分析图表
|
||||
- 💵 每股收益变化趋势
|
||||
- 📋 营业成本占比分析
|
||||
- 📄 综合分析报告
|
||||
- 工单月度/周度/日度趋势图
|
||||
- 问题类型及车型分布
|
||||
- 问题模块分析图表
|
||||
- 问题处理时长分析图表
|
||||
- 问题模块汇总图表
|
||||
-
|
||||
|
||||
## 🎨 流程可视化
|
||||
|
||||
@@ -324,20 +323,6 @@ A: 可以在Mermaid代码块中添加样式定义,或使用不同的图表类
|
||||
|
||||
分析过程中的错误信息会保存在会话目录中,便于调试和优化。
|
||||
|
||||
## 🤝 贡献指南
|
||||
|
||||
欢迎贡献代码和改进建议!
|
||||
|
||||
1. Fork 项目
|
||||
2. 创建功能分支
|
||||
3. 提交更改
|
||||
4. 推送到分支
|
||||
5. 创建Pull Request
|
||||
|
||||
## 📄 许可证
|
||||
|
||||
本项目基于MIT许可证开源。详见[LICENSE](LICENSE)文件。
|
||||
|
||||
## 🔄 更新日志
|
||||
|
||||
### v1.0.0
|
||||
@@ -352,6 +337,6 @@ A: 可以在Mermaid代码块中添加样式定义,或使用不同的图表类
|
||||
|
||||
<div align="center">
|
||||
|
||||
**🚀 让数据分析变得更智能、更简单!**
|
||||
**简化数据分析入门门槛,让数据分析变得更智能、更简单!**
|
||||
|
||||
</div>
|
||||
|
||||
@@ -68,23 +68,18 @@ data_analysis_system_prompt = """你是一个专业的数据分析助手,运
|
||||
- 不要试图一次性生成所有图表。你应该将任务拆分为多个小的代码块,分批次执行。
|
||||
- 每一轮只专注于生成 1-2 个复杂的图表或 2-3 个简单的图表,确保代码正确且图片保存成功。
|
||||
- 只有在前一轮代码成功执行并保存图片后,再进行下一轮。
|
||||
- 必做分析1. **超长工单问题类型分布**(从处理时长分布中筛选)
|
||||
- 必做分析
|
||||
1. **超长工单问题类型分布**(从处理时长分布中筛选)
|
||||
2. **车型-问题热力图**(发现特定车型的高频故障)
|
||||
3. **车型分布**(整体工单在不同车型的占比)
|
||||
4. **处理时长分布**(直方图/KDE)
|
||||
5. **处理时长箱线图**(按问题类型或责任人分组,识别异常点)
|
||||
6. **高频关键词词云**(基于Text Cleaning和N-gram结果)
|
||||
7. **工单来源分布**
|
||||
8. **工单状态分布**
|
||||
9. **模块分布**
|
||||
10. **未关闭工单状态分布**
|
||||
11. **问题类型分布**
|
||||
12. **严重程度分布**
|
||||
13. **远程控制(Remote Control)问题模块分布**(专项分析)
|
||||
14. **月度工单趋势**
|
||||
15. **月度关闭率趋势**
|
||||
16. **责任人分布**
|
||||
17. **责任人工作量与效率对比**(散点图或双轴图)
|
||||
- 图片保存必须使用 `plt.savefig(path, bbox_inches='tight')`。保存后必须显示打印绝对路径。严禁使用 `plt.show()`。
|
||||
|
||||
**阶段4:深度挖掘与高级分析(使用 generate_code 动作)**
|
||||
|
||||
Reference in New Issue
Block a user