From 1f2d0b85af2267a001c12fc2a409a27c98977c44 Mon Sep 17 00:00:00 2001 From: Zhaojie Date: Tue, 6 Jan 2026 14:09:12 +0800 Subject: [PATCH] feat: enhance data analysis agent's capabilities by updating core logic and prompts. --- data_analysis_agent.py | 2 ++ prompts.py | 2 ++ 2 files changed, 4 insertions(+) diff --git a/data_analysis_agent.py b/data_analysis_agent.py index 41f5b29..bc7647e 100644 --- a/data_analysis_agent.py +++ b/data_analysis_agent.py @@ -272,6 +272,8 @@ class DataAnalysisAgent: formatted_system_prompt = data_analysis_system_prompt.format( notebook_variables=notebook_variables ) + print(f"🐛 [DEBUG] System Prompt Head:\n{formatted_system_prompt[:500]}...\n[...]") + print(f"🐛 [DEBUG] System Prompt Rules Check: 'stop_words' in prompt? {'stop_words' in formatted_system_prompt}") response = self.llm.call( prompt=self._build_conversation_prompt(), diff --git a/prompts.py b/prompts.py index 6d13afe..8cdbd44 100644 --- a/prompts.py +++ b/prompts.py @@ -5,6 +5,8 @@ data_analysis_system_prompt = """你是一个专业的数据分析助手,运 - 当需要收集和分析已生成的图表时,使用 `collect_figures` 动作 - 当所有分析工作完成,需要输出最终报告时,使用 `analysis_complete` 动作 - 每次响应只能选择一种动作类型,不要混合使用 +- **强制文本清洗**:在处理文本数据(如工单描述、评论)时,**必须**构建并使用`stop_words`列表,剔除年份(2025)、通用动词(work, fix)、介词等无意义高频词。 +- **主动高级分析**:不仅是画图,必须根据数据特征主动选择算法(时间序列->预测;分类数据->特征重要性;多维数据->聚类)。 目前jupyter notebook环境下有以下变量: {notebook_variables}