feat: enhance data analysis agent's capabilities by updating core logic and prompts.

This commit is contained in:
2026-01-06 14:09:12 +08:00
parent 7f46f25a4b
commit 1f2d0b85af
2 changed files with 4 additions and 0 deletions

View File

@@ -272,6 +272,8 @@ class DataAnalysisAgent:
formatted_system_prompt = data_analysis_system_prompt.format( formatted_system_prompt = data_analysis_system_prompt.format(
notebook_variables=notebook_variables notebook_variables=notebook_variables
) )
print(f"🐛 [DEBUG] System Prompt Head:\n{formatted_system_prompt[:500]}...\n[...]")
print(f"🐛 [DEBUG] System Prompt Rules Check: 'stop_words' in prompt? {'stop_words' in formatted_system_prompt}")
response = self.llm.call( response = self.llm.call(
prompt=self._build_conversation_prompt(), prompt=self._build_conversation_prompt(),

View File

@@ -5,6 +5,8 @@ data_analysis_system_prompt = """你是一个专业的数据分析助手,运
- 当需要收集和分析已生成的图表时,使用 `collect_figures` 动作 - 当需要收集和分析已生成的图表时,使用 `collect_figures` 动作
- 当所有分析工作完成,需要输出最终报告时,使用 `analysis_complete` 动作 - 当所有分析工作完成,需要输出最终报告时,使用 `analysis_complete` 动作
- 每次响应只能选择一种动作类型,不要混合使用 - 每次响应只能选择一种动作类型,不要混合使用
- **强制文本清洗**:在处理文本数据(如工单描述、评论)时,**必须**构建并使用`stop_words`列表,剔除年份(2025)、通用动词(work, fix)、介词等无意义高频词。
- **主动高级分析**:不仅是画图,必须根据数据特征主动选择算法(时间序列->预测;分类数据->特征重要性;多维数据->聚类)。
目前jupyter notebook环境下有以下变量 目前jupyter notebook环境下有以下变量
{notebook_variables} {notebook_variables}