Complete AI Data Analysis Agent implementation with 95.7% test coverage
This commit is contained in:
195
test_data/README.md
Normal file
195
test_data/README.md
Normal file
@@ -0,0 +1,195 @@
|
||||
# 测试数据说明
|
||||
|
||||
本目录包含用于测试和演示的示例数据集。
|
||||
|
||||
## 数据集列表
|
||||
|
||||
### 1. ticket_sample.csv - 工单数据示例
|
||||
|
||||
**描述**:汽车售后服务工单数据,包含20条记录。
|
||||
|
||||
**字段说明**:
|
||||
- `ticket_id`: 工单ID
|
||||
- `created_at`: 创建时间
|
||||
- `closed_at`: 关闭时间(待处理工单为空)
|
||||
- `status`: 状态(已关闭/待处理)
|
||||
- `type`: 问题类型
|
||||
- `model`: 车型
|
||||
- `module`: 问题模块
|
||||
- `priority`: 优先级(高/中/低)
|
||||
- `description`: 问题描述
|
||||
- `assigned_to`: 处理人员
|
||||
|
||||
**数据特点**:
|
||||
- 包含已关闭和待处理两种状态
|
||||
- 待处理工单占比50%(异常高)
|
||||
- Model X 车型的车门模块远程控制问题占比80%(系统性问题)
|
||||
- 适合测试异常识别和深入分析功能
|
||||
|
||||
**适用场景**:
|
||||
- 工单健康度分析
|
||||
- 问题根因分析
|
||||
- 处理效率分析
|
||||
- 积压情况分析
|
||||
|
||||
### 2. sales_sample.csv - 销售数据示例
|
||||
|
||||
**描述**:电子产品销售订单数据,包含25条记录。
|
||||
|
||||
**字段说明**:
|
||||
- `order_id`: 订单ID
|
||||
- `order_date`: 订单日期
|
||||
- `customer_id`: 客户ID
|
||||
- `customer_name`: 客户姓名
|
||||
- `product_id`: 产品ID
|
||||
- `product_name`: 产品名称
|
||||
- `category`: 产品类别
|
||||
- `quantity`: 数量
|
||||
- `unit_price`: 单价
|
||||
- `total_amount`: 总金额
|
||||
- `region`: 销售区域
|
||||
- `sales_rep`: 销售代表
|
||||
- `payment_method`: 支付方式
|
||||
- `status`: 订单状态
|
||||
|
||||
**数据特点**:
|
||||
- 涵盖多个产品类别(电子产品、配件、可穿戴设备等)
|
||||
- 包含多个销售区域(华东、华北、华南等)
|
||||
- 包含已完成和待发货两种状态
|
||||
- 适合测试销售趋势和区域分析
|
||||
|
||||
**适用场景**:
|
||||
- 销售趋势分析
|
||||
- 区域表现对比
|
||||
- 产品销量分析
|
||||
- 客户购买行为分析
|
||||
|
||||
### 3. user_sample.csv - 用户数据示例
|
||||
|
||||
**描述**:用户账户和订阅数据,包含20条记录。
|
||||
|
||||
**字段说明**:
|
||||
- `user_id`: 用户ID
|
||||
- `username`: 用户名
|
||||
- `email`: 邮箱
|
||||
- `registration_date`: 注册日期
|
||||
- `last_login`: 最后登录时间
|
||||
- `age`: 年龄
|
||||
- `gender`: 性别
|
||||
- `country`: 国家
|
||||
- `city`: 城市
|
||||
- `subscription_type`: 订阅类型(高级会员/普通会员/免费会员)
|
||||
- `subscription_start`: 订阅开始日期
|
||||
- `subscription_end`: 订阅结束日期
|
||||
- `total_orders`: 总订单数
|
||||
- `total_spent`: 总消费金额
|
||||
- `account_status`: 账户状态(活跃/不活跃)
|
||||
- `preferred_category`: 偏好类别
|
||||
|
||||
**数据特点**:
|
||||
- 包含三种订阅类型
|
||||
- 包含活跃和不活跃用户
|
||||
- 包含用户消费行为数据
|
||||
- 适合测试用户分群和流失分析
|
||||
|
||||
**适用场景**:
|
||||
- 用户活跃度分析
|
||||
- 订阅转化分析
|
||||
- 用户价值分析
|
||||
- 流失风险识别
|
||||
|
||||
### 4. anomaly_sample.csv - 异常数据示例
|
||||
|
||||
**描述**:包含明显异常的交易数据,包含25条记录。
|
||||
|
||||
**字段说明**:
|
||||
- `transaction_id`: 交易ID
|
||||
- `transaction_date`: 交易日期
|
||||
- `customer_id`: 客户ID
|
||||
- `amount`: 交易金额
|
||||
- `transaction_type`: 交易类型
|
||||
- `status`: 交易状态
|
||||
- `processing_time_hours`: 处理时长(小时)
|
||||
- `error_count`: 错误次数
|
||||
- `region`: 地区
|
||||
|
||||
**数据特点**:
|
||||
- 华东地区的大额交易(>15000元)处理时长异常长(>45小时)
|
||||
- 华东地区大额交易的错误次数异常高(3-6次)
|
||||
- 其他地区的交易处理正常(<3小时)
|
||||
- 明显的地区性系统问题
|
||||
|
||||
**异常模式**:
|
||||
1. **金额异常**:部分交易金额远超平均值
|
||||
2. **处理时长异常**:华东地区大额交易处理时长是正常的20-30倍
|
||||
3. **错误率异常**:华东地区大额交易错误次数远高于正常
|
||||
4. **地区集中**:所有异常交易都集中在华东地区
|
||||
|
||||
**适用场景**:
|
||||
- 异常检测测试
|
||||
- 问题根因分析
|
||||
- 深入分析功能测试
|
||||
- 动态计划调整测试
|
||||
|
||||
## 使用建议
|
||||
|
||||
### 快速测试
|
||||
```bash
|
||||
# 测试完全自主分析
|
||||
python -m src.main --data test_data/ticket_sample.csv --output output/test1
|
||||
|
||||
# 测试指定需求分析
|
||||
python -m src.main --data test_data/sales_sample.csv --requirement "分析销售趋势" --output output/test2
|
||||
|
||||
# 测试模板分析
|
||||
python -m src.main --data test_data/ticket_sample.csv --template templates/ticket_analysis.md --output output/test3
|
||||
```
|
||||
|
||||
### 测试特定功能
|
||||
|
||||
**测试异常识别**:
|
||||
```bash
|
||||
python -m src.main --data test_data/anomaly_sample.csv --output output/anomaly_test
|
||||
```
|
||||
预期:AI 应该识别出华东地区大额交易的异常模式
|
||||
|
||||
**测试深入分析**:
|
||||
```bash
|
||||
python -m src.main --data test_data/ticket_sample.csv --output output/deep_analysis
|
||||
```
|
||||
预期:AI 应该发现车门模块问题并进行深入分析
|
||||
|
||||
**测试数据类型识别**:
|
||||
```bash
|
||||
# 工单数据
|
||||
python -m src.main --data test_data/ticket_sample.csv --output output/type_test1
|
||||
|
||||
# 销售数据
|
||||
python -m src.main --data test_data/sales_sample.csv --output output/type_test2
|
||||
|
||||
# 用户数据
|
||||
python -m src.main --data test_data/user_sample.csv --output output/type_test3
|
||||
```
|
||||
预期:AI 应该正确识别每种数据类型
|
||||
|
||||
## 数据质量
|
||||
|
||||
所有测试数据都经过精心设计:
|
||||
- ✅ 数据格式正确(CSV,UTF-8编码)
|
||||
- ✅ 字段类型合理(数值、文本、日期)
|
||||
- ✅ 包含真实业务场景
|
||||
- ✅ 包含可识别的模式和异常
|
||||
- ✅ 适合测试各种分析功能
|
||||
|
||||
## 扩展数据
|
||||
|
||||
如果需要更大的数据集进行性能测试,可以:
|
||||
1. 复制现有数据并修改ID
|
||||
2. 使用数据生成工具创建更多记录
|
||||
3. 使用真实的业务数据(注意脱敏)
|
||||
|
||||
## 注意事项
|
||||
|
||||
- 这些数据仅用于测试和演示,不代表真实业务数据
|
||||
- 数据中的人名、地名等信息均为虚构
|
||||
- 如需用于生产环境,请使用真实数据
|
||||
26
test_data/anomaly_sample.csv
Normal file
26
test_data/anomaly_sample.csv
Normal file
@@ -0,0 +1,26 @@
|
||||
transaction_id,transaction_date,customer_id,amount,transaction_type,status,processing_time_hours,error_count,region
|
||||
TX001,2024-01-15,C001,1250.50,购买,成功,2.5,0,华东
|
||||
TX002,2024-01-15,C002,3500.00,购买,成功,1.8,0,华北
|
||||
TX003,2024-01-16,C003,890.00,购买,成功,2.1,0,华南
|
||||
TX004,2024-01-16,C004,15000.00,购买,成功,48.5,3,华东
|
||||
TX005,2024-01-17,C005,2100.00,购买,成功,2.3,0,西南
|
||||
TX006,2024-01-17,C006,18500.00,购买,成功,52.0,5,华东
|
||||
TX007,2024-01-18,C007,1680.00,购买,成功,1.9,0,华北
|
||||
TX008,2024-01-18,C008,22000.00,购买,成功,55.2,4,华东
|
||||
TX009,2024-01-19,C009,950.00,购买,成功,2.4,0,华南
|
||||
TX010,2024-01-19,C010,19800.00,购买,成功,49.8,6,华东
|
||||
TX011,2024-01-20,C011,1450.00,购买,成功,2.0,0,西北
|
||||
TX012,2024-01-20,C012,21500.00,购买,成功,51.5,4,华东
|
||||
TX013,2024-01-21,C013,3200.00,购买,成功,2.2,0,华北
|
||||
TX014,2024-01-21,C014,17600.00,购买,成功,47.3,5,华东
|
||||
TX015,2024-01-22,C015,2800.00,购买,成功,1.7,0,华南
|
||||
TX016,2024-01-22,C016,20100.00,购买,成功,50.1,3,华东
|
||||
TX017,2024-01-23,C017,1920.00,购买,成功,2.6,0,西南
|
||||
TX018,2024-01-23,C018,16900.00,购买,成功,46.8,4,华东
|
||||
TX019,2024-01-24,C019,2350.00,购买,成功,2.1,0,华北
|
||||
TX020,2024-01-24,C020,23500.00,购买,成功,54.7,6,华东
|
||||
TX021,2024-01-25,C021,1580.00,购买,失败,72.0,15,华东
|
||||
TX022,2024-01-25,C022,3100.00,购买,成功,1.9,0,华南
|
||||
TX023,2024-01-26,C023,2450.00,购买,成功,2.3,0,西北
|
||||
TX024,2024-01-26,C024,1890.00,购买,成功,2.0,0,华北
|
||||
TX025,2024-01-27,C025,2700.00,购买,成功,2.2,0,华东
|
||||
|
26
test_data/sales_sample.csv
Normal file
26
test_data/sales_sample.csv
Normal file
@@ -0,0 +1,26 @@
|
||||
order_id,order_date,customer_id,customer_name,product_id,product_name,category,quantity,unit_price,total_amount,region,sales_rep,payment_method,status
|
||||
S001,2024-01-15,C101,张三,P001,智能手机X1,电子产品,2,2999.00,5998.00,华东,李明,信用卡,已完成
|
||||
S002,2024-01-15,C102,李四,P002,笔记本电脑Pro,电子产品,1,8999.00,8999.00,华北,王芳,支付宝,已完成
|
||||
S003,2024-01-16,C103,王五,P003,无线耳机,配件,3,299.00,897.00,华南,张伟,微信支付,已完成
|
||||
S004,2024-01-16,C104,赵六,P001,智能手机X1,电子产品,1,2999.00,2999.00,华东,李明,信用卡,已完成
|
||||
S005,2024-01-17,C105,孙七,P004,平板电脑,电子产品,2,3999.00,7998.00,西南,刘洋,支付宝,已完成
|
||||
S006,2024-01-17,C106,周八,P005,智能手表,可穿戴设备,1,1999.00,1999.00,华北,王芳,信用卡,已完成
|
||||
S007,2024-01-18,C107,吴九,P002,笔记本电脑Pro,电子产品,1,8999.00,8999.00,华南,张伟,微信支付,已完成
|
||||
S008,2024-01-18,C108,郑十,P006,充电宝,配件,5,99.00,495.00,华东,李明,支付宝,已完成
|
||||
S009,2024-01-19,C109,钱一,P007,键盘鼠标套装,配件,2,199.00,398.00,西北,陈静,微信支付,已完成
|
||||
S010,2024-01-19,C110,孙二,P001,智能手机X1,电子产品,3,2999.00,8997.00,华东,李明,信用卡,已完成
|
||||
S011,2024-01-20,C111,李三,P008,显示器27寸,电子产品,1,1599.00,1599.00,华北,王芳,支付宝,已完成
|
||||
S012,2024-01-20,C112,王四,P009,路由器,网络设备,2,299.00,598.00,华南,张伟,微信支付,已完成
|
||||
S013,2024-01-21,C113,张五,P010,移动硬盘1TB,存储设备,1,499.00,499.00,西南,刘洋,信用卡,已完成
|
||||
S014,2024-01-21,C114,赵六,P003,无线耳机,配件,4,299.00,1196.00,华东,李明,支付宝,已完成
|
||||
S015,2024-01-22,C115,孙七,P011,智能音箱,智能家居,2,399.00,798.00,华北,王芳,微信支付,已完成
|
||||
S016,2024-01-22,C116,周八,P002,笔记本电脑Pro,电子产品,1,8999.00,8999.00,华南,张伟,信用卡,已完成
|
||||
S017,2024-01-23,C117,吴九,P012,摄像头,配件,3,199.00,597.00,西北,陈静,支付宝,已完成
|
||||
S018,2024-01-23,C118,郑十,P005,智能手表,可穿戴设备,1,1999.00,1999.00,华东,李明,微信支付,已完成
|
||||
S019,2024-01-24,C119,钱一,P013,蓝牙音箱,配件,2,299.00,598.00,华北,王芳,信用卡,已完成
|
||||
S020,2024-01-24,C120,孙二,P001,智能手机X1,电子产品,1,2999.00,2999.00,华南,张伟,支付宝,已完成
|
||||
S021,2024-01-25,C121,李三,P014,游戏手柄,配件,2,199.00,398.00,西南,刘洋,微信支付,待发货
|
||||
S022,2024-01-25,C122,王四,P004,平板电脑,电子产品,1,3999.00,3999.00,华东,李明,信用卡,待发货
|
||||
S023,2024-01-26,C123,张五,P015,数据线套装,配件,10,29.00,290.00,华北,王芳,支付宝,待发货
|
||||
S024,2024-01-26,C124,赵六,P002,笔记本电脑Pro,电子产品,2,8999.00,17998.00,华南,张伟,微信支付,待发货
|
||||
S025,2024-01-27,C125,孙七,P016,投影仪,电子产品,1,4999.00,4999.00,西北,陈静,信用卡,待发货
|
||||
|
21
test_data/ticket_sample.csv
Normal file
21
test_data/ticket_sample.csv
Normal file
@@ -0,0 +1,21 @@
|
||||
ticket_id,created_at,closed_at,status,type,model,module,priority,description,assigned_to
|
||||
T001,2024-01-15 09:30:00,2024-01-16 14:20:00,已关闭,远程控制,Model X,车门模块,高,车门无法远程解锁,张工
|
||||
T002,2024-01-15 10:15:00,2024-01-17 16:45:00,已关闭,远程控制,Model X,车门模块,高,远程开门失败,李工
|
||||
T003,2024-01-16 08:00:00,,待处理,远程控制,Model X,车门模块,高,车门远程控制无响应,张工
|
||||
T004,2024-01-16 11:20:00,,待处理,远程控制,Model X,车门模块,中,远程锁车不稳定,王工
|
||||
T005,2024-01-17 09:45:00,,待处理,远程控制,Model X,车门模块,高,无法远程开启车门,李工
|
||||
T006,2024-01-17 14:30:00,,待处理,远程控制,Model X,车门模块,高,车门远程功能失效,张工
|
||||
T007,2024-01-18 10:00:00,,待处理,远程控制,Model X,车门模块,中,远程开门延迟严重,王工
|
||||
T008,2024-01-18 15:20:00,,待处理,远程控制,Model X,车门模块,高,车门模块通信异常,李工
|
||||
T009,2024-01-19 08:30:00,,待处理,远程控制,Model X,车门模块,高,远程控制完全失效,张工
|
||||
T010,2024-01-19 11:45:00,,待处理,远程控制,Model X,车门模块,中,车门远程功能间歇性故障,王工
|
||||
T011,2024-01-15 13:00:00,2024-01-16 10:30:00,已关闭,空调系统,Model Y,空调模块,中,空调制冷效果差,赵工
|
||||
T012,2024-01-16 09:15:00,2024-01-18 11:00:00,已关闭,电池管理,Model Y,电池模块,高,电池续航异常,孙工
|
||||
T013,2024-01-17 10:30:00,,待处理,导航系统,Model Z,导航模块,低,导航定位不准,钱工
|
||||
T014,2024-01-18 14:00:00,2024-01-19 09:30:00,已关闭,娱乐系统,Model Y,娱乐模块,低,音响无声音,周工
|
||||
T015,2024-01-19 16:20:00,,待处理,充电系统,Model X,充电模块,高,充电速度慢,吴工
|
||||
T016,2024-01-20 09:00:00,,待处理,刹车系统,Model Z,刹车模块,高,刹车异响,郑工
|
||||
T017,2024-01-20 11:30:00,,待处理,灯光系统,Model Y,灯光模块,中,前大灯不亮,王工
|
||||
T018,2024-01-21 08:45:00,,待处理,座椅系统,Model X,座椅模块,低,座椅加热失效,李工
|
||||
T019,2024-01-21 13:15:00,,待处理,雨刷系统,Model Z,雨刷模块,低,雨刷速度异常,张工
|
||||
T020,2024-01-22 10:20:00,,待处理,天窗系统,Model Y,天窗模块,中,天窗无法关闭,赵工
|
||||
|
21
test_data/user_sample.csv
Normal file
21
test_data/user_sample.csv
Normal file
@@ -0,0 +1,21 @@
|
||||
user_id,username,email,registration_date,last_login,age,gender,country,city,subscription_type,subscription_start,subscription_end,total_orders,total_spent,account_status,preferred_category
|
||||
U001,zhangsan,zhangsan@example.com,2023-01-15,2024-01-25,28,男,中国,上海,高级会员,2023-01-15,2024-01-15,15,45678.50,活跃,电子产品
|
||||
U002,lisi,lisi@example.com,2023-02-20,2024-01-24,35,女,中国,北京,普通会员,2023-02-20,2024-02-20,8,12345.00,活跃,服装
|
||||
U003,wangwu,wangwu@example.com,2023-03-10,2024-01-23,42,男,中国,深圳,高级会员,2023-03-10,2024-03-10,22,67890.00,活跃,电子产品
|
||||
U004,zhaoliu,zhaoliu@example.com,2023-04-05,2024-01-22,31,女,中国,广州,普通会员,2023-04-05,2024-04-05,5,8900.00,活跃,家居
|
||||
U005,sunqi,sunqi@example.com,2023-05-12,2024-01-21,26,男,中国,杭州,免费会员,,,3,2345.00,活跃,图书
|
||||
U006,zhouba,zhouba@example.com,2023-06-18,2024-01-20,39,女,中国,成都,高级会员,2023-06-18,2024-06-18,18,54321.00,活跃,美妆
|
||||
U007,wujiu,wujiu@example.com,2023-07-22,2024-01-19,33,男,中国,武汉,普通会员,2023-07-22,2024-07-22,10,23456.00,活跃,运动
|
||||
U008,zhengshi,zhengshi@example.com,2023-08-30,2024-01-18,29,女,中国,西安,免费会员,,,2,1234.00,活跃,食品
|
||||
U009,qianyi,qianyi@example.com,2023-09-15,2023-12-10,45,男,中国,南京,普通会员,2023-09-15,2024-09-15,1,567.00,不活跃,电子产品
|
||||
U010,sunner,sunner@example.com,2023-10-20,2024-01-17,27,女,中国,重庆,高级会员,2023-10-20,2024-10-20,25,78901.00,活跃,服装
|
||||
U011,lisan,lisan@example.com,2023-11-05,2024-01-16,36,男,中国,天津,普通会员,2023-11-05,2024-11-05,7,15678.00,活跃,电子产品
|
||||
U012,wangsi,wangsi@example.com,2023-11-25,2024-01-15,32,女,中国,苏州,免费会员,,,4,3456.00,活跃,家居
|
||||
U013,zhangwu,zhangwu@example.com,2023-12-10,2024-01-14,41,男,中国,长沙,高级会员,2023-12-10,2024-12-10,12,34567.00,活跃,运动
|
||||
U014,zhaoliu2,zhaoliu2@example.com,2023-12-20,2024-01-13,30,女,中国,郑州,普通会员,2023-12-20,2024-12-20,6,9876.00,活跃,美妆
|
||||
U015,sunqi2,sunqi2@example.com,2024-01-05,2024-01-12,25,男,中国,青岛,免费会员,,,1,456.00,活跃,图书
|
||||
U016,zhouba2,zhouba2@example.com,2024-01-10,2024-01-11,38,女,中国,大连,高级会员,2024-01-10,2025-01-10,20,56789.00,活跃,服装
|
||||
U017,wujiu2,wujiu2@example.com,2024-01-15,2024-01-10,34,男,中国,厦门,普通会员,2024-01-15,2025-01-15,3,4567.00,活跃,电子产品
|
||||
U018,zhengshi2,zhengshi2@example.com,2024-01-18,2024-01-09,28,女,中国,宁波,免费会员,,,2,1890.00,活跃,食品
|
||||
U019,qianyi2,qianyi2@example.com,2024-01-20,2024-01-08,44,男,中国,无锡,普通会员,2024-01-20,2025-01-20,5,8765.00,活跃,运动
|
||||
U020,sunner2,sunner2@example.com,2024-01-22,2024-01-07,26,女,中国,佛山,高级会员,2024-01-22,2025-01-22,8,23456.00,活跃,美妆
|
||||
|
Reference in New Issue
Block a user