Initial commit: 批量查询工具优化版本

2025-09-29 15:41:29 +01:00
commit 42c8412f07
7 changed files with 3054 additions and 0 deletions
--- a/response_parser.py
+++ b/response_parser.py
@@ -0,0 +1,255 @@
+# response_parser.py
+import requests
+import json
+import re
+from pathlib import Path
+
+# Cookie 信息
+COOKIES = {
+    'platformUser_session': 'eyJsYXN0QWNjZXNzZWQiOjE3NTkxNDc4NjYzMzJ9.2gNtuRzCQH%2BoNra1%2B1WXxcDtTmW91yYVAOLbH6Ry%2BLM',
+    '_manage_session': 'eyJ0b2tlbiI6ImV5SmhiR2NpT2lKSVV6STFOaUlzSW5SNWNDSTZJa3BYVkNKOS5leUoxYzJWeUlqcDdJblZ6WlhKZmFXUWlPaUpaU0RFNE9URXpOVFk1TkRVNU9EWTNOVEkxTVRJaWZTd2lRM0psWVhSbFZHbHRaU0k2SWpJd01qVXRNRGt0TWpsVU1URTZNVGs2TkRJdU9UZzJNRGt4TWpNekt6QXhPakF3SW4wLll6eWtYZGlweUFfaWN4TGxkX3MwS2dWQU5LM2JkZU1fNjM3NDV1ckxQNkEiLCJleHBpcmVUaW1lIjowLCJ1c2VySWQiOiJZSDE4OTEzNTY5NDU5ODY3NTI1MTIiLCJkYXRhTGltaXQiOiJjdXN0b21lIiwidHlwZSI6MSwibGV2ZWwiOjIsInBVc2VySWQiOiJZSDE3Njk5MTg2MjkxMjAyNDAzMjEiLCJsb2dpbk5hbWUiOiJ4aW9uZ3NoaV95dW53ZWkiLCJyb2xlSWQiOiJSTDE5NjI3MDM5MDkxNTU5MDE0NDAiLCJjbGllbnRJRHMiOlsiZXVfY2hlcnkiLCJlYnJvX2NoZXJ5Il0sImNsaWVudElkcyI6ImVicm9fY2hlcnkifQ%3D%3D.jBwQkblyoEP6t7OELXxUMKkoU9%2FJWWQsZPg25SZSz5o'
+}
+
+def get_api_response():
+    """获取API响应"""
+    session = requests.Session()
+    
+    # 设置Cookie
+    for name, value in COOKIES.items():
+        session.cookies.set(name, value, domain='prod-eu-cmp.simbalinkglobal.com')
+    
+    # 设置请求头
+    headers = {
+        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7',
+        'Accept-Encoding': 'gzip, deflate, br, zstd',
+        'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7',
+        'Cache-Control': 'max-age=0',
+        'Connection': 'keep-alive',
+        'Host': 'prod-eu-cmp.simbalinkglobal.com',
+        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
+    }
+    session.headers.update(headers)
+    
+    url = "https://prod-eu-cmp.simbalinkglobal.com/simcustomer?filterData=N4IgkgxhCWAmAy0DOAXEAuEAOAnFrATAMw4AM5AjKUQKw1GkFYDsANLvsWZdXURThwA2dnkIlypKrXqMCpUZwk8ZRIcyFFF47uTwVmBoQe1dJ0vtQAsNU8qm966w3d0X6WUlYqvzj-syevip8NOLBDqo4NDhEIKwgqACGKACuSBggIAC%2BQA&pageSize=50"
+    
+    try:
+        response = session.get(url, timeout=30)
+        if response.status_code == 200:
+            return response.text
+        else:
+            print(f"请求失败: {response.status_code}")
+            return None
+    except Exception as e:
+        print(f"API调用异常: {e}")
+        return None
+
+def parse_response(response_text):
+    """解析响应内容"""
+    print("=== 响应内容分析 ===")
+    print(f"响应长度: {len(response_text)} 字符")
+    
+    # 查找ICCID模式
+    iccid_pattern = r'8988239000\d{8}'
+    iccids = re.findall(iccid_pattern, response_text)
+    
+    print(f"找到 {len(iccids)} 个ICCID:")
+    for iccid in iccids:
+        print(f"  - {iccid}")
+    
+    # 查找JSON数据
+    json_patterns = [
+        r'\{[^{}]*"iccid"[^{}]*\}',
+        r'\[[^\[\]]*"8988239000\d{8}"[^\[\]]*\]',
+        r'\{.*"data".*\}',
+        r'\{.*"result".*\}'
+    ]
+    
+    for pattern in json_patterns:
+        matches = re.findall(pattern, response_text, re.DOTALL)
+        if matches:
+            print(f"\n找到JSON数据模式: {pattern}")
+            for match in matches:
+                try:
+                    json_data = json.loads(match)
+                    print(f"JSON数据: {json.dumps(json_data, indent=2, ensure_ascii=False)}")
+                except:
+                    print(f"原始数据: {match[:200]}...")
+    
+    # 查找表格数据
+    table_patterns = [
+        r'<table[^>]*>.*?</table>',
+        r'<tbody[^>]*>.*?</tbody>',
+        r'<tr[^>]*>.*?</tr>'
+    ]
+    
+    for pattern in table_patterns:
+        matches = re.findall(pattern, response_text, re.DOTALL | re.IGNORECASE)
+        if matches:
+            print(f"\n找到表格数据: {len(matches)} 个匹配")
+            for i, match in enumerate(matches[:3]):  # 只显示前3个
+                print(f"表格 {i+1}: {match[:200]}...")
+    
+    # 查找JavaScript数据
+    js_patterns = [
+        r'window\.__INITIAL_STATE__\s*=\s*(\{.*?\});',
+        r'window\.__DATA__\s*=\s*(\{.*?\});',
+        r'var\s+data\s*=\s*(\{.*?\});',
+        r'const\s+data\s*=\s*(\{.*?\});'
+    ]
+    
+    for pattern in js_patterns:
+        matches = re.findall(pattern, response_text, re.DOTALL)
+        if matches:
+            print(f"\n找到JavaScript数据: {pattern}")
+            for match in matches:
+                try:
+                    json_data = json.loads(match)
+                    print(f"JS数据: {json.dumps(json_data, indent=2, ensure_ascii=False)}")
+                except:
+                    print(f"原始JS数据: {match[:200]}...")
+    
+    return iccids
+
+def create_working_api():
+    """创建可用的API函数"""
+    print("\n=== 创建可用的API函数 ===")
+    
+    template = '''
+# 可用的批量查询API
+import requests
+import json
+import re
+from pathlib import Path
+
+# Cookie 信息
+COOKIES = {
+    'platformUser_session': 'eyJsYXN0QWNjZXNzZWQiOjE3NTkxNDc4NjYzMzJ9.2gNtuRzCQH%2BoNra1%2B1WXxcDtTmW91yYVAOLbH6Ry%2BLM',
+    '_manage_session': 'eyJ0b2tlbiI6ImV5SmhiR2NpT2lKSVV6STFOaUlzSW5SNWNDSTZJa3BYVkNKOS5leUoxYzJWeUlqcDdJblZ6WlhKZmFXUWlPaUpaU0RFNE9URXpOVFk1TkRVNU9EWTNOVEkxTVRJaWZTd2lRM0psWVhSbFZHbHRaU0k2SWpJd01qVXRNRGt0TWpsVU1URTZNVGs2TkRJdU9UZzJNRGt4TWpNekt6QXhPakF3SW4wLll6eWtYZGlweUFfaWN4TGxkX3MwS2dWQU5LM2JkZU1fNjM3NDV1ckxQNkEiLCJleHBpcmVUaW1lIjowLCJ1c2VySWQiOiJZSDE4OTEzNTY5NDU5ODY3NTI1MTIiLCJkYXRhTGltaXQiOiJjdXN0b21lIiwidHlwZSI6MSwibGV2ZWwiOjIsInBVc2VySWQiOiJZSDE3Njk5MTg2MjkxMjAyNDAzMjEiLCJsb2dpbk5hbWUiOiJ4aW9uZ3NoaV95dW53ZWkiLCJyb2xlSWQiOiJSTDE5NjI3MDM5MDkxNTU5MDE0NDAiLCJjbGllbnRJRHMiOlsiZXVfY2hlcnkiLCJlYnJvX2NoZXJ5Il0sImNsaWVudElkcyI6ImVicm9fY2hlcnkifQ%3D%3D.jBwQkblyoEP6t7OELXxUMKkoU9%2FJWWQsZPg25SZSz5o'
+}
+
+def read_query_items(path):
+    """读取查询项目文件"""
+    p = Path(path)
+    if not p.exists():
+        raise FileNotFoundError(f"{path} not found.")
+    
+    encodings = ['utf-8', 'gbk', 'utf-8-sig', 'cp1252']
+    for encoding in encodings:
+        try:
+            lines = [l.strip() for l in p.read_text(encoding=encoding).splitlines() if l.strip()]
+            if lines:
+                return lines
+        except Exception:
+            continue
+    
+    raise Exception("无法读取文件")
+
+def query_iccids_batch(iccid_list, page_size=50):
+    """批量查询ICCID"""
+    session = requests.Session()
+    
+    # 设置Cookie
+    for name, value in COOKIES.items():
+        session.cookies.set(name, value, domain='prod-eu-cmp.simbalinkglobal.com')
+    
+    # 设置请求头
+    headers = {
+        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7',
+        'Accept-Encoding': 'gzip, deflate, br, zstd',
+        'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7',
+        'Cache-Control': 'max-age=0',
+        'Connection': 'keep-alive',
+        'Host': 'prod-eu-cmp.simbalinkglobal.com',
+        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
+    }
+    session.headers.update(headers)
+    
+    # 使用您提供的filterData（需要根据实际ICCID列表调整）
+    filter_data = "N4IgkgxhCWAmAy0DOAXEAuEAOAnFrATAMw4AM5AjKUQKw1GkFYDsANLvsWZdXURThwA2dnkIlypKrXqMCpUZwk8ZRIcyFFF47uTwVmBoQe1dJ0vtQAsNU8qm966w3d0X6WUlYqvzj-syevip8NOLBDqo4NDhEIKwgqACGKACuSBggIAC%2BQA"
+    url = f"https://prod-eu-cmp.simbalinkglobal.com/simcustomer?filterData={filter_data}&pageSize={page_size}"
+    
+    try:
+        response = session.get(url, timeout=30)
+        if response.status_code == 200:
+            return response.text
+        else:
+            print(f"请求失败: {response.status_code}")
+            return None
+    except Exception as e:
+        print(f"API调用异常: {e}")
+        return None
+
+def extract_iccids_from_response(response_text):
+    """从响应中提取ICCID"""
+    iccid_pattern = r'8988239000\\d{8}'
+    iccids = re.findall(iccid_pattern, response_text)
+    return iccids
+
+def main():
+    """主函数"""
+    # 读取查询项
+    query_items = read_query_items('text.txt')
+    print(f"读取到 {len(query_items)} 个查询项")
+    
+    # 分批处理
+    batch_size = 50
+    batches = [query_items[i:i+batch_size] for i in range(0, len(query_items), batch_size)]
+    
+    all_results = []
+    for i, batch in enumerate(batches, 1):
+        print(f"\\n处理批次 {i}/{len(batches)}: {len(batch)} 个ICCID")
+        
+        # 查询批次
+        response = query_iccids_batch(batch)
+        if response:
+            # 提取结果
+            found_iccids = extract_iccids_from_response(response)
+            print(f"找到 {len(found_iccids)} 个ICCID结果")
+            all_results.extend(found_iccids)
+        
+        # 批次间等待
+        if i < len(batches):
+            time.sleep(2)
+    
+    print(f"\\n总共找到 {len(all_results)} 个ICCID结果")
+    
+    # 保存结果
+    with open('api_results.txt', 'w', encoding='utf-8') as f:
+        for iccid in all_results:
+            f.write(f"{iccid}\\n")
+    
+    print("结果已保存到 api_results.txt")
+
+if __name__ == "__main__":
+    import time
+    main()
+'''
+    
+    with open('working_api.py', 'w', encoding='utf-8') as f:
+        f.write(template)
+    
+    print("可用的API函数已保存到 working_api.py")
+
+def main():
+    print("=== 响应解析工具 ===")
+    
+    # 获取API响应
+    response_text = get_api_response()
+    if not response_text:
+        print("无法获取API响应")
+        return
+    
+    # 解析响应
+    iccids = parse_response(response_text)
+    
+    # 创建可用的API
+    create_working_api()
+    
+    print("\n=== 解析完成 ===")
+    print("建议:")
+    print("1. 查看找到的ICCID列表")
+    print("2. 使用 working_api.py 进行批量查询")
+    print("3. 需要进一步分析filterData的生成规则")
+
+if __name__ == "__main__":
+    main()