🔍 SQL Reconciliation Agent

Name: SQL-Reconciliation-Agent
Author: Marbacj

企业级多 Agent SQL 自动对账平台

Enterprise-Grade Multi-Agent SQL Reconciliation Platform

用自然语言驱动 SQL 对账 — 不写一行 SQL，自动完成数据差异发现

快速开始 • 核心架构 • Agent Workflow • 技术亮点 • 文档

🎯 一句话定位

输入：「对比昨天直播 GMV 和订单金额的差异」
输出：完整差异报告 + 根因分析

SQL Reconciliation Agent 是一个企业级 Multi-Agent 对账平台，基于 ReAct 推理 + LangGraph 编排 + RAG Schema 检索，让非技术人员也能通过自然语言完成跨表、跨库数据对账。

用户自然语言 → Intent路由 → Plan分解 → 并行SQL执行 → SQL自动修复 → 差异比对 → Markdown报告

✨ 核心亮点

能力	说明
🤖 Multi-Agent 编排	LangGraph 状态机：Route → Plan → Act → Observe → Reflect 完整闭环
🔄 SQL 自动修复	执行失败时错误信息反馈 LLM，自动重写 SQL，最多重试 3 次
⚡ 并行 SQL 执行	asyncio.gather 并发拉取多张表，P99 延迟降低 60%+
🧠 RAG Schema 检索	向量化表结构语义检索，自动定位相关表，解决 LLM 幻觉问题
🛡️ SQL 权限控制	AST 级拦截 DDL/DML，只读执行，企业安全合规
📊 跨列名比对	列名不同时按位置自动配对比对，输出 `total_gmv ⟷ total_order`
💾 三层记忆系统	Working Memory + Episodic Memory + Semantic Memory
🔌 多数据库适配	SQLite / MySQL / ClickHouse / Hive（方言自动适配）
💬 多轮澄清系统	置信度低时 LLM 生成澄清问题 + Chips 快捷选项，用户点击即续问
📈 趋势 / 同环比 / TopN	内置趋势分析、同环比增长率计算、TopN 排行榜三类通用查询意图
🔍 错误智能诊断	8 类 SQL 错误（表不存在/列不存在/语法/类型等）自动翻译为业务语言
🔐 多租户 JWT 认证	用户注册登录 + 租户级 LLM 配置隔离（每个用户可绑定独立 API Key）
🧬 自进化机制	失败案例自动提炼语义规则，写入 Memory，下次自动注入 Prompt

核心架构

┌─────────────────────────────────────────────────────────────┐
│                    SQL Reconciliation Agent                  │
│                                                             │
│  ┌──────────┐    ┌──────────┐    ┌──────────────────────┐  │
│  │  Web UI  │    │  CLI     │    │   REST API (FastAPI)  │  │
│  └────┬─────┘    └────┬─────┘    └──────────┬───────────┘  │
│       └───────────────┴──────────────────────┘             │
│                         │                                   │
│              ┌──────────▼──────────┐                        │
│              │   LangGraph 状态机   │                        │
│              │   (recon_v2/orch)   │                        │
│              └──────────┬──────────┘                        │
│         ┌───────────────┼───────────────┐                   │
│         ▼               ▼               ▼                   │
│  ┌─────────────┐ ┌──────────────┐ ┌──────────────┐         │
│  │ ReAct Agent │ │ PlanSolve    │ │ Reflection   │         │
│  │ (单步推理)   │ │ Agent(多步)  │ │ Agent(反思)  │         │
│  └─────────────┘ └──────────────┘ └──────────────┘         │
│         │               │               │                   │
│         └───────────────┴───────────────┘                   │
│                         │                                   │
│              ┌──────────▼──────────┐                        │
│              │    Tool Registry    │                        │
│              └──────────┬──────────┘                        │
│    ┌──────────┬──────────┼──────────┬──────────┐            │
│    ▼          ▼          ▼          ▼          ▼            │
│ SQLRunner  DiffCalc  RAGSearch  SchemaInsp  Reporter        │
│                                                             │
│              ┌──────────▼──────────┐                        │
│              │   RAG / Memory      │                        │
│              │  Schema Linking     │                        │
│              └─────────────────────┘                        │
└─────────────────────────────────────────────────────────────┘

Agent Workflow

LangGraph 驱动的完整 Agent 状态机：

flowchart TD
    A["🗣️ 用户自然语言输入"] --> B["Route Node\n意图识别与路由"]
    B --> C{"意图类型"}
    C -->|"需要澄清"| D["Clarify Node\n向用户反问 + Chips 快捷选项"]
    C -->|"可执行"| E["Plan Node\n任务分解 + Schema RAG"]
    E --> F["Act Node\n工具执行"]
    F --> G["Observe Node\n结果观察 + 错误检测"]
    G --> H{"执行状态"}
    H -->|"SQL错误 - 自动修复"| F
    H -->|"完成"| I["Reflect Node\n结果反思 + 报告生成"]
    I --> J["📊 Markdown 差异报告"]
    D --> K["END"]
    J --> K

    style A fill:#4CAF50,color:#fff
    style J fill:#2196F3,color:#fff
    style K fill:#9E9E9E,color:#fff

并行执行路径（multi-table 场景）：

Plan Node
    │
    ├──── parallel_act: asyncio.gather
    │         ├── SQL Runner (左表)
    │         ├── SQL Runner (右表)
    │         └── SQL Runner (维度表)
    │
    └──── Observe: 聚合结果 → Diff → Report

多轮澄清路径（低置信度场景）：

Route Node → 置信度 < 阈值
    │
    └──── Clarify Node
              ├── LLM 生成个性化澄清问题
              ├── 输出 3~4 条 Suggestion Chips
              └── 用户点击 Chip → 直接续问（携带 clarify_context）

快速开始

1. 克隆与安装

git clone https://github.com/Marbacj/SQL-Reconciliation-Agent.git
cd SQL-Reconciliation-Agent
pip install -e .

2. 配置 LLM

cp .env.example .env
# 编辑 .env，填入你的 API Key

LLM_MODEL_ID=deepseek-chat
LLM_API_KEY=sk-xxx
LLM_BASE_URL=https://api.deepseek.com
DB_PATH=data/unified_test.db

支持 DeepSeek / OpenAI / Claude，通过统一适配层无缝切换

3. 生成测试数据

# 企业对账场景：含 3 处故意注入的差异
python data/generate_mock_data.py

# 完整企业 Mock 数据（GMV、订单、支付、直播多表）
python data/generate_enterprise_mock.py

# LeetCode 场景（27 张标准测试表）
python data/generate_leetcode_db.py

4. 运行对账

# CLI 方式
python examples/reconciliation_demo.py

# Web UI 方式（推荐）
python apps/api/main.py
# 访问 http://localhost:8000

5. 自然语言提问示例

> 对比昨天直播 GMV 和订单金额有没有差异？        ← 数值对账
> 查询支付失败的订单，按渠道分组统计              ← 简单查询
> 这个月的 GMV 比上个月减少了多少？              ← 同环比
> 过去 30 天每天的 GMV 走势                    ← 趋势分析
> 本周支付金额 Top10 商家排行                   ← TopN 排行
> 找出 live_gmv 表和 order_summary 表的不一致项  ← 跨表对账

Demo 效果

Agent 完整执行 7 步推理，自动识别 3 处故意注入的差异：

[Thought] 需要先看 live_gmv 和 order_summary 的表结构
[Action]  sql_schema(live_gmv)
[Obs]     6个字段, 26行, 主键 live_id

[Thought] 按 live_id 聚合两表并对比
[Action]  sql_execute(GMV汇总) + sql_execute(订单汇总)  ← 并行执行
[Obs]     左表 25行, 右表 27行 → 行数不一致

[Thought] 需要 FULL OUTER JOIN 精确定位差异行
[Action]  diff_compare(左表, 右表)
[Obs]     发现 3 处差异

[Action]  report_generate(差异报告)
[Finish]  ✅ 报告已保存至 reports/

live_id	问题类型	GMV	订单金额	差异
105	数值差异	12,500	11,800	+700
208	数据缺失	N/A	3,500	⚠️ 仅右表
312	数值差异	8,900	9,200	-300

技术栈

Agent Runtime

LangGraph — 状态机编排，Route / Plan / Act / Observe / Reflect / Clarify 节点
ReAct 范式 — Thought → Action → Observation 推理循环
Plan-Solve — 复杂任务分解为有序子步骤
Reflection — 自动反思结果质量，触发重试
Rules 模块 — orchestration/rules/ 将意图规则与节点逻辑解耦，新增意图只改一个文件

SQL 能力

SQL 自动修复 — 错误反馈 LLM，最多 3 次重试
并行 SQL 执行 — asyncio.gather 并发多表查询
AST 级安全拦截 — 禁止 DDL/DML，只读执行
方言适配器 — SQLite / MySQL / ClickHouse / Hive
错误智能诊断 — 8 类错误（表/列不存在、语法、类型、锁、权限、日期、歧义）自动翻译为中文业务提示

意图识别（8 类）

simple_query — 单表聚合 / 过滤 / 查找
multi_table_join — 多表 JOIN 富化结果
time_window_recon — 跨时间窗口对账
numeric_diff — 数值差异对账
trend_analysis — 时间序列趋势（按天/周/月走势）
period_comparison — 同环比增长率（含 GrowthRateCalculator 工具）
topn_ranking — TopN 排行榜
boundary_edge — DDL/注入/离题 → 拒绝

知识检索

RAG Schema Linking — 表结构向量化，语义检索定位相关表
Milvus / JSON Store — 可插拔向量存储后端
Schema Inspector — 实时 PRAGMA/DESC 查询，避免 schema 幻觉

记忆系统

三层记忆架构 — Working / Episodic / Semantic Memory
对账案例库 — 历史对账案例语义检索，复用成功经验
Skill Library — 可进化的对账 Skill 管理
自进化 — 失败案例自动提炼语义规则，规则置信度低于 0.7 不生效

基础设施

FastAPI — REST API + SSE 流式推理输出
JWT 多租户认证 — 用户注册/登录，租户级独立 LLM 配置
SQLite — 会话持久化 / 对账案例存储 / 认证数据库
Docker Compose — 一键部署（含 Milvus 可选）
熔断器 — 工具执行失败保护，自动降级

评估体系

Golden Set — 企业场景 + LeetCode 场景双轨评估集
执行准确率 — 自动对比 Agent 输出与预期 SQL 结果
评估流水线 — tests/eval/runner.py 批量跑 JSONL 测试用例并生成报告

项目结构

SQL-Reconciliation-Agent/
├── recon_core/                  # 🏗️ Agent 基础框架层
│   ├── core/                    #   LLM 抽象 · 流式推理 · 配置
│   ├── agents/                  #   ReActAgent · PlanSolveAgent · ReflectionAgent
│   ├── tools/                   #   Tool 系统 · Registry · 熔断器
│   │   └── builtin/             #   SQLTool · DiffTool · ReportTool
│   └── context/                 #   上下文工程 · Token 管理
│
├── recon_v2/                    # 🚀 业务编排层（LangGraph）
│   ├── orchestration/           #   LangGraph 状态机
│   │   ├── nodes/               #   route · plan · act · observe · reflect · clarify
│   │   │   └── error_diagnosis.py  # 错误智能诊断（8 类错误翻译）
│   │   └── rules/               #   intent_rules · recon_guard（规则与逻辑解耦）
│   ├── tools/                   #   sql_runner · diff_calculator · rag_searcher
│   │   │                        #   growth_rate_calculator（同环比）
│   ├── rag/                     #   Schema Linking · Milvus · Chunker
│   ├── memory/                  #   三层记忆系统
│   ├── infra/                   #   LLM Gateway · SQL Safety · 方言适配
│   └── evolution/               #   自进化 Pipeline
│
├── apps/
│   ├── api/main.py              # 🌐 FastAPI REST API + SSE 流式
│   ├── api/auth.py              # 🔐 JWT 认证 + 多租户用户管理
│   └── ui/                      # 💻 Web UI（无依赖纯 HTML + Landing Page）
│
├── data/                        # 📊 测试数据集
│   ├── unified_test.db          #   统一测试库（企业 36 表 + LeetCode 27 表）
│   ├── enterprise_mock.db       #   企业 Mock 数据（GMV/订单/支付/直播）
│   ├── leetcode_test.db         #   LeetCode 标准测试库
│   └── generate_*.py            #   数据生成脚本
│
├── tests/                       # 🧪 测试套件（25+ 测试文件）
│   └── eval/                    #   评估流水线
│       ├── golden_set.jsonl     #   企业场景 Golden Set
│       ├── leetcode_golden.jsonl #  LeetCode 场景 Golden Set
│       ├── runner.py            #   批量评估运行器
│       └── metrics.py           #   执行准确率统计
│
├── examples/                    # 🎮 可运行 Demo
└── docs/                        # 📚 技术文档
    └── topics/                  #   架构 · 权限 · RAG · 记忆 · 子Agent · 自进化

为什么不用 LangChain / LlamaIndex？

对比维度	SQL-Reconciliation-Agent	通用 Text2SQL
SQL 修复	✅ 自动重写，最多 3 次	❌ 失败即止
并行执行	✅ asyncio.gather	❌ 串行
Schema 检索	✅ RAG + 实时 PRAGMA	❌ 静态 schema
对账专项	✅ Diff + 跨列比对	❌ 无
记忆复用	✅ 三层记忆 + 案例库	❌ 无状态
企业安全	✅ AST 拦截 DDL/DML	⚠️ 依赖 prompt
多轮澄清	✅ Chips 交互式续问	❌ 无
自进化	✅ 失败 → 规则 → Memory	❌ 无
评估体系	✅ Golden Set + 执行准确率	⚠️ 依赖人工

路线图

ReAct 单 Agent 对账
LangGraph Multi-Agent 编排
RAG Schema Linking
SQL 自动修复（错误反馈循环）
并行 SQL 执行
三层记忆系统
FastAPI + Web UI
Docker 部署
多轮澄清系统（Clarify Node + Chips UI）
趋势分析 / 同环比 / TopN 三类通用查询意图
错误智能诊断（8 类错误业务语言翻译）
JWT 多租户认证（用户管理 + 租户级 LLM 配置）
自进化机制（失败案例提炼语义规则）
评估流水线（企业 + LeetCode Golden Set）
Rules 模块（意图规则与节点逻辑解耦）
Kafka 异步任务队列
定时对账任务（XXL-JOB 集成）
多租户权限隔离（行级 / 列级）
Grafana 可观测性面板

文档

文档	描述
架构设计	整体架构与设计决策
权限控制	SQL 安全拦截机制
RAG 检索	Schema Linking 实现
记忆系统	三层记忆架构
子 Agent	Multi-Agent 协作
自进化机制	Agent 如何从错误中学习
对账设计	对账专项设计文档
异步 Agent	并行执行指南
熔断器	容错与降级策略

Contributing

欢迎贡献！请查看 Issues 或直接提 PR。

适合贡献的方向：

新增数据库方言适配（Trino / Doris / StarRocks）
扩展对账场景（财务对账 / 库存对账）
改进 RAG 检索精度
完善测试覆盖率

License

MIT © Marbacj

如果这个项目对你有帮助，请点个 ⭐ Star！

Java 后端 × AI Agent × 企业数据对账 — 真实场景，不是 Demo