11LLM 结果复核与对比⏱️ 12分钟让 AI 输出 SQL/代码后,使用另一模型或独立查询对比结果;要求给出: 计算路径:SQL/Pandas 代码、聚合字段、过滤条件。 交叉验证:同一问题用两种方法(SQL vs Pandas),或小样本人工核对。 差异记录:把差异/假设写入报告,避免盲信单次输出。