SW审计工具箱 — 让审计效率提升 10 倍

从 PDF/图片中提取信息，与 Excel 账面数据双向核对，自动生成明细表和汇总报告

视频教程

从扫描版 PDF 或图片文件中自动提取关键信息，与 Excel 中的账面数据进行逐条双向核对。内置 AI 二次判断机制，可智能识别语义一致但格式不同的数据。最终生成包含提取结果、核对明细和美化汇总报告的结果文件。

核心特性：

在「参数设置」中配置以下参数：

配置文件路径：input/纸质信息核对配置表.xlsx

行	A列	B列	说明
1	文件或文件夹路径	（填写路径）	PDF/图片文件路径，或包含多个文件的文件夹路径
2	匹配键	（如：`公司主体,银行账号`）	用于关联提取数据与账面数据的字段名，支持中英文逗号分隔
3	并发线程数	数字（默认 1）	同时处理的任务数，建议 3-5
4	补充指令	（可选）	追加到 AI 提示词末尾的补充指令

结果文件包含 3 个 Sheet：

Sheet名	内容
提取结果	AI 从文件中提取的原始数据，第一列为文件路径（可点击跳转）
核对明细	逐条对比：账面数据 - 文件路径 - 提取数据 - 核对结果
汇总表	美化的核对报告，包含总体统计和按字段维度统计

注意： 匹配键字段的值必须在账面数据和文件内容中一致。程序会自动处理大小写、全角半角、空格等差异，但如果字段内容本身不同则无法匹配。

补充指令可用于提升识别准确率，例如指定文件的具体类型（"银行开户清单"）或标注特殊的排版特征
匹配键支持多字段组合，如 公司主体,银行账号，用于精确定位每条记录
OCR 旋转：很多 PDF 拍摄不端正，建议先安装 tesseract-ocr（网盘中可直接下载），各 AI 提取功能可后台调用它对图片自动旋转，否则 AI 模型对歪斜图片识别效果较差
并发线程数建议 3-5，太高可能触发 API 限流

注：该功能为 Pro 用户可用。