凭证检查
凭证检查
基于AI视觉模型自动检查审计凭证合规性,支持序时账匹配和无序时账两种模式
基于 AI 视觉模型,自动扫描凭证文件(PDF、图片),根据配置的核查要点逐项检查合规性并输出结构化结果。
两种工作模式
- 有序时账模式:在配置表中填写序时账数据,系统自动匹配凭证文件与序时账记录,用金额、日期等信息辅助核查
- 无序时账模式:不填写序时账,由 AI 直接从凭证图片中识别内容并检查
使用前准备
1. 配置视觉模型
在主程序的参数设置中填写:
| 设置项 | 说明 | 示例 |
|---|---|---|
| Base URL | API 接口地址 | https://dashscope.aliyuncs.com/compatible-mode/v1 |
| API Key | 接口密钥 | sk-xxx |
| 视觉模型名称 | 图片识别模型(必填) | qwen-vl-max、gpt-4o |
注意: 凭证检查必须配置视觉模型,否则无法运行。
2. 准备凭证文件
将凭证文件放在一个文件夹中。支持 PDF、PNG、JPG、JPEG、BMP、WEBP 格式(超过 50 页的 PDF 会自动跳过)。
建议按科目分文件夹存放,以便系统通过文件夹名称自动匹配科目:
凭证/
├── 货币资金/
│ ├── 202501记0001.pdf
│ └── 202501记0002.pdf
├── 管理费用/
│ └── 202502记0016.pdf
└── 应付账款/
└── ...配置表说明
配置文件路径:input/凭证检查配置表.xlsx,包含三个工作表。
工作表1:数据源
| A列 | B列 |
|---|---|
| 凭证文件或文件夹路径 | 线程数(默认 5) |
支持多行,每行一个路径。
工作表2:核查要点
| 科目 | 必要附件 | 核查要点1 | 核查要点2 | ... | 核查要点N |
|---|---|---|---|---|---|
| 货币资金-借方 | 银行回单、收款单 | 原始凭证是否完整 | 金额一致性 | ... | |
| 存货-借方 | 合同协议书 | 检查附件是否完整 | 有授权审批 | ... |
- 科目:具体科目名称,用于匹配凭证
- 必要附件:该科目应包含的附件类型,AI 会额外检查附件完备性
- 核查要点:具体检查项,AI 对每个要点给出"符合"、"不符合"、"无法判断"或"不适用"的结论
- 核查要点列数不限,可根据需要增加
如果凭证未匹配到任何已配置的科目,将使用以下通用核查要点:
- 原始凭证是否齐全
- 记账凭证金额与原始凭证金额是否一致
- 借贷方是否符合正常的会计处理
- 后附所有单据日期是否均在同一年度
工作表3:凭证信息(可选)
| 公司 | 科目代码 | 科目名称 | 日期 | 凭证号 | 摘要 | 借方金额 | 贷方金额 | 索引号 |
|---|---|---|---|---|---|---|---|---|
| A公司 | 6602 | 管理费用 | 2024-02-01 | 记账-0001 | 付推广费 | 452830.19 | S0001 |
- 填写此表即进入有序时账模式
- 索引号:填写后会自动添加到输出文件名前缀(如
[S0001] 202510记0132.pdf) - 支持用户自定义额外列(如"部门"等),这些列会出现在输出结果中
- 如果公司列或凭证号列为空,该行会被跳过
文件匹配策略
有序时账模式下,系统采用四层降级策略匹配凭证文件与序时账记录:
- 精确匹配:从文件路径提取公司 + 月份 + 凭证号,与序时账精确匹配(不消耗 token)
- 科目唯一匹配:按公司 + 科目筛选,若结果唯一则匹配(不消耗 token)
- AI 单文件提取:对未匹配的文件,用 AI 提取第一页凭证信息后再匹配
- AI 批量匹配:对剩余未匹配文件,用 AI 文本模型批量匹配
输出结果
结果文件:output/凭证检查/凭证检查结果_时间戳.xlsx
表头结构(两行合并表头)
| 第1行 | 文件路径 | 文件名称 | 序号 | 公司主体 | 样本(会计凭证) | 测试情况 | 原始凭证 | 索引编号 | 备注 |
|---|---|---|---|---|---|---|---|---|---|
| 第2行 | 年份 / 科目名称 / 日期 / 凭证号 / 业务内容 / 借方金额 / 贷方金额 | 总体情况 / 1~6 |
关键列说明
| 列 | 说明 |
|---|---|
| 总体情况 | √ 全部符合,× 存在不符合,- 无法判断 |
| 测试情况 1~6 | 每个核查要点的结论。符合和不适用不附说明;不符合和无法判断会附说明 |
| 原始凭证 | AI 识别的凭证资料类型 |
| 文件路径 | 带超链接,可直接点击打开原始文件 |
其他 Sheet
| Sheet | 内容 |
|---|---|
| 核查要点 | 回显本次使用的核查要点配置 |
| 未匹配序时账 | 未匹配到凭证文件的序时账记录(如有) |
断点续传
如果运行中断,再次运行时系统会自动检测已有结果文件,跳过已处理的凭证继续执行。运行时会弹窗询问是否继续追加。
常见问题
- "未配置视觉模型名称":去参数设置中填写"视觉模型名称"
- "跳过-页数过多":超过 50 页的 PDF 会自动跳过,可手动拆分后重新运行
- 科目匹配不准确:建议按科目名称建文件夹存放凭证,或填写序时账数据辅助匹配