凭证检查
批量抽凭
多公司多科目批量审计抽样,支持PPS、分层、随机三种方法
本功能将多公司多科目的序时账作为总体,按照重要性水平自动分层抽样,支持 PPS、分层、随机三种抽样方法。
抽样逻辑
- 重要项目:金额大于等于实际执行重要性水平的全抽
- 不重要项目:金额低于错报临界值的不抽
- 样本总体:中间部分按大类(如公司)和小类(如科目)分组,每组独立抽样
抽样数量公式:样本量 = 向上取整(样本总体金额 / 可容忍错报 × 保证系数)
配置表结构
配置文件路径:input/批量抽凭配置表.xlsx,包含两个 Sheet。
Sheet 1:基础配置
| 参数 | 示例 | 说明 |
|---|---|---|
| 文件或文件夹路径 | /data/序时账.xlsx | 必填。支持单个文件或文件夹 |
| 表名(非必填) | 序时账 | 不填则读取第一个 Sheet |
| 大类 | 公司 | 必填。填写序时账中分组列的列名(如公司列名) |
| 小类 | 1级科目 | 选填。填写细分分组列的列名 |
| 借方金额 | 借方 | 必填。借方金额列名 |
| 贷方金额 | 贷方 | 必填。贷方金额列名 |
| 凭证号 | 凭证号 | 必填。凭证号列名 |
| 凭证日期 | 凭证日期 | 必填。日期列名 |
| 指定随机数种子(非必填) | 12345 | 填写后可复现之前的抽样结果 |
| 抽样方法 | PPS | 支持 PPS、分层、随机 |
Sheet 2:重要性水平
| 大类 | 实际执行的重要性水平 | 错报临界值 | 可容忍错报 | 保证系数 | 指定样本量 |
|---|---|---|---|---|---|
| A公司 | 786266.83 | 104835.58 | 393133.42 | 0.5 | |
| B公司 | 719618.16 | 95949.09 | 359809.08 | 0.5 | |
| C公司 | 25 |
- 大类:与基础配置中"大类"列名对应的值(如公司名称或科目名称)
- 指定样本量:若填写,则忽略可容忍错报和保证系数的计算公式,直接按指定数量抽样
- 大类按公司还是科目分组,取决于基础配置中"大类"的列名
抽样方法说明
PPS 抽样
经典累积金额区间抽样。以金额绝对值为权重,金额越大的凭证被选中概率越高。
分层抽样
将样本总体按金额分为高、中、低三层(K-Means 聚类),每层按金额占比分配样本量,层内随机选取。
随机抽样
从样本总体中纯随机选取指定数量的样本。
输出文件
输出路径:output/批量抽凭/抽样结果_时间戳.xlsx
| Sheet | 内容 |
|---|---|
| 抽凭参数 | 各分组的计算参数和抽样数量汇总 |
| 基础配置 | 回显本次运行的基础配置(含随机数种子) |
| 重要性水平 | 回显本次运行的重要性水平表 |
| 抽样结果 | 原始序时账 + 新增 标识、抽样、抽样说明 三列 |
| 去重结果 | 按凭证号去重后的抽样结果,同凭证的多个科目合并显示 |
新增列说明
| 列名 | 说明 |
|---|---|
标识 | 重要项目 / 不重要项目 / 样本总体 / 未配置重要性水平 |
抽样 | 被抽中的标记为 √ |
抽样说明 | 抽样方式说明(如 [PPS] 命中 1 次、[分层] 高额层、[随机] 常规抽取) |
注意: 如果数据量超过 100 万行,"抽样结果"表仅输出重要项目和被抽中项目,以减小文件体积。
复现结果
配置表中的"指定随机数种子"参数可用于复现之前的抽样结果。每次运行后,种子值会自动写入输出的基础配置表中,方便记录和复现。