SW
SW
审计工具箱
凭证检查

总体选择

根据自定义规则批量剔除序时账中的无关数据行

本功能用于对审计源数据进行批量清洗,根据设定的规则自动识别并剔除不需要的数据行(如计提折旧、结转损益、内部往来或金额为零的分录)。

适用场景

  • 序时账清洗(剔除结转分录、计提分录等)
  • 往来明细筛选
  • 费用表预处理
  • 抽凭前的总体选择

配置表结构

配置文件路径:input/总体选择配置表.xlsx,包含两个 Sheet。

Sheet 1:数据源

在 A 列填写待处理的文件路径或文件夹路径,从第 2 行开始:

A列(文件/文件夹路径)说明
raw_data/2023序时账/填写文件夹路径,自动扫描所有 Excel/CSV
raw_data/子公司A/科目余额表.xlsx也可以指定单个文件

Sheet 2:剔除数据配置

第一行为列名(必须与源数据表头完全一致),从第二行开始填写剔除规则。

核心逻辑: 同一行不同列之间是**"且"(AND)关系,不同行之间是"或"(OR)**关系。单元格留空表示对该列不做限制。

规则语法

数据类型筛选需求语法示例含义
文本包含(模糊)直接写文字折旧内容含"折旧"即剔除
文本精准匹配前面加 ##摊销完全等于"摊销"才剔除
文本多个词(任一)/\ 分隔内部/往来/划转含其中任意一个即剔除
数值比较大小使用 > < >= <= = !=>0剔除大于 0 的
数值等于数值直接写数字0剔除等于 0 的
数值不等于!=!=100剔除不等于 100 的

配置示例

目标:剔除固定资产下的折旧/计提分录、财务费用手续费、借贷方均为零的空转数据。

一级科目摘要借方金额贷方金额
#固定资产折旧/计提
#财务费用#手续费
00

输出

  • 输出路径:output/总体选择/
  • 输出保持原文件目录结构
  • 所有 .xls 文件统一转为 .xlsx 格式输出(避免旧格式行数限制)
  • 运行日志会打印每条规则的命中统计

注意事项

  • 配置表中的列名必须与源数据表头完全一致(含空格)
  • 如果列名不匹配,程序会立即停止并提示缺失的列名
  • 文本中用 /\ 分隔的多个关键词,只要匹配其中任意一个即命中
  • 程序支持 .xls.xlsx.csv 三种格式