SW
SW
审计工具箱
附注搭建

披露口径提取

根据批注定位附注表格,提取报表项目名称及披露明细口径

功能简介

本功能用于从审计附注文件(Excel 格式)中,批量提取报表项目名称及其对应的披露明细口径

它利用 Excel 的**批注(Comments)**功能来定位表格区域,支持智能配对和噪音过滤,最终生成一张清洗好的清单,方便后续进行数据核对或底稿编制。

准备工作

在使用前,请确保您的附注文件满足以下条件:

  • 文件格式.xlsx.xlsm 格式
  • 批注标记:目标表格区域需包含定位批注(通常由附注生成工具自动生成,或手动添加)
    • 表首批注:包含关键词(如 表首),可带编号(如 表首:_01
    • 表尾批注:包含关键词(如 表尾),可带编号(如 表尾:_01

配置文件

配置文件路径:input/披露口径提取配置表.xlsx

在 Sheet 名为 配置表 的页面中,严格按照以下顺序在 B 列填写参数:

行号参数名称填写示例(B列)说明
1文件路径D:\审计底稿\2024年报\附注.xlsx目标文件的绝对路径
2表名W附注模板包含数据的 Sheet 页名称
3表头关键词表首用于定位表格开始行的批注关键词
4表尾关键词表尾用于定位表格结束行的批注关键词
5严格过滤是否仅提取左侧有文字说明的表格

关于「严格过滤」(B5 参数)

  • 填写「是」:程序会检查表格起始列的左边一列。如果该列在表格高度范围内全是空的,程序将跳过该表格。推荐使用此模式,可排除无效空模板
  • 填写「否」:只要有成对的 表首/表尾 批注,无论旁边是否有文字,都会强制提取内容

运行与输出

  1. 运行程序:在工具箱菜单中选择「披露口径提取」功能并运行
  2. 查看进度:控制台会显示扫描进度、配对数量以及每个表格的提取情况
  3. 获取结果:运行完成后,打开 output/披露口径提取结果.xlsx

结果示例

报表项目披露项目
货币资金银行存款
货币资金其他货币资金
应收账款按单项计提坏账准备

程序会自动清洗报表项目前的数字编号、括号和特殊符号。

配对逻辑

  1. ID 精确匹配:优先根据批注编号(如 表首:01表尾:01)配对
  2. 位置就近匹配:无编号或编号不匹配的,按行位置从上到下就近配对

常见问题

Q: 报错「找不到配置文件」怎么办?

请确保 input 文件夹下存在 披露口径提取配置表.xlsx,且 Sheet 名称为 配置表

Q: 提取到的数据很少,很多表格没出来?

请检查配置文件中 B5 单元格是否填了「是」。尝试改为「否」重新运行,看看是否因为左侧列为空被过滤掉了。

Q: 报表项目名字带有「3|」或者「1.」前缀?

程序内置了清洗规则,会自动去除开头的数字、竖线、点、空格以及括号。如果仍有特殊符号未去除,可能需要微调正则规则。

Q: 运行速度很慢?

如果 Excel 文件非常大且包含大量批注,扫描需要一定时间。程序会每隔一段行数打印进度,请耐心等待。