附注搭建
披露口径提取
根据批注定位附注表格,提取报表项目名称及披露明细口径
功能简介
本功能用于从审计附注文件(Excel 格式)中,批量提取报表项目名称及其对应的披露明细口径。
它利用 Excel 的**批注(Comments)**功能来定位表格区域,支持智能配对和噪音过滤,最终生成一张清洗好的清单,方便后续进行数据核对或底稿编制。
准备工作
在使用前,请确保您的附注文件满足以下条件:
- 文件格式:
.xlsx或.xlsm格式 - 批注标记:目标表格区域需包含定位批注(通常由附注生成工具自动生成,或手动添加)
- 表首批注:包含关键词(如
表首),可带编号(如表首:_01) - 表尾批注:包含关键词(如
表尾),可带编号(如表尾:_01)
- 表首批注:包含关键词(如
配置文件
配置文件路径:input/披露口径提取配置表.xlsx
在 Sheet 名为 配置表 的页面中,严格按照以下顺序在 B 列填写参数:
| 行号 | 参数名称 | 填写示例(B列) | 说明 |
|---|---|---|---|
| 1 | 文件路径 | D:\审计底稿\2024年报\附注.xlsx | 目标文件的绝对路径 |
| 2 | 表名 | W附注模板 | 包含数据的 Sheet 页名称 |
| 3 | 表头关键词 | 表首 | 用于定位表格开始行的批注关键词 |
| 4 | 表尾关键词 | 表尾 | 用于定位表格结束行的批注关键词 |
| 5 | 严格过滤 | 是 | 是否仅提取左侧有文字说明的表格 |
关于「严格过滤」(B5 参数)
- 填写「是」:程序会检查表格起始列的左边一列。如果该列在表格高度范围内全是空的,程序将跳过该表格。推荐使用此模式,可排除无效空模板
- 填写「否」:只要有成对的
表首/表尾批注,无论旁边是否有文字,都会强制提取内容
运行与输出
- 运行程序:在工具箱菜单中选择「披露口径提取」功能并运行
- 查看进度:控制台会显示扫描进度、配对数量以及每个表格的提取情况
- 获取结果:运行完成后,打开
output/披露口径提取结果.xlsx
结果示例
| 报表项目 | 披露项目 |
|---|---|
| 货币资金 | 银行存款 |
| 货币资金 | 其他货币资金 |
| 应收账款 | 按单项计提坏账准备 |
程序会自动清洗报表项目前的数字编号、括号和特殊符号。
配对逻辑
- ID 精确匹配:优先根据批注编号(如
表首:01对表尾:01)配对 - 位置就近匹配:无编号或编号不匹配的,按行位置从上到下就近配对
常见问题
Q: 报错「找不到配置文件」怎么办?
请确保 input 文件夹下存在 披露口径提取配置表.xlsx,且 Sheet 名称为 配置表。
Q: 提取到的数据很少,很多表格没出来?
请检查配置文件中 B5 单元格是否填了「是」。尝试改为「否」重新运行,看看是否因为左侧列为空被过滤掉了。
Q: 报表项目名字带有「3|」或者「1.」前缀?
程序内置了清洗规则,会自动去除开头的数字、竖线、点、空格以及括号。如果仍有特殊符号未去除,可能需要微调正则规则。
Q: 运行速度很慢?
如果 Excel 文件非常大且包含大量批注,扫描需要一定时间。程序会每隔一段行数打印进度,请耐心等待。