SW
SW
审计工具箱
AI功能

文本信息提取分类(强大)

基于 AI 对文本进行智能分类匹配和信息提取,支持单级分类、层级分类和自由提取模式

视频教程


功能概述

利用 AI 对 Excel 中的文本数据进行批量分类匹配和信息提取。内置资深 CPA 审计专家角色,支持多种任务模式,可自动将凌乱的摘要数据归类到标准科目,或从文本中抓取关键信息。

核心特性:

  • 三种任务模式:单级分类、层级分类、自由提取
  • 多线程并发:支持配置并发线程数,提升处理速度
  • 格式原样保留:自动还原分类项中的空格、编码等格式
  • JSON 结构化输出:返回结果自动解析并追加到原始数据后

AI 模型配置

在「参数设置」中配置以下参数:

参数说明
base_urlAI 平台兼容 OpenAI 的 API 地址
api_keyAPI 密钥
model_name文本模型名称(此功能仅使用文本模型)

配置表说明

配置文件路径:input/文本提取匹配配置表.xlsx

「配置表」Sheet

A列(配置项)B列(值)说明
1任务模式单级分类 / 层级分类 / 自定义决定 AI 如何处理数据
2任务指令及结果要求(填写指令)告诉 AI 需要提取什么信息
3批处理数量数字(如 20)每次发送给 AI 的数据行数
4并发线程数数字(如 3)同时运行的线程数

「分类项」Sheet(仅分类模式需要)

  • 单级分类:A列填写分类项名称
  • 层级分类:A列填写大类,B列填写小类

「待匹配数据」Sheet

填写需要进行分类或提取的原始数据,每行一条记录。

任务模式详解

模式一:自由提取

不需要分类,仅从文本中提取关键要素。AI 会根据指令自动生成分列结果。

输出列: 根据指令内容自动生成

技巧: 指令中直接写出需要的中文列名,AI 会自动生成对应的 Excel 表头。

模式二:单级分类

将数据归类到一个预定义的分类列表中。AI 会从「分类项」Sheet 的列表中选择最匹配的项。

输出列: 匹配项(固定)+ 指令中指定的额外字段

模式三:层级分类

将数据归类到「大类+小类」的两级结构中。程序会强制 AI 在指定的大类范围内寻找小类,杜绝跨类乱匹配。

输出列: 匹配大类匹配小类(固定)+ 指令中指定的额外字段

进阶指令技巧

可以在指令中加入逻辑判断以提升效果:

  • 条件提取:"提取金额。若金额大于 100 万,请在"大额标记"列填"是",否则填"否"。"
  • 格式规范:"提取公司名称。若涉及多个公司,请用"-"连接输出。"
  • 逻辑说明:"请匹配分类。如果无法确定分类,请在"未匹配原因"字段说明理由。"

使用步骤

  1. 在「参数设置」中配置 base_urlapi_keymodel_name
  2. 在「配置表」Sheet 中填写任务模式和指令
  3. 如果是分类模式,在「分类项」Sheet 中填写分类列表
  4. 在「待匹配数据」Sheet 中粘贴需要处理的数据
  5. 运行功能

输出结果

  • 输出路径:output/文本提取匹配结果.xlsx
  • 原始数据列 + 匹配/提取结果列

注意: 任务指令为空时,AI 仅执行纯净匹配,只输出分类结果列。程序会自动将 AI 结果映射回分类项中填写的原始样式(含空格、特殊符号)。