AI功能
文本信息提取分类(强大)
基于 AI 对文本进行智能分类匹配和信息提取,支持单级分类、层级分类和自由提取模式
视频教程
功能概述
利用 AI 对 Excel 中的文本数据进行批量分类匹配和信息提取。内置资深 CPA 审计专家角色,支持多种任务模式,可自动将凌乱的摘要数据归类到标准科目,或从文本中抓取关键信息。
核心特性:
- 三种任务模式:单级分类、层级分类、自由提取
- 多线程并发:支持配置并发线程数,提升处理速度
- 格式原样保留:自动还原分类项中的空格、编码等格式
- JSON 结构化输出:返回结果自动解析并追加到原始数据后
AI 模型配置
在「参数设置」中配置以下参数:
| 参数 | 说明 |
|---|---|
base_url | AI 平台兼容 OpenAI 的 API 地址 |
api_key | API 密钥 |
model_name | 文本模型名称(此功能仅使用文本模型) |
配置表说明
配置文件路径:input/文本提取匹配配置表.xlsx
「配置表」Sheet
| 行 | A列(配置项) | B列(值) | 说明 |
|---|---|---|---|
| 1 | 任务模式 | 单级分类 / 层级分类 / 自定义 | 决定 AI 如何处理数据 |
| 2 | 任务指令及结果要求 | (填写指令) | 告诉 AI 需要提取什么信息 |
| 3 | 批处理数量 | 数字(如 20) | 每次发送给 AI 的数据行数 |
| 4 | 并发线程数 | 数字(如 3) | 同时运行的线程数 |
「分类项」Sheet(仅分类模式需要)
- 单级分类:A列填写分类项名称
- 层级分类:A列填写大类,B列填写小类
「待匹配数据」Sheet
填写需要进行分类或提取的原始数据,每行一条记录。
任务模式详解
模式一:自由提取
不需要分类,仅从文本中提取关键要素。AI 会根据指令自动生成分列结果。
输出列: 根据指令内容自动生成
技巧: 指令中直接写出需要的中文列名,AI 会自动生成对应的 Excel 表头。
模式二:单级分类
将数据归类到一个预定义的分类列表中。AI 会从「分类项」Sheet 的列表中选择最匹配的项。
输出列: 匹配项(固定)+ 指令中指定的额外字段
模式三:层级分类
将数据归类到「大类+小类」的两级结构中。程序会强制 AI 在指定的大类范围内寻找小类,杜绝跨类乱匹配。
输出列: 匹配大类、匹配小类(固定)+ 指令中指定的额外字段
进阶指令技巧
可以在指令中加入逻辑判断以提升效果:
- 条件提取:"提取金额。若金额大于 100 万,请在"大额标记"列填"是",否则填"否"。"
- 格式规范:"提取公司名称。若涉及多个公司,请用"-"连接输出。"
- 逻辑说明:"请匹配分类。如果无法确定分类,请在"未匹配原因"字段说明理由。"
使用步骤
- 在「参数设置」中配置
base_url、api_key和model_name - 在「配置表」Sheet 中填写任务模式和指令
- 如果是分类模式,在「分类项」Sheet 中填写分类列表
- 在「待匹配数据」Sheet 中粘贴需要处理的数据
- 运行功能
输出结果
- 输出路径:
output/文本提取匹配结果.xlsx - 原始数据列 + 匹配/提取结果列
注意: 任务指令为空时,AI 仅执行纯净匹配,只输出分类结果列。程序会自动将 AI 结果映射回分类项中填写的原始样式(含空格、特殊符号)。