审计工具箱

登录免费下载

AI功能

文件自动分类

利用 AI 对多种类型文件进行自动分类归档，支持多公司模式和多种输出目录结构

视频教程

功能概述

利用 AI 视觉模型和语言模型，对收集到的大量资料进行自动分类归档。支持图片、PDF、Word、Excel、CSV、TXT、Markdown 等多种文件类型，可根据配置自动将文件复制到对应的分类目录中。

核心特性：

多类型文件支持：图片/PDF 用视觉模型，Excel/Word/TXT 等用语言模型
高置信度分类：内置严格分类策略，不确定的文件归入「未分类」而非错误归类
多公司模式：支持按公司分目录批量处理
灵活输出结构：支持「按类别」或「按公司」两种输出目录组织方式
多层级目录输出：分类项支持 / 分隔符创建多级目录结构

AI 模型配置

在「参数设置」中配置以下参数：

参数	说明
`base_url`	AI 平台兼容 OpenAI 的 API 地址
`api_key`	API 密钥
`model_name`	语言模型名称，用于处理文本类文件（Excel、Word、TXT 等）
`visual_model_name`	视觉模型名称，用于处理图片和 PDF（取首页）

配置表说明

配置文件路径：input/文件分类配置表.xlsx

「基础配置」Sheet

行	A列	B列	说明
1	输出文件模式	`文件` 或 `文件夹`	「文件」只输出文件；「文件夹」保留原始目录结构
2	公司模式	`单一` 或 `多个`	「多个」模式下处理文件夹的子目录作为不同公司
3	处理文件夹	（填写路径）	待分类文件的根目录路径
4	输出文件夹	（填写路径）	分类结果的输出目录路径
5	输出模式	`公司` 或 `类别`	「类别」模式：类别/公司名/文件；「公司」模式：公司名/类别/文件

「类型配置」Sheet

列	说明
A列	文件类别路径（支持 `/` 分隔的多级目录，如 `其它资料/不动产抵押权证`）
B列	类别描述（可选，帮助 AI 更准确识别）

示例：

类别路径	描述
客户信用调查表
营业执照
户口簿
税务申报表
其它资料/不动产抵押权证	可能是不动产权证明
其它资料/担保合同	合同中涉及担保条款的文件

支持的文件类型

类型	扩展名	处理方式
图片	`.png` `.jpg` `.jpeg` `.bmp` `.webp`	视觉模型识别图片内容
PDF	`.pdf`	取第一页转为图片，视觉模型识别
Excel	`.xlsx` `.xls`	读取前 5 行内容，语言模型分析
Word	`.docx`	读取前 5 段内容，语言模型分析
CSV	`.csv`	读取前 5 行内容，语言模型分析
文本	`.txt` `.md` `.markdown`	读取全文，语言模型分析

输出结果

文件被复制（非移动）到输出文件夹的对应分类目录中
无法分类的文件归入「未分类」目录

使用步骤

在「参数设置」中配置 base_url、api_key、文本模型和视觉模型
在「基础配置」Sheet 中填写处理文件夹和输出文件夹路径
在「类型配置」Sheet 中填写类别和描述
运行功能，等待分类完成
查看输出目录中的分类结果

注意： 原始文件不会被修改或删除，本功能仅复制文件到输出目录。如果类别显而易见（如「营业执照」），可以不填写描述信息。

纸质信息核对

从 PDF/图片中提取信息，与 Excel 账面数据双向核对，自动生成明细表和汇总报告

多公司文件关键信息提取

批量提取多家公司、多个类别资料的关键信息，支持 PDF/图片/Word/TXT/Markdown 等多类型文件

On this page

视频教程功能概述 AI 模型配置配置表说明「基础配置」Sheet 「类型配置」Sheet 支持的文件类型输出结果使用步骤