name: 发票自动整理器 description: 自动整理发票和收据,为税务准备而设计,通过读取混乱的文件、提取关键信息、一致地重命名它们,并按逻辑文件夹排序。将几小时的手工簿记变成几分钟的自动化整理。
发票整理器
这个技能将混乱的发票、收据和财务文档文件夹转换为干净、税务就绪的归档系统,无需手动操作。
何时使用此技能
- 准备税务季节,需要整理记录
- 管理多个供应商的业务支出
- 整理来自混乱文件夹或邮件下载的收据
- 为持续簿记设置自动发票归档
- 按年份或类别归档财务记录
- 为报销核对支出
- 为会计师准备文档
此技能的功能
-
读取发票内容:从PDF、图像和文档中提取信息:
- 供应商/公司名称
- 发票号码
- 日期
- 金额
- 产品或服务描述
- 支付方式
-
一致重命名文件:创建标准化文件名:
- 格式:
YYYY-MM-DD 供应商 - 发票 - 产品或服务.pdf - 示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf
- 格式:
-
按类别组织:排序到逻辑文件夹:
- 按供应商
- 按支出类别(软件、办公、旅行等)
- 按时间周期(年份、季度、月份)
- 按税务类别(可抵扣、个人等)
-
处理多种格式:适用于:
- PDF发票
- 扫描收据(JPG、PNG)
- 邮件附件
- 截图
- 银行对账单
-
保留原始文件:在组织副本时保留原始文件
如何使用
基本使用
导航到您的混乱发票文件夹:
cd ~/Desktop/receipts-to-sort
然后询问Claude Code:
为税务整理这些发票
或更具体地:
读取此文件夹中的所有发票,将它们重命名为
“YYYY-MM-DD 供应商 - 发票 - 产品.pdf”格式,
并按供应商组织它们
高级组织
整理这些发票:
1. 从每个文件提取日期、供应商和描述
2. 重命名为标准格式
3. 按支出类别(软件、办公、旅行等)排序到文件夹
4. 创建包含所有发票细节的CSV电子表格,供我的会计师使用
指令
当用户请求发票组织时:
-
扫描文件夹
识别所有发票文件:
# 查找所有发票相关文件 find . -type f \( -name "*.pdf" -o -name "*.jpg" -o -name "*.png" \) -print报告发现:
- 文件总数
- 文件类型
- 日期范围(如果从名称中可辨别)
- 当前组织情况(或无组织)
-
从每个文件提取信息
对于每个发票,提取:
来自PDF发票:
- 使用文本提取读取发票内容
- 查找常见模式:
- “发票日期:”、“日期:”、“签发:”
- “发票 #:”、“发票号码:”
- 公司名称(通常在顶部)
- “应付金额:”、“总计:”、“金额:”
- “描述:”、“服务:”、“产品:”
来自图像收据:
- 读取图像中的可见文本
- 识别供应商名称(通常在顶部)
- 查找日期(常见格式)
- 找到总金额
对于不清晰文件的备用方案:
- 使用文件名线索
- 检查文件创建/修改日期
- 如果关键信息缺失,标记为手动审查
-
确定组织策略
如果未指定,询问用户偏好:
我找到了 [X] 张发票,日期范围从 [最早] 到 [最晚]。 您希望如何组织它们? 1. **按供应商**(Adobe/、Amazon/、Stripe/ 等) 2. **按类别**(软件/、办公用品/、旅行/ 等) 3. **按日期**(2024/Q1/、2024/Q2/ 等) 4. **按税务类别**(可抵扣/、个人/ 等) 5. **自定义**(描述您的结构) 或者我可以使用默认结构:年份/类别/供应商 -
创建标准化文件名
对于每个发票,创建遵循此模式的文件名:
YYYY-MM-DD 供应商 - 发票 - 描述.扩展名示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf2024-01-10 Amazon - 收据 - 办公用品.pdf2023-12-01 Stripe - 发票 - 月度支付处理.pdf
文件名最佳实践:
- 删除特殊字符,除了连字符
- 适当大写供应商名称
- 保持描述简洁但有意义
- 使用一致日期格式(YYYY-MM-DD)以便排序
- 保留原始文件扩展名
-
执行组织
在移动文件之前,显示计划:
# 组织计划 ## 提议的结构发票/ ├── 2023/ │ ├── 软件/ │ │ ├── Adobe/ │ │ └── Microsoft/ │ ├── 服务/ │ └── 办公/ └── 2024/ ├── 软件/ ├── 服务/ └── 办公/
## 示例更改 之前:`invoice_adobe_march.pdf` 之后:`2024-03-15 Adobe - 发票 - Creative Cloud.pdf` 位置:`发票/2024/软件/Adobe/` 之前:`IMG_2847.jpg` 之后:`2024-02-10 Staples - 收据 - 办公用品.jpg` 位置:`发票/2024/办公/Staples/` 处理 [X] 个文件?(是/否)批准后:
# 创建文件夹结构 mkdir -p "发票/2024/软件/Adobe" # 复制(不移动)以保留原始文件 cp "original.pdf" "发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf" # 或者如果用户偏好,移动 mv "original.pdf" "new/path/standardized-name.pdf" -
生成摘要报告
创建一个包含所有发票细节的CSV文件:
日期,供应商,发票号码,描述,金额,类别,文件路径 2024-03-15,Adobe,INV-12345,Creative Cloud,52.99,软件,发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf 2024-03-10,Amazon,123-4567890-1234567,办公用品,127.45,办公,发票/2024/办公/Amazon/2024-03-10 Amazon - 收据 - 办公用品.pdf ...这个CSV对于以下用途很有用:
- 导入到会计软件
- 与会计师共享
- 支出跟踪和报告
- 税务准备
-
提供完成摘要
# 组织完成!📊 ## 摘要 - **已处理**:[X] 张发票 - **日期范围**:[最早] 到 [最晚] - **总金额**:$[总和](如果提取了金额) - **供应商**:[Y] 个唯一供应商 ## 新结构发票/ ├── 2024/ (45 个文件) │ ├── 软件/ (23 个文件) │ ├── 服务/ (12 个文件) │ └── 办公/ (10 个文件) └── 2023/ (12 个文件)
## 创建的文件 - `/发票/` - 组织好的发票 - `/发票/invoice-summary.csv` - 用于会计的电子表格 - `/发票/originals/` - 原始文件(如果已复制) ## 需要审查的文件 [列出任何无法完全提取信息的文件] ## 下一步 1. 查看 `invoice-summary.csv` 文件 2. 检查“需要审查”文件夹中的文件 3. 将CSV导入您的会计软件 4. 为未来的发票设置自动组织 为税务季节做好准备!🎉
示例
示例1:税务准备(来自Martin Merschroth)
用户:“我有一个用于税务的混乱发票文件夹。对它们进行排序并适当重命名。”
过程:
- 扫描文件夹:找到147个PDF和图像
- 读取每个发票以提取:
- 日期
- 供应商名称
- 发票号码
- 产品/服务描述
- 重命名所有文件:
YYYY-MM-DD 供应商 - 发票 - 产品.pdf - 组织到:
2024/软件/、2024/旅行/等 - 创建
invoice-summary.csv供会计师使用 - 结果:几分钟内获得税务就绪的整理发票
示例2:月度支出核对
用户:“按类别整理我上个月的业务收据。”
输出:
# 2024年3月收据已整理
## 按类别
- 软件与工具:$847.32 (12张发票)
- 办公用品:$234.18 (8张收据)
- 旅行与餐饮:$1,456.90 (15张收据)
- 专业服务:$2,500.00 (3张发票)
总计:$5,038.40
所有收据已重命名并存放在:
`业务收据/2024/03-三月/[类别]/`
CSV导出:`march-2024-expenses.csv`
示例3:多年度归档
用户:“我有3年的随机发票。按年份组织它们,然后按供应商组织。”
输出:创建结构:
发票/
├── 2022/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
├── 2023/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
└── 2024/
├── Adobe/
├── Amazon/
└── ...
每个文件都适当重命名,带有日期和描述。
示例4:邮件下载清理
用户:“我从Gmail下载发票。它们都命名为’invoice.pdf’、'invoice(1).pdf’等。清理这个混乱。”
输出:
找到89个文件,都命名为“invoice*.pdf”
读取每个文件以提取真实信息...
重命名示例:
- invoice.pdf → 2024-03-15 Shopify - 发票 - 月度订阅.pdf
- invoice(1).pdf → 2024-03-14 Google - 发票 - Workspace.pdf
- invoice(2).pdf → 2024-03-10 Netlify - 发票 - 专业计划.pdf
所有文件已重命名并按供应商组织。
常见组织模式
按供应商(简单)
发票/
├── Adobe/
├── Amazon/
├── Google/
└── Microsoft/
按年份和类别(税务友好)
发票/
├── 2023/
│ ├── 软件/
│ ├── 硬件/
│ ├── 服务/
│ └── 旅行/
└── 2024/
└── ...
按季度(详细跟踪)
发票/
├── 2024/
│ ├── Q1/
│ │ ├── 软件/
│ │ ├── 办公/
│ │ └── 旅行/
│ └── Q2/
│ └── ...
按税务类别(会计师就绪)
发票/
├── 可抵扣/
│ ├── 软件/
│ ├── 办公/
│ └── 专业服务/
├── 部分可抵扣/
│ └── 餐饮旅行/
└── 个人/
自动化设置
对于持续组织:
创建一个脚本,监视我的 ~/Downloads/invoices 文件夹
并使用我们的标准命名和文件夹结构自动组织任何新发票文件。
这创建一个持久的解决方案,在发票到达时自动组织它们。
专业提示
- 扫描邮件为PDF:使用Preview或类似工具先将邮件发票保存为PDF
- 一致下载:将所有发票保存到一个文件夹以进行批量处理
- 月度例行:月度而非年度组织发票
- 备份原始文件:在重新组织之前保留原始文件
- 在CSV中包含金额:对预算跟踪有用
- 标记可抵扣性:注意哪些支出是可抵扣税的
- 保留收据7年:标准审计期
处理特殊情况
缺失信息
如果无法提取日期/供应商:
- 标记文件为手动审查
- 使用文件修改日期作为备用
- 创建“需要审查/”文件夹
重复发票
如果同一发票出现多次:
- 比较文件哈希
- 保留最高质量版本
- 在摘要中注明重复
多页发票
对于跨文件分割的发票:
- 如果需要,合并PDF
- 使用一致的部件命名
- 如果发票被分割,在CSV中注明
非标准格式
对于不寻常的收据格式:
- 提取可能的信息
- 标准化可以标准化的部分
- 如果关键信息缺失,标记为审查
相关用例
- 为报销创建支出报告
- 组织银行对账单
- 管理供应商合同
- 归档旧的财务记录
- 准备审计
- 跟踪随时间变化的订阅成本