名称: 发票整理器 描述: 通过读取混乱文件,提取关键信息,一致重命名,并按逻辑文件夹排序,自动整理发票和收据用于税务准备。将数小时的手动记账工作转化为分钟的自动化组织过程。—
发票整理器
此技能将混乱的发票、收据和财务文档文件夹转变为干净、税务就绪的归档系统,无需手动操作。
何时使用此技能
- 税务季节准备,需要整理记录
- 管理跨多个供应商的业务费用
- 整理来自混乱文件夹或电子邮件下载的收据
- 设置持续记账的自动发票归档
- 按年份或类别归档财务记录
- 费用核对以进行报销
- 为会计师准备文档
此技能的功能
-
读取发票内容:从PDF、图像和文档中提取信息:
- 供应商/公司名称
- 发票号码
- 日期
- 金额
- 产品或服务描述
- 付款方式
-
一致重命名文件:创建标准化文件名:
- 格式:
YYYY-MM-DD 供应商 - 发票 - 产品或服务.pdf - 示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf
- 格式:
-
按类别组织:排序到逻辑文件夹:
- 按供应商
- 按费用类别(软件、办公室、旅行等)
- 按时间段(年、季度、月)
- 按税务类别(可抵扣、个人等)
-
处理多种格式:适用于:
- PDF发票
- 扫描收据(JPG、PNG)
- 电子邮件附件
- 截图
- 银行对账单
-
保留原件:组织副本时保留原始文件
如何使用
基本用法
导航到混乱的发票文件夹:
cd ~/Desktop/receipts-to-sort
然后询问Claude Code:
为税务整理这些发票
或更具体地:
读取此文件夹中的所有发票,将它们重命名为
"YYYY-MM-DD 供应商 - 发票 - 产品.pdf"格式,
并按供应商组织它们
高级组织
整理这些发票:
1. 从每个文件提取日期、供应商和描述
2. 重命名为标准格式
3. 按费用类别排序到文件夹(软件、办公室、旅行等)
4. 创建一个包含所有发票详细信息的CSV电子表格供我的会计师使用
指令
当用户请求发票整理时:
-
扫描文件夹
识别所有发票文件:
# 查找所有与发票相关的文件 find . -type f \( -name "*.pdf" -o -name "*.jpg" -o -name "*.png" \) -print报告发现:
- 文件总数
- 文件类型
- 日期范围(如果从名称可辨)
- 当前组织(或无组织)
-
从每个文件提取信息
对于每个发票,提取:
从PDF发票中:
- 使用文本提取读取发票内容
- 寻找常见模式:
- “发票日期:”、“日期:”、“发行:”
- “发票 #:”、“发票号码:”
- 公司名称(通常在顶部)
- “应付金额:”、“总计:”、“金额:”
- “描述:”、“服务:”、“产品:”
从图像收据中:
- 读取图像中的可见文本
- 识别供应商名称(通常在顶部)
- 寻找日期(常见格式)
- 找到总金额
对于不清晰文件的备用方案:
- 使用文件名线索
- 检查文件创建/修改日期
- 如果关键信息缺失,标记为手动审查
-
确定组织策略
如果未指定,询问用户偏好:
我发现了[日期范围]内的[X]张发票。 您希望如何组织它们? 1. **按供应商**(Adobe/、Amazon/、Stripe/等) 2. **按类别**(软件/、办公用品/、旅行/等) 3. **按日期**(2024/Q1/、2024/Q2/等) 4. **按税务类别**(可抵扣/、个人/等) 5. **自定义**(描述您的结构) 或者我可以使用默认结构:年/类别/供应商 -
创建标准化文件名
对于每个发票,创建遵循此模式的文件名:
YYYY-MM-DD 供应商 - 发票 - 描述.ext示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf2024-01-10 Amazon - 收据 - 办公用品.pdf2023-12-01 Stripe - 发票 - 月度支付处理.pdf
文件名最佳实践:
- 除连字符外移除特殊字符
- 正确大写供应商名称
- 保持描述简洁但有意义
- 使用一致日期格式(YYYY-MM-DD)进行排序
- 保留原始文件扩展名
-
执行组织
在移动文件前,显示计划:
# 组织计划 ## 提议的结构发票/ ├── 2023/ │ ├── 软件/ │ │ ├── Adobe/ │ │ └── Microsoft/ │ ├── 服务/ │ └── 办公室/ └── 2024/ ├── 软件/ ├── 服务/ └── 办公室/
## 示例更改 之前:`invoice_adobe_march.pdf` 之后:`2024-03-15 Adobe - 发票 - Creative Cloud.pdf` 位置:`发票/2024/软件/Adobe/` 之前:`IMG_2847.jpg` 之后:`2024-02-10 Staples - 收据 - 办公用品.jpg` 位置:`发票/2024/办公室/Staples/` 处理[X]个文件?(是/否)批准后:
# 创建文件夹结构 mkdir -p "发票/2024/软件/Adobe" # 复制(不移动)以保留原件 cp "original.pdf" "发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf" # 或如果用户偏好,移动 mv "original.pdf" "new/path/standardized-name.pdf" -
生成摘要报告
创建一个包含所有发票详细信息的CSV文件:
日期,供应商,发票号码,描述,金额,类别,文件路径 2024-03-15,Adobe,INV-12345,Creative Cloud,52.99,软件,发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf 2024-03-10,Amazon,123-4567890-1234567,办公用品,127.45,办公室,发票/2024/办公室/Amazon/2024-03-10 Amazon - 收据 - 办公用品.pdf ...此CSV可用于:
- 导入到会计软件
- 与会计师分享
- 费用跟踪和报告
- 税务准备
-
提供完成摘要
# 整理完成!📊 ## 摘要 - **处理了**:[X]张发票 - **日期范围**:[最早]到[最晚] - **总金额**:$[求和](如果提取了金额) - **供应商**:[Y]个唯一供应商 ## 新结构发票/ ├── 2024/ (45个文件) │ ├── 软件/ (23个文件) │ ├── 服务/ (12个文件) │ └── 办公室/ (10个文件) └── 2023/ (12个文件)
## 创建的文件 - `/发票/` - 整理的发票 - `/发票/invoice-summary.csv` - 会计用电子表格 - `/发票/originals/` - 原始文件(如果复制了) ## 需要审查的文件 [列出信息无法完全提取的任何文件] ## 下一步 1. 检查`invoice-summary.csv`文件 2. 检查“需要审查”文件夹中的文件 3. 将CSV导入您的会计软件 4. 为未来发票设置自动组织 准备好迎接税务季节!🎉
示例
示例1:税务准备(来自Martin Merschroth)
用户:“我有一个用于税务的混乱发票文件夹。排序并正确重命名它们。”
过程:
- 扫描文件夹:发现147个PDF和图像
- 读取每个发票以提取:
- 日期
- 供应商名称
- 发票号码
- 产品或服务描述
- 重命名所有文件:
YYYY-MM-DD 供应商 - 发票 - 产品.pdf - 组织到:
2024/软件/、2024/旅行/等 - 为会计师创建
invoice-summary.csv - 结果:几分钟内获得税务就绪的整理发票
示例2:月度费用核对
用户:“按类别整理我上个月的业务收据。”
输出:
# 2024年3月收据已整理
## 按类别
- 软件与工具:$847.32 (12张发票)
- 办公用品:$234.18 (8张收据)
- 旅行与餐饮:$1,456.90 (15张收据)
- 专业服务:$2,500.00 (3张发票)
总计:$5,038.40
所有收据已重命名并归档于:
`Business-Receipts/2024/03-March/[类别]/`
CSV导出:`march-2024-expenses.csv`
示例3:多年存档
用户:“我有3年的随机发票。按年份,然后按供应商组织它们。”
输出:创建结构:
发票/
├── 2022/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
├── 2023/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
└── 2024/
├── Adobe/
├── Amazon/
└── ...
每个文件按日期和描述正确重命名。
示例4:电子邮件下载清理
用户:“我从Gmail下载发票。它们都命名为’invoice.pdf’、'invoice(1).pdf’等。修复这个混乱。”
输出:
发现89个文件,都命名为“invoice*.pdf”
读取每个文件以提取真实信息...
重命名示例:
- invoice.pdf → 2024-03-15 Shopify - 发票 - 月度订阅.pdf
- invoice(1).pdf → 2024-03-14 Google - 发票 - Workspace.pdf
- invoice(2).pdf → 2024-03-10 Netlify - 发票 - 专业计划.pdf
所有文件已重命名并按供应商组织。
常见组织模式
按供应商(简单)
发票/
├── Adobe/
├── Amazon/
├── Google/
└── Microsoft/
按年份和类别(税务友好)
发票/
├── 2023/
│ ├── 软件/
│ ├── 硬件/
│ ├── 服务/
│ └── 旅行/
└── 2024/
└── ...
按季度(详细跟踪)
发票/
├── 2024/
│ ├── Q1/
│ │ ├── 软件/
│ │ ├── 办公室/
│ │ └── 旅行/
│ └── Q2/
│ └── ...
按税务类别(会计师就绪)
发票/
├── 可抵扣/
│ ├── 软件/
│ ├── 办公室/
│ └── 专业服务/
├── 部分可抵扣/
│ └── 餐饮旅行/
└── 个人/
自动化设置
对于持续组织:
创建一个脚本,监视我的~/Downloads/invoices文件夹,
并使用我们的标准命名和文件夹结构自动整理任何新发票文件。
这创建一个持久解决方案,在发票到达时自动组织它们。
专业提示
- 将电子邮件扫描为PDF:使用Preview或类似工具,先将电子邮件发票保存为PDF
- 一致下载:将所有发票保存到一个文件夹进行批量处理
- 月度例行:每月整理发票,而非每年
- 备份原件:重新组织前保留原始文件
- 在CSV中包含金额:对预算跟踪有用
- 标记可抵扣性:注意哪些费用可抵扣税款
- 保留收据7年:标准审计期间
处理特殊情况
信息缺失
如果日期/供应商无法提取:
- 标记文件为手动审查
- 使用文件修改日期作为备用
- 创建“需要审查/”文件夹
重复发票
如果同一发票出现多次:
- 比较文件哈希
- 保留质量最高的版本
- 在摘要中注明重复
多页发票
对于跨文件分割的发票:
- 如果需要,合并PDF
- 对部分使用一致命名
- 在CSV中注明是否拆分发票
非标准格式
对于不寻常的收据格式:
- 提取可能的部分
- 标准化可以标准化的部分
- 如果关键信息缺失,标记为审查
相关使用案例
- 创建报销费用报告
- 整理银行对账单
- 管理供应商合同
- 归档旧财务记录
- 准备审计
- 跟踪随时间变化的订阅成本