name: 发票组织器 description: 通过读取混乱的文件,提取关键信息,重命名文件保持一致,并按逻辑文件夹排序,自动组织发票和收据用于税务准备。将数小时的手动记账变为几分钟的自动组织。
发票组织器
这项技能将混乱的发票、收据和财务文档文件夹转换为干净、税务就绪的归档系统,无需手动操作。
何时使用此技能
- 为税务季节准备并需要整理记录
- 管理多个供应商的业务费用
- 整理来自混乱文件夹或邮件下载的收据
- 设置自动化发票归档用于持续记账
- 按年份或类别归档财务记录
- 核对费用用于报销
- 为会计师准备文档
此技能的作用
-
读取发票内容:从PDF、图像和文档中提取信息:
- 供应商/公司名称
- 发票号码
- 日期
- 金额
- 产品或服务描述
- 支付方式
-
一致重命名文件:创建标准化文件名:
- 格式:
YYYY-MM-DD 供应商 - 发票 - 产品或服务.pdf - 示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf
- 格式:
-
按类别组织:排序到逻辑文件夹:
- 按供应商
- 按费用类别(软件、办公、旅行等)
- 按时间段(年、季度、月)
- 按税务类别(可抵扣、个人等)
-
处理多种格式:适用于:
- PDF发票
- 扫描收据(JPG、PNG)
- 邮件附件
- 截图
- 银行对账单
-
保留原件:在组织副本时保留原始文件
如何使用
基本用法
导航到混乱的发票文件夹:
cd ~/Desktop/receipts-to-sort
然后询问 Claude Code:
为税务组织这些发票
或更具体地:
读取此文件夹中的所有发票,将它们重命名为“YYYY-MM-DD 供应商 - 发票 - 产品.pdf”格式,并按供应商组织
高级组织
组织这些发票:
1. 从每个文件提取日期、供应商和描述
2. 重命名为标准格式
3. 按费用类别(软件、办公、旅行等)排序到文件夹
4. 创建包含所有发票细节的CSV电子表格供会计师使用
说明
当用户请求发票组织时:
-
扫描文件夹
识别所有发票文件:
# 查找所有发票相关文件 find . -type f \( -name "*.pdf" -o -name "*.jpg" -o -name "*.png" \) -print报告发现:
- 文件总数
- 文件类型
- 日期范围(如果从名称可辨别)
- 当前组织(或缺乏组织)
-
从每个文件提取信息
对于每个发票,提取:
从PDF发票:
- 使用文本提取读取发票内容
- 寻找常见模式:
- “发票日期:”、“日期:”、“签发:”
- “发票 #:”、“发票号码:”
- 公司名称(通常在顶部)
- “应付金额:”、“总计:”、“金额:”
- “描述:”、“服务:”、“产品:”
从图像收据:
- 从图像读取可见文本
- 识别供应商名称(通常在顶部)
- 寻找日期(常见格式)
- 找到总金额
对于不清楚文件的备选方案:
- 使用文件名线索
- 检查文件创建/修改日期
- 如果关键信息缺失,标记为手动审核
-
确定组织策略
如果未指定,询问用户偏好:
我找到了 [X] 张发票,日期范围为 [日期范围]。 您希望如何组织它们? 1. **按供应商**(Adobe/、Amazon/、Stripe/ 等) 2. **按类别**(软件/、办公用品/、旅行/ 等) 3. **按日期**(2024/Q1/、2024/Q2/ 等) 4. **按税务类别**(可抵扣/、个人/ 等) 5. **自定义**(描述您的结构) 或者我可以使用默认结构:年份/类别/供应商 -
创建标准化文件名
对于每个发票,创建遵循此模式的文件名:
YYYY-MM-DD 供应商 - 发票 - 描述.ext示例:
2024-03-15 Adobe - 发票 - Creative Cloud.pdf2024-01-10 Amazon - 收据 - 办公用品.pdf2023-12-01 Stripe - 发票 - 月度支付处理.pdf
文件名最佳实践:
- 移除特殊字符,除连字符
- 正确大写供应商名称
- 保持描述简洁但有意义
- 使用一致日期格式(YYYY-MM-DD)用于排序
- 保留原始文件扩展名
-
执行组织
在移动文件之前,显示计划:
# 组织计划 ## 提议结构发票/ ├── 2023/ │ ├── 软件/ │ │ ├── Adobe/ │ │ └── Microsoft/ │ ├── 服务/ │ └── 办公/ └── 2024/ ├── 软件/ ├── 服务/ └── 办公/
## 示例更改 之前:`invoice_adobe_march.pdf` 之后:`2024-03-15 Adobe - 发票 - Creative Cloud.pdf` 位置:`发票/2024/软件/Adobe/` 之前:`IMG_2847.jpg` 之后:`2024-02-10 Staples - 收据 - 办公用品.jpg` 位置:`发票/2024/办公/Staples/` 处理 [X] 个文件?(是/否)批准后:
# 创建文件夹结构 mkdir -p "发票/2024/软件/Adobe" # 复制(不移动)以保留原件 cp "original.pdf" "发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf" # 或如果用户偏好,移动 mv "original.pdf" "新路径/标准化名称.pdf" -
生成摘要报告
创建包含所有发票细节的CSV文件:
日期,供应商,发票号码,描述,金额,类别,文件路径 2024-03-15,Adobe,INV-12345,Creative Cloud,52.99,软件,发票/2024/软件/Adobe/2024-03-15 Adobe - 发票 - Creative Cloud.pdf 2024-03-10,Amazon,123-4567890-1234567,办公用品,127.45,办公,发票/2024/办公/Amazon/2024-03-10 Amazon - 收据 - 办公用品.pdf ...此CSV可用于:
- 导入到会计软件
- 与会计师共享
- 费用跟踪和报告
- 税务准备
-
提供完成摘要
# 组织完成! 📊 ## 摘要 - **处理**: [X] 张发票 - **日期范围**: [最早] 到 [最新] - **总金额**: $[总和](如果金额已提取) - **供应商**: [Y] 个唯一供应商 ## 新结构发票/ ├── 2024/ (45 个文件) │ ├── 软件/ (23 个文件) │ ├── 服务/ (12 个文件) │ └── 办公/ (10 个文件) └── 2023/ (12 个文件)
## 创建的文件 - `/发票/` - 已组织发票 - `/发票/发票摘要.csv` - 会计用电子表格 - `/发票/原件/` - 原始文件(如果已复制) ## 需要审核的文件 [列出任何信息无法完全提取的文件] ## 后续步骤 1. 审核 `发票摘要.csv` 文件 2. 检查“需要审核”文件夹中的文件 3. 将CSV导入您的会计软件 4. 为未来发票设置自动组织 准备好迎接税务季节! 🎉
示例
示例1:税务准备(来自 Martin Merschroth)
用户:“我有一个混乱的税务发票文件夹。整理它们并正确重命名。”
过程:
- 扫描文件夹:找到147个PDF和图像
- 读取每张发票以提取:
- 日期
- 供应商名称
- 发票号码
- 产品/服务描述
- 重命名所有文件:
YYYY-MM-DD 供应商 - 发票 - 产品.pdf - 组织到:
2024/软件/、2024/旅行/等 - 创建
发票摘要.csv供会计师使用 - 结果:几分钟内获得税务就绪的已组织发票
示例2:月度费用核对
用户:“按类别整理我上月的业务收据。”
输出:
# 2024年3月收据已组织
## 按类别
- 软件与工具: $847.32 (12 张发票)
- 办公用品: $234.18 (8 张收据)
- 旅行与餐饮: $1,456.90 (15 张收据)
- 专业服务: $2,500.00 (3 张发票)
总计: $5,038.40
所有收据已重命名并归档到:
`业务收据/2024/03-三月/[类别]/`
CSV导出: `2024年3月费用.csv`
示例3:多年归档
用户:“我有3年随机发票。按年份,然后按供应商组织它们。”
输出:创建结构:
发票/
├── 2022/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
├── 2023/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
└── 2024/
├── Adobe/
├── Amazon/
└── ...
每个文件正确重命名,包含日期和描述。
示例4:邮件下载清理
用户:“我从Gmail下载发票。它们都命名为‘invoice.pdf’、‘invoice(1).pdf’等。修复这个混乱。”
输出:
找到89个文件,都命名为“invoice*.pdf”
读取每个文件以提取真实信息...
重命名示例:
- invoice.pdf → 2024-03-15 Shopify - 发票 - 月度订阅.pdf
- invoice(1).pdf → 2024-03-14 Google - 发票 - Workspace.pdf
- invoice(2).pdf → 2024-03-10 Netlify - 发票 - 专业计划.pdf
所有文件已重命名并按供应商组织。
常见组织模式
按供应商(简单)
发票/
├── Adobe/
├── Amazon/
├── Google/
└── Microsoft/
按年份和类别(税务友好)
发票/
├── 2023/
│ ├── 软件/
│ ├── 硬件/
│ ├── 服务/
│ └── 旅行/
└── 2024/
└── ...
按季度(详细跟踪)
发票/
├── 2024/
│ ├── Q1/
│ │ ├── 软件/
│ │ ├── 办公/
│ │ └── 旅行/
│ └── Q2/
│ └── ...
按税务类别(会计师就绪)
发票/
├── 可抵扣/
│ ├── 软件/
│ ├── 办公/
│ └── 专业服务/
├── 部分可抵扣/
│ └── 餐饮旅行/
└── 个人/
自动化设置
对于持续组织:
创建一个脚本,监视我的 ~/下载/发票 文件夹,并使用我们的标准命名和文件夹结构自动组织任何新发票文件。
这创建了一个持久解决方案,在发票到达时组织它们。
专业提示
- 扫描邮件到PDF:使用预览或类似工具先将邮件发票保存为PDF
- 一致下载:将所有发票保存到一个文件夹用于批量处理
- 月度例行:每月组织发票,而不是每年
- 备份原件:在重组前保留原始文件
- 在CSV中包含金额:用于预算跟踪
- 按可抵扣性标记:注意哪些费用可税务抵扣
- 保留收据7年:标准审计期间
处理特殊情况
缺失信息
如果日期/供应商无法提取:
- 标记文件为手动审核
- 使用文件修改日期作为备选
- 创建“需要审核/”文件夹
重复发票
如果同一发票出现多次:
- 比较文件哈希值
- 保留最高质量版本
- 在摘要中注明重复
多页发票
对于跨文件分割的发票:
- 如果需要,合并PDF
- 对部分使用一致命名
- 如果在CSV中注明发票是否分割
非标准格式
对于不寻常的收据格式:
- 提取可能的内容
- 标准化可能的部分
- 如果关键信息缺失,标记为审核
相关用例
- 创建费用报告用于报销
- 组织银行对账单
- 管理供应商合同
- 归档旧财务记录
- 准备审计
- 跟踪订阅成本随时间变化