⚡

PDF文档处理Skill pdf-processing

PDF文档处理技能提供从PDF文件中提取文本和表格、自动填写表单、合并拆分文档等功能。适用于文档自动化、数据提取、表单处理等场景。关键词：PDF提取、表格识别、表单填写、文档合并、Python PDF处理、OCR文档、数据自动化。

后端开发 0 次安装 13 次浏览更新于 2/28/2026

名称: pdf-processing 描述: 从PDF文件中提取文本和表格，填写表单，合并文档。当处理PDF文件或用户提及PDF、表单或文档提取时使用。

PDF处理技能

此技能提供处理PDF文档的能力。

快速开始

使用pdfplumber从PDF中提取文本：

import pdfplumber

with pdfplumber.open("document.pdf") as pdf:
    text = pdf.pages[0].extract_text()

能力

文本提取

从单页或多页提取文本
保持布局和格式
处理多栏文档

表格提取

识别并提取表格
转换为结构化数据（CSV、JSON）
处理复杂表格布局

表单操作

以编程方式填写PDF表单
提取表单字段值
创建可填写表单

文档操作

合并多个PDF
按页面拆分PDF
旋转页面
添加水印

最佳实践

处理前始终检查PDF是否加密
处理扫描文档时处理OCR情况
验证提取数据的准确性
使用适当的库（pdfplumber用于提取，PyPDF2用于操作）