文档生成与处理技能Skill document-generation

这是一个用于自动化创建、编辑和提取Word、PPT、Excel、PDF等办公文档内容的工具技能。它支持文档生成、格式转换和内容提取,适用于需要批量处理或自动生成报告、演示文稿、数据表格的场景。关键词:文档自动化,Office文档生成,PDF处理,Python办公自动化,内容提取,格式转换。

后端开发 3 次安装 6 次浏览 更新于 3/2/2026

name: document-generation version: 1.0.0 description: 一个用于生成和处理专业文档(Word、PowerPoint、Excel、PDF)的强大技能。 tags:

  • document
  • office
  • generation
  • processing

文档生成与处理技能

此技能提供了创建、编辑和从办公文档中提取内容的全面能力。专为需要文档处理能力的智能体设计。

能力

1. 文档生成

  • Word (.docx):生成包含标题、段落、项目符号和表格的专业报告。
  • PowerPoint (.pptx):创建包含标题、内容和统一布局的幻灯片。
  • Excel (.xlsx):创建包含数据和基本格式的电子表格。
  • PDF (.pdf):从文本内容生成PDF文档。

2. 文档处理

  • 内容提取:从上传的PDF、Word、PowerPoint和Excel文件中提取文本和结构。
  • 格式转换:在兼容格式之间进行转换。

使用方法

此技能暴露了位于 scripts/ 目录下的一组Python脚本。

Python API

from app.skills.common.document_skill.scripts.word_generator import WordGenerator
from app.skills.common.document_skill.scripts.ppt_generator import PPTGenerator
from app.skills.common.document_skill.scripts.excel_generator import excel_generator
from app.skills.common.document_skill.scripts.office_processor import OfficeProcessor

# 示例:生成Word文档
word_gen = WordGenerator(output_dir="path/to/output")
file_path = word_gen.generate(markdown_content, "filename")

# 示例:提取内容
processor = OfficeProcessor()
content = processor.process("path/to/file.pdf")

依赖项

  • python-docx
  • python-pptx
  • openpyxl
  • reportlab (用于PDF)
  • pypdf (用于PDF提取)

目录结构

  • scripts/:实现逻辑。
  • templates/:(可选)文档模板。