name: document-generation version: 1.0.0 description: 一个用于生成和处理专业文档(Word、PowerPoint、Excel、PDF)的强大技能。 tags:
- document
- office
- generation
- processing
文档生成与处理技能
此技能提供了创建、编辑和从办公文档中提取内容的全面能力。专为需要文档处理能力的智能体设计。
能力
1. 文档生成
- Word (.docx):生成包含标题、段落、项目符号和表格的专业报告。
- PowerPoint (.pptx):创建包含标题、内容和统一布局的幻灯片。
- Excel (.xlsx):创建包含数据和基本格式的电子表格。
- PDF (.pdf):从文本内容生成PDF文档。
2. 文档处理
- 内容提取:从上传的PDF、Word、PowerPoint和Excel文件中提取文本和结构。
- 格式转换:在兼容格式之间进行转换。
使用方法
此技能暴露了位于 scripts/ 目录下的一组Python脚本。
Python API
from app.skills.common.document_skill.scripts.word_generator import WordGenerator
from app.skills.common.document_skill.scripts.ppt_generator import PPTGenerator
from app.skills.common.document_skill.scripts.excel_generator import excel_generator
from app.skills.common.document_skill.scripts.office_processor import OfficeProcessor
# 示例:生成Word文档
word_gen = WordGenerator(output_dir="path/to/output")
file_path = word_gen.generate(markdown_content, "filename")
# 示例:提取内容
processor = OfficeProcessor()
content = processor.process("path/to/file.pdf")
依赖项
- python-docx
- python-pptx
- openpyxl
- reportlab (用于PDF)
- pypdf (用于PDF提取)
目录结构
scripts/:实现逻辑。templates/:(可选)文档模板。