搜索

pdf文档 PyMuPDF 1.24.2 Documentation

6.84 MB 565 页 0 下载 83 浏览 0 评论 0 收藏
语言 格式 评分
英语
.pdf
3
摘要
《PyMuPDF 1.24.2 Documentation》详细介绍了PyMuPDF的版本更新、新增功能和相关方法。文档涵盖了从1.14.0到1.24.2多个版本的更新内容,包括支持CJK字体、新增注释类型、优化性能、改进文本提取功能等。同时,文档还提供了如何使用PyMuPDF进行OCR、管理嵌入式文件、处理注释和图形等内容。
AI总结
### PyMuPDF 1.24.2 文档总结 #### 1. 主要功能与改进 - **版本 1.24.2**: - **Pixmap 方法增强**:新增 `Pixmap.pixel()` 和 `Pixmap.tobytes()` 方法,支持更多图像格式(如 PSD)。 - **嵌入文件支持**:新增嵌入文件信息管理方法,支持添加、删除和修改嵌入文件。 - **形状与图形**:新增 `Shape.drawQuad()` 方法,支持绘制四边形,并改进了矩形和四边形的处理逻辑。 - **CJK 字体支持**:新增对中文字体(简体、繁体、日文、韩文)的支持,丰富了文本插入功能。 - **性能优化**:改进了文档处理和页面插入的性能,减少内存占用。 - **版本 1.14.0**: - **注释与标记**:新增“注释”、“橡皮章”和“波浪线”等注解功能。 - **四边形支持**:新增 `Quad` 类,支持四边形形状的绘制和处理。 - **文档保存增强**:新增 `Document.save()` 的 `decrypt` 参数,支持加密文档的保存。 - **版本 1.14.3**: - **CJK 字体支持**:新增对中文字体的生成输出支持,覆盖 `Page.insertFont()` 和 `Shape.insertText()` 等方法。 - **字体改进**:新增对 `Symbol` 和 `Zapfdingbats` 字体的完全支持,并优化标准字体的引用方式。 - **版本 1.14.1**: - **性能提升**:优化了文本提取和图像处理的性能。 - **文件路径支持**:支持使用 `pathlib` 对象打开文件。 - **版本 1.21.1**: - **Stories 功能**:新增“故事”功能,支持复杂文档结构。 - **Bug 修复**:修复了多个文本提取、图像处理和 PDF 生成中的问题,包括内存泄漏和边界检测逻辑。 - **文档工具增强**:新增 `Page.replace_image()` 和 `Page.delete_image()` 方法,支持页面图像的替换和删除。 #### 2. 命令行接口 - **新增 CLI 工具**:支持通过命令行执行 PDF 处理任务,如文档清理、页面提取等,功能覆盖 MuPDF 的 `mutool` 工具,同时支持嵌入文件处理。 - **使用方式**: - 通过 `pymupdf` 命令直接调用。 - 使用 `python -m fitz` 调用。 #### 3. 文档与资源 - **文档结构**:涵盖从基础安装到高级功能(如 OCR、注释、图形绘制等)的详细说明。 - **资源支持**:提供嵌入文件、注释、图形绘制、PDF 生成等多种功能,支持多种 PDF 版本和格式。 #### 4. 其他改进 - **低级接口**:新增 `ImageProperties()` 和 `Document.is_stream()` 等低级函数,增强对图像和 PDF 对象的分析能力。 - **文本提取**:改进了文本提取功能,支持更多格式(如 Markdown)的输出。 - **图形与形状**:支持更多图形绘制方式,包括矩形、四边形、多边形等,改进了线条端点和连接样式。 #### 5. 兼容性与限制 - **兼容性**:支持多种 PDF 版本和文件格式,但嵌入文件功能不支持与 MuPDF 的 `mutool` 完全兼容。 - **限制**:部分高级功能(如 XML 元数据提取)需要额外处理。 --- ### 总结 PyMuPDF 1.24.2 版本在功能、性能和兼容性方面均有显著提升,新增了对 CJK 字体、嵌入文件、四边形绘制和命令行工具的支持,并修复了多个关键问题,适用于 PDF 处理、文本提取、图像插入和文档生成等多种场景。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 558 页请下载阅读 -
文档评分
请文明评论,理性发言.