搜索

epub文档 Scrapy 2.11.1 Documentation

706.01 KB 528 页 0 下载 103 浏览 0 评论 0 收藏
语言 格式 评分
英语
.epub
3
摘要
文档主要介绍了Scrapy 2.11.1及其后续版本的更新内容,包括新功能的引入、bug的修复、测试基线的变化以及对依赖项的更新。文档详细列出了每个版本的发布日期、主要改进、功能增强以及与之前版本的兼容性问题。同时,文档还提到了对Python和Twisted等依赖项的最低版本要求,以及对测试环境的调整。
AI总结
以下是文档内容的中文总结: --- ### Scrapy 2.11.1 文档总结 #### 主要更新与改进 1. **版本兼容性与测试要求** - Scrapy 的最低要求基线已从 Ubuntu 12.04 变更为 Debian 8 "Jessie"。 - 连续集成测试使用以下最低版本的依赖包:Twisted 14.0、pyOpenSSL 0.14、lxml 3.4。 - Scrapy 可能与更旧版本的依赖包兼容,但不再保证。 2. **新功能** - **Python 3.12 支持**:新增对 Python 3.12 的支持,同时弃用 Python 3.7。 - **加 ons 框架**:新增加 ons 框架,简化第三方组件的配置。 - **异常重试配置**:支持配置可重试的异常。 - **文件存储增强**: - 新增对 Google Cloud Storage 的 ACL 支持(FILES_STORE_GCS_ACL 和 IMAGES_STORE_GCS_ACL)。 - 新增 AWS ENDPOINT URL、AWS USE SSL、AWS VERIFY 和 AWS REGION NAME 等选项,支持自定义或私有云存储。 - **Feed 导出改进**:修复了多个与 Feed 导出相关的 bug,并优化了导出功能。 3. **日志与文档** - **StreamLogger 的 flush() 方法**:修复了 StreamLogger 中的 flush() 方法,避免日志警告。 - **文档更新**: - 新增 Scrapy 架构图和 Response 参数文档。 - 修正了 README 中下载统计徽章的显示问题。 - 更新了与随机下载延迟相关的描述。 - 新增 StackOverflow 作为支持渠道。 4. **Bug 修复** - **兼容性问题**:修复了 FilesPipeline 和 ImagesPipeline 的类属性兼容性问题。 - **下载中间件**:修复了 HEAD 请求的解压问题。 - **URL 标准化**:修复了 URL 标准化过程中的错误。 - **证书验证**:修复了 SSL 证书验证中的异常处理问题。 5. **弃用与移除** - 移除了 deprecated 的 `CrawlerRunner.spiders` 属性,建议使用 `CrawlerRunner.spider_loader` 替代。 - 移除了 `scrapy.utils.reqser` 模块和其他 deprecated 的类。 - 移除了部分 deprecated 的 API 和方法。 6. **其他改进** - **telnet 控制台**:新增了用户名和密码的安全验证。 - **信号与扩展**:新增了 `item_error` 和 `request_reached_downloader` 等信号,增强了扩展性。 - **测试与质量保障**:优化了测试用例和依赖管理。 --- ### 注意事项 - 如果使用 Scrapy Cloud 且旧版本的 Scrapy,请确保项目要求包含 `scrapinghub-entrypoint-scrapy >= 0.14.1`。 - Python 3.7 已被移除支持,建议升级到 Python 3.10 或更高版本。 --- 总结:Scrapy 2.11.1 版本在兼容性、功能增强、性能优化和文档改进方面均有显著提升,特别在 Python 3 支持和文件存储方面表现突出。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 521 页请下载阅读 -
文档评分
请文明评论,理性发言.