pdf文档 Scrapy 1.6 Documentation

1.18 MB 295 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
文档详细介绍了Scrapy 1.6.0版本的更新内容,包括改善的Windows支持、Python 3.7兼容性、文档改进以及API更换。该版本还引入了新的项错误和请求信号,增强了扩展性,并对deprecated代码进行了清理。更新还涉及feed exports、FilePipeline和MediaPipeline的改进,以及安全性和测试的增强。此外,Selector API的更换是与parsel库更新相关,推荐使用.get()和.getall()方法以提高代码简洁性和可读性。
AI总结
以下是对《Scrapy 1.6 Documentation》的核心内容进行的总结,重点突出主要改进和关键信息: --- ### **Scrapy 1.6.0 发布说明(2019-01-30)** #### **发布亮点** 1. **更好的 Windows 支持**:所有 Scrapy 测试现在可以在 Windows 上通过。 2. **Python 3.7 兼容性**。 3. **文档改进**: - 从 `.extract_first()` 和 `.extract()` API 切换到 `.get()` 和 `.getall()` API,代码更简洁易读。 4. **扩展性改进**: - 引入 `item_error` 和 `request_reached_downloader` 信号。 - `from_crawler` 支持 feed exporters、feed storages 和 dupefilters。 5. **其他改进**: - 清理了 deprecated code。 - 多项 bug 修复和小功能改进。 #### **Selector API 更改** - Scrapy 现在依赖 `parsel >= 1.5`,并更新了文档以适应新的 API 规范。 - 推荐使用 `.get()` 和 `.getall()` 方法替代 `.extract_first()` 和 `.extract()`。 #### **已废弃功能移除** 1. 兼容性 shim for pre-1.0 Scrapy 模块名: - `scrapy.command` - `scrapy.contrib`(及其子模块) - `scrapy.contrib_exp`(及其子模块) - `scrapy.dupefilter` - `scrapy.linkextractor` - `scrapy.project` - `scrapy.spider` - `scrapy.spidermanager` - `scrapy.squeue` - `scrapy.stats` - `scrapy.statscol` - `scrapy.utils.decorator` 2. 其他 deprecated 功能: - `scrapy.interfaces.ISpiderManager` 被移除,建议使用 `scrapy.interfaces.ISpiderLoader`。 - `CrawlerSettings` 类被移除。 - `Settings.overrides` 和 `Settings.defaults` 属性被移除。 #### **其他改进与清理** 1. **测试与 CI**: - Scrapy 测试套件现在在 Windows 环境中执行。 - 多项测试和 CI 修复。 2. **代码优化**: - `scrapy.http.cookies.CookieJar.clear` 支持 “domain”、“path” 和 “name” 可选参数。 - 使用 `collections.deque` 替代 list 存储 MiddlewareManager 方法。 3. **代码风格**: - 多项代码风格修复和优化。 - 移除了不必要的 `.strip()` 调用。 --- 以上是 Scrapy 1.6.0 版本的主要更新内容,涵盖了功能增强、API 更改、deprecated 功能移除及代码优化等方面。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 288 页请下载阅读 -
文档评分
请文明评论,理性发言.