搜索

epub文档 Scrapy 1.6 Documentation

581.88 KB 374 页 0 下载 75 浏览 0 评论 0 收藏
语言 格式 评分
英语
.epub
3
摘要
文档主要介绍了Scrapy 1.6版本的更新内容,包括对Windows更好的支持、Python 3.7的兼容性、文档的重大改进,以及Selector API的变化。文档还提到了Telnet控制台的安全性改进,修复了一些已知问题,并添加了新的功能。例如,Selector API现在推荐使用.get()和.getall()方法,替代了以前的.extract_first()和.extract()方法。此外,文档还详细说明了如何安装、使用Scrapy以及如何编写爬虫。
AI总结
# Scrapy 1.6 文档总结 ## 1. 获取帮助 - 查看常见问题解答(FAQ)。 - 使用索引或模块索引查找特定信息。 - 在 StackOverflow 和 Reddit 的 Scrapy 标签下提问。 - 在 Scrapy 用户邮件列表和 IRC 频道中寻求帮助。 - 在问题跟踪器中报告 bug。 ## 2. 安装指南 - 安装 Scrapy 以开始使用。 ## 3. 新功能与改进 ### 3.1 主要亮点 - **更好的 Windows 支持**:提升在 Windows 系统上的兼容性。 - **Python 3.7 兼容性**:支持最新的 Python 版本。 - **文档改进**:优化了 .extract_first() 和 .extract() API,推荐使用 .get() 和 .getall()。 - **导出与管道改进**:提升文件导出和媒体管道的功能。 - **扩展性增强**:新增了错误处理信号和扩展功能。 ### 3.2 Selector API 变化 - **parsel 库升级**:Scrapy 现在依赖于 parsel 1.5+。 - **新方法**:推荐使用 .get() 和 .getall() 替代 .extract_first() 和 .extract()。 - **属性访问**:新增 Selector.attrib 和 SelectorList.attrib 属性,方便获取 HTML 属性。 - **缓存优化**:CSS 选择器在多次使用时更高效。 ### 3.3 Telnet 控制台 - **安全性改进**:Telnet 现在需要用户名和密码,修复了安全漏洞。 ### 3.4 新增功能 - **扩展性增强**:新增了 feed exporters、feed storages 和 dupefilters 的扩展支持。 - **合同功能**:修复和新增了 scrapy.contracts 的功能。 - **日志改进**:修复了多个与日志相关的问题。 ## 4. 其他版本更新 - **1.0.7**:修复了对 Twisted 的支持。 - **1.0.6**:修复了重试中间件和文件存储功能。 - **1.0.5**:修复了链接提取器和文档问题。 - **1.0.4**:修复了构建和文档问题。 ## 5. 编译文档 - 使用 Sphinx 编译文档:`pip install -r requirements.txt`。 - 生成 HTML 文档:`make html`。 - 查看文档:`make htmlview`。 - 清理生成文件:`make clean`。 ## 6. 快速上手指南 - 安装 Scrapy。 - 遵循教程创建第一个项目。 - 使用命令行工具管理项目。 ## 7. 总结 Scrapy 1.6 提供了更好的兼容性、扩展性和安全性,同时优化了文档和开发体验。开发者应关注 Selector API 的变化和 Telnet 控制台的安全性改进,以充分利用新功能。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 367 页请下载阅读 -
文档评分
请文明评论,理性发言.