Scrapy 0.14 Documentation
0 码力 | 179 页 | 861.70 KB | 2 年前该文档是Scrapy 0.14版本的官方文档,主要介绍了Scrapy框架的核心组件、功能和使用方法。文档详细列出了Scrapy的各个模块(如scrapy.contrib.spiders、scrapy.contrib.downloadermiddleware等),并提供了关于Scrapy设置(settings)、命令行工具(如crawl、runspider)以及扩展功能(如图片管道、统计邮件等)的详细信息。文档还涵盖了如何配置Scrapy项目、使用Spider中间件和下载中间件等重要内容。
Scrapy 0.20 Documentation
0 码力 | 197 页 | 917.28 KB | 2 年前文档主要介绍了Scrapy 0.20版本的更新内容,包括新功能、改进和弃用功能。主要更新包括:移除了Signals和Stats Collector单例,改为通过Crawler的属性访问;lxml成为默认的XPath选择器后端;支持JSON和JSONLines导出嵌套项;新增了 REFERER_ENABLED 设置;默认用户代理变更;移除了对Python 2.5和Twisted 2.5的支持;新增了Stackless扩展功能;优化了日志记录和资源使用;改进了爬虫管理器和请求处理机制。
Scrapy 0.22 Documentation
0 码力 | 199 页 | 926.97 KB | 2 年前文档详细介绍了Scrapy 0.22版本的发行内容,包括新增功能、改进、弃用功能及API变化。主要更新包括引入Spider Contracts机制、新增自动节流扩展、优化文档结构、改进编码检测、增强反向代理支持等。同时,文档还列出了多个新设置选项和模块调整。
Scrapy 2.4 Documentation
0 码力 | 354 页 | 1.39 MB | 2 年前文档主要介绍了Scrapy 2.4版本的更新内容,包括Selector API的改进,如使用.get()和.getall()方法替代.extract_first()和.extract(),引入了Selector.attrib和SelectorList.attrib属性。此外,文档还提到了Telnet控制台现在需要用户名和密码进行访问,以提高安全性。Scrapy 2.4还新增了扩展功能,如from_crawler支持 feed exporters 和 feed storages,允许访问Scrapy设置。文档还涵盖了其他增强功能,如新的SitemapSpider sitemap_filter()方法,Lazy loading of Downloader Handlers的可选性,以及多项bug修复和性能改进。
Scrapy 2.5 Documentation
0 码力 | 366 页 | 1.56 MB | 2 年前文档介绍了Scrapy 2.5.1版本的更新内容,包括Selector API的改进、Telnet控制台的安全性增强、Crawler API的功能扩展以及新引入的扩展性功能。文档还提到了parsel库的升级、弃用代码的清理以及对旧模块的兼容性调整。主要内容涵盖新功能、API变更、性能优化和安全性改进。
Scrapy 1.3 Documentation
0 码力 | 272 页 | 1.11 MB | 2 年前文档详细记录了Scrapy框架在不同版本中的更新内容,包括错误修复、功能改进、文档更新以及新增功能。主要涵盖了下载延迟的处理、日志记录的优化、图像管道错误处理的改进、文档主题的扩展,以及对旧版本的兼容性调整。文档还提到了一些模块的重构和新功能的添加,如ChunkedTransferMiddleware的引入和对Boto 2.0的支持。
Scrapy 1.4 Documentation
0 码力 | 281 页 | 1.15 MB | 2 年前文档详细介绍了Scrapy 1.4版本的更新内容,包括新功能、API变化、命令行工具改进以及已知问题的修复。主要更新包括支持返回字典、日志记录重构、新增中间件和管道功能、请求处理优化等。文档还提供了详细的设置参数和模块参考,帮助用户更好地理解和使用Scrapy框架。
Scrapy 2.8 Documentation
0 码力 | 405 页 | 1.69 MB | 2 年前文档详细介绍了Scrapy框架的架构、组件及其交互关系,涵盖了数据流、扩展组件、解决特定问题的方法以及命令行工具的使用。文档还包括了Scrapy的版本更新日志,涉及新功能、 SECURITY更新和BUG修复。Scrapy支持通过命令行工具执行多种操作,如配置设置、运行Spider、benchmarks测试等。同时,文档提供了从抓取动态内容到处理文件和图片的实用指南,帮助开发者高效使用Scrapy进行数据抓取。其2.8.0版本新增了对Python 3.11的支持,并默认启用了Asyncio支持。
Scrapy 1.0 Documentation
0 码力 | 244 页 | 1.05 MB | 2 年前文档详细记录了Scrapy 1.0版本的更新内容,包括新功能的添加、性能的优化、兼容性的调整以及问题的修复。主要内容涵盖:支持AJAX可爬取URL、新增持久化爬虫调度器、支持分块传输编码、添加对Boto 2.0的支持、默认选择器从libxml2切换到lxml、移除对Python 2.5和Twisted 2.5的支持、改进统计收集模块、重构信号和状态收集机制等。文档还列出了多项API更改、新功能和增强功能,以及如何配置和使用Scrapy。
Scrapy 1.7 Documentation
0 码力 | 306 页 | 1.23 MB | 2 年前Scrapy 1.7文档介绍了版本更新、新功能和改进。主要包括对Python 2支持的结束,Python 3兼容性,新的信号系统,返回字典支持,Selector API改进,Telnet控制台安全性增强,扩展性功能如from_crawler支持,版本更新和弃用API等。
共 31 条
- 1
- 2
- 3
- 4













