pdf文档 pandas: powerful Python data analysis toolkit - 1.2.3

12.74 MB 3323 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
文档介绍了pandas库的版本更新情况,涵盖了1.2.3版本的发布说明,包括API变更、版本更新、性能改进和错误修复等。文档还提到了向后兼容的重要更改,例如对旧版本的不兼容以及某些功能的弃用。此外,文档详细说明了pandas的功能特性,如数据操作、文件读写、数据分析方法,以及向新手提供的安装指南和学习资源。
AI总结
《pandas: powerful Python data analysis toolkit - 1.2.3》文档内容总结: ### 主要内容概述 本文档主要介绍了pandas库版本1.2.3的发布说明,包括新功能、性能改进、Bug修复以及向后兼容性相关的变更。以下是核心内容的总结: --- ### 1. **版本更新与变更** #### **1.1 功能增强与改进** - **新功能**: - 支持`CategoricalIndex`,即基于类别的索引。 - 新增`sample`方法,用于从Series、DataFrame和Panel中随机抽样。 - 提供了“Merge, join, and concatenate”功能的新文档,包括图解示例。 - 优化了字符串操作相关的`.str`访问器。 - 支持`BusinessHour`时间偏移。 - 默认索引打印格式更改为更统一的形式。 - 提供了如何为pandas贡献代码的新指南。 - **性能改进**: - 提升了`fillna`在DataFrame上的性能。 - 优化了内存使用,尤其是Index的内存占用更为准确。 #### **1.2 向后兼容性变更** - **不兼容变更**: - 对于使用旧版本(<0.13.0)创建的HDF5格式,可能存在不兼容问题。 - `.ix`和`Panel`被弃用。 - `pandas.io.data`子包在0.17.0版本后移除。 - `pd.unique`与扩展类型的行为一致。 - `GroupBy.agg()`使用字典重命名参数已弃用。 - **其他变更**: - 关系型数据库样式的索引运算现在返回更一致的类型。 - 紧急修改了部分与`IntervalIndex`相关的功能。 --- ### 2. **功能移除与弃用** - **功能移除**: - 移除了之前版本中已弃用的功能。 - `pandas.core.common`模块已移除。 - **功能弃用**: - `Panel`数据结构已弃用。 - 使用字典重命名的`GroupBy.agg()`方法已弃用。 - `plotting`模块相关功能已部分弃用。 --- ### 3. **开发与社区** - **贡献**: - 提供了详细的“如何为pandas贡献代码”的指南,包括文档更新、代码标准和开发环境搭建等内容。 - 本次发布包含多名贡献者的代码提交,包括新贡献者。 - **性能优化**: - 优化了多个核心模块的性能,包括数据输入输出、索引操作和绘图功能。 --- ### 4. **其他重要信息** - **安装指南**: - 推荐通过Anaconda或Miniconda安装pandas。 - 支持使用`pip`从PyPI安装。 - **文档改进**: - 提供了更详细的教程和快速入门指南,包括10分钟上手pandas和社区贡献的教程。 - **技术支持**: - 提供了多种数据格式(如CSV、Excel、SQL、JSON等)的读写支持。 - 提供了对时间序列数据的全面支持,包括日期、时间和时间索引数据的操作工具。 --- ### 总结 本版本更新重点在于性能优化、功能增强以及向后兼容性调整,新增了多项实用功能(如`CategoricalIndex`、`sample`方法等),同时移除了部分旧功能。用户在升级时需注意可能的不兼容性问题。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 3316 页请下载阅读 -
文档评分
请文明评论,理性发言.