pandas: powerful Python data analysis toolkit - 1.2.3
12.74 MB
3323 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
文档介绍了pandas库的版本更新情况,涵盖了1.2.3版本的发布说明,包括API变更、版本更新、性能改进和错误修复等。文档还提到了向后兼容的重要更改,例如对旧版本的不兼容以及某些功能的弃用。此外,文档详细说明了pandas的功能特性,如数据操作、文件读写、数据分析方法,以及向新手提供的安装指南和学习资源。 | ||
AI总结 | ||
《pandas: powerful Python data analysis toolkit - 1.2.3》文档内容总结:
### 主要内容概述
本文档主要介绍了pandas库版本1.2.3的发布说明,包括新功能、性能改进、Bug修复以及向后兼容性相关的变更。以下是核心内容的总结:
---
### 1. **版本更新与变更**
#### **1.1 功能增强与改进**
- **新功能**:
- 支持`CategoricalIndex`,即基于类别的索引。
- 新增`sample`方法,用于从Series、DataFrame和Panel中随机抽样。
- 提供了“Merge, join, and concatenate”功能的新文档,包括图解示例。
- 优化了字符串操作相关的`.str`访问器。
- 支持`BusinessHour`时间偏移。
- 默认索引打印格式更改为更统一的形式。
- 提供了如何为pandas贡献代码的新指南。
- **性能改进**:
- 提升了`fillna`在DataFrame上的性能。
- 优化了内存使用,尤其是Index的内存占用更为准确。
#### **1.2 向后兼容性变更**
- **不兼容变更**:
- 对于使用旧版本(<0.13.0)创建的HDF5格式,可能存在不兼容问题。
- `.ix`和`Panel`被弃用。
- `pandas.io.data`子包在0.17.0版本后移除。
- `pd.unique`与扩展类型的行为一致。
- `GroupBy.agg()`使用字典重命名参数已弃用。
- **其他变更**:
- 关系型数据库样式的索引运算现在返回更一致的类型。
- 紧急修改了部分与`IntervalIndex`相关的功能。
---
### 2. **功能移除与弃用**
- **功能移除**:
- 移除了之前版本中已弃用的功能。
- `pandas.core.common`模块已移除。
- **功能弃用**:
- `Panel`数据结构已弃用。
- 使用字典重命名的`GroupBy.agg()`方法已弃用。
- `plotting`模块相关功能已部分弃用。
---
### 3. **开发与社区**
- **贡献**:
- 提供了详细的“如何为pandas贡献代码”的指南,包括文档更新、代码标准和开发环境搭建等内容。
- 本次发布包含多名贡献者的代码提交,包括新贡献者。
- **性能优化**:
- 优化了多个核心模块的性能,包括数据输入输出、索引操作和绘图功能。
---
### 4. **其他重要信息**
- **安装指南**:
- 推荐通过Anaconda或Miniconda安装pandas。
- 支持使用`pip`从PyPI安装。
- **文档改进**:
- 提供了更详细的教程和快速入门指南,包括10分钟上手pandas和社区贡献的教程。
- **技术支持**:
- 提供了多种数据格式(如CSV、Excel、SQL、JSON等)的读写支持。
- 提供了对时间序列数据的全面支持,包括日期、时间和时间索引数据的操作工具。
---
### 总结
本版本更新重点在于性能优化、功能增强以及向后兼容性调整,新增了多项实用功能(如`CategoricalIndex`、`sample`方法等),同时移除了部分旧功能。用户在升级时需注意可能的不兼容性问题。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
3316 页请下载阅读 -
文档评分