pandas: powerful Python data analysis toolkit - 1.3.2
14.01 MB
3509 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
文档记录了pandas不同版本的更新日志,涵盖了新功能、性能改进、API更改、兼容性变更以及错误修复。各版本更新内容包括数据结构优化、数据操作增强、绘图功能扩展、错误修复及性能提升。同时,文档还提到了向后兼容性问题、弃用功能和新功能的引入,以及对Python版本的支持情况。 | ||
AI总结 | ||
以下是对文档内容的总结,按文档结构和内容层次梳理,突出核心观点和关键信息:
---
### **pandas 1.3.2 发布说明**
**发布日期**:2021年8月15日
**版本**:1.3.2
#### **主要更新内容**
1. **功能增强**
- 支持间隔索引(IntervalIndex)。
- 提供更多样化的数据操作和分析功能。
2. **向后兼容性改变**
- HDF5格式的兼容性问题:创建于pandas < 0.13.0版本的HDF5格式可能存在不兼容性。
- 对索引类型的映射和访问方式进行了调整:
- `Map on Index types` 现在返回其他索引类型。
- 访问datetime字段的索引现在返回索引本身。
- 其他更改:
- `pd.unique` 与扩展类型的一致性改进。
- 部分字符串索引、浮点类型拼接的自动提升类型等功能的调整。
- `GroupBy.describe` 的格式化改进。
- 窗口二元相关协方差操作返回MultiIndex DataFrame。
3. **性能改进**
- 内存使用更加准确,尤其是对索引的优化。
4. **错误修复**
- 涉及数据转换、索引、IO、绘图等多个方面的bug修复。
5. **库重组织与开发变更**
- 模块的私有性改变,包括`pandas.errors`、`pandas.testing`、`pandas.plotting`等模块。
- 其他开发相关更改。
6. **弃用与移除**
- 弃用了`.ix`、`Panel`、`groupby.agg()`的字典重命名、`.plotting`等功能。
- 移除了之前版本中弃用的功能和更改。
---
### **其他版本更新亮点**
#### **0.23.2 版本(2018年7月5日)**
- **功能改进**:
- DataFrame.all()和DataFrame.any()支持axis=None,进行全局逻辑运算。
- 修复与NumPy 1.15兼容性问题。
- **向后兼容性**:这是第一个支持Python 3.7的版本。
#### **0.25.3 版本(2019年10月31日)**
- **错误修复**:
- 修复了GroupBy、resample、rolling等功能中的bug。
#### **0.25.2 版本(2019年10月15日)**
- **兼容性改进**:
- 添加对Python 3.8的兼容性支持。
- **错误修复**:
- 修复了DataFrame.reindex()、RangeIndex.get_indexer()等功能中的回归问题。
- 修复了to_csv()和IntervalIndex相关的错误。
#### **0.11.0 版本(2013年4月22日)**
- **功能提升**:
- 引入了基于标签的多轴索引(`.loc`和`.iloc`)。
- 数据选择功能增强。
- 支持更丰富的dtype操作。
-新增“10 Minutes to Pandas”和“Cookbook”文档。
- **重要API更改**:
- `.loc`严格基于标签索引,未找到项时会引发KeyError。
- 支持三种多轴索引方式:单标签、标签列表、标签切片。
---
### **总结**
本文档详细记录了pandas不同版本的更新内容,包括功能增强、API更改、性能优化、bug修复以及其他开发相关变更。每个版本均围绕提升数据分析效率和用户体验进行改进,同时兼顾了与新旧版本的兼容性问题。更新内容涵盖了索引、数据操作、绘图、输入输出等核心功能模块,为用户提供了更加强大和灵活的数据分析工具。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
3502 页请下载阅读 -
文档评分