pdf文档 pandas: powerful Python data analysis toolkit - 1.3.2

14.01 MB 3509 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
文档记录了pandas不同版本的更新日志,涵盖了新功能、性能改进、API更改、兼容性变更以及错误修复。各版本更新内容包括数据结构优化、数据操作增强、绘图功能扩展、错误修复及性能提升。同时,文档还提到了向后兼容性问题、弃用功能和新功能的引入,以及对Python版本的支持情况。
AI总结
以下是对文档内容的总结,按文档结构和内容层次梳理,突出核心观点和关键信息: --- ### **pandas 1.3.2 发布说明** **发布日期**:2021年8月15日 **版本**:1.3.2 #### **主要更新内容** 1. **功能增强** - 支持间隔索引(IntervalIndex)。 - 提供更多样化的数据操作和分析功能。 2. **向后兼容性改变** - HDF5格式的兼容性问题:创建于pandas < 0.13.0版本的HDF5格式可能存在不兼容性。 - 对索引类型的映射和访问方式进行了调整: - `Map on Index types` 现在返回其他索引类型。 - 访问datetime字段的索引现在返回索引本身。 - 其他更改: - `pd.unique` 与扩展类型的一致性改进。 - 部分字符串索引、浮点类型拼接的自动提升类型等功能的调整。 - `GroupBy.describe` 的格式化改进。 - 窗口二元相关协方差操作返回MultiIndex DataFrame。 3. **性能改进** - 内存使用更加准确,尤其是对索引的优化。 4. **错误修复** - 涉及数据转换、索引、IO、绘图等多个方面的bug修复。 5. **库重组织与开发变更** - 模块的私有性改变,包括`pandas.errors`、`pandas.testing`、`pandas.plotting`等模块。 - 其他开发相关更改。 6. **弃用与移除** - 弃用了`.ix`、`Panel`、`groupby.agg()`的字典重命名、`.plotting`等功能。 - 移除了之前版本中弃用的功能和更改。 --- ### **其他版本更新亮点** #### **0.23.2 版本(2018年7月5日)** - **功能改进**: - DataFrame.all()和DataFrame.any()支持axis=None,进行全局逻辑运算。 - 修复与NumPy 1.15兼容性问题。 - **向后兼容性**:这是第一个支持Python 3.7的版本。 #### **0.25.3 版本(2019年10月31日)** - **错误修复**: - 修复了GroupBy、resample、rolling等功能中的bug。 #### **0.25.2 版本(2019年10月15日)** - **兼容性改进**: - 添加对Python 3.8的兼容性支持。 - **错误修复**: - 修复了DataFrame.reindex()、RangeIndex.get_indexer()等功能中的回归问题。 - 修复了to_csv()和IntervalIndex相关的错误。 #### **0.11.0 版本(2013年4月22日)** - **功能提升**: - 引入了基于标签的多轴索引(`.loc`和`.iloc`)。 - 数据选择功能增强。 - 支持更丰富的dtype操作。 -新增“10 Minutes to Pandas”和“Cookbook”文档。 - **重要API更改**: - `.loc`严格基于标签索引,未找到项时会引发KeyError。 - 支持三种多轴索引方式:单标签、标签列表、标签切片。 --- ### **总结** 本文档详细记录了pandas不同版本的更新内容,包括功能增强、API更改、性能优化、bug修复以及其他开发相关变更。每个版本均围绕提升数据分析效率和用户体验进行改进,同时兼顾了与新旧版本的兼容性问题。更新内容涵盖了索引、数据操作、绘图、输入输出等核心功能模块,为用户提供了更加强大和灵活的数据分析工具。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 3502 页请下载阅读 -
文档评分
请文明评论,理性发言.