pdf文档 pandas: powerful Python data analysis toolkit - 1.0

10.16 MB 3091 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
文档主要介绍了pandas不同版本的发布说明,涵盖了新功能、性能改进、错误修复及其贡献者。版本0.21.1修复了与matplotlib的兼容性问题,并改进了Parquet IO功能;版本0.25.3修复了分组和重采样中的错误,并增加了对Python3.8的支持。此外,文档还展示了pandas的API参考,包括DataFrame和Series的绘图功能,如boxplot和barh图。通过这些发布,pandas不断优化其功能和性能,成为更强大的数据分析工具。
AI总结
以下是对文档内容的简要总结: 文档主要介绍了Pandas库的多个版本更新,重点包括新功能、改进、修复和贡献者信息。以下是核心内容的总结: ### 1. 版本更新概览 - **版本0.20.3及更早版本**:提到`es`的存在,但未具体说明。 - **版本0.21.1(2017年12月12日)**:这是一个补丁发布,主要包含小幅回归修复、错误修复和性能改进。亮点包括恢复Matplotlib datetime绘图功能和改进Parquet IO功能。 - **版本0.22**:未具体说明更新内容。 - **版本0.25.3(2019年10月31日)**:修复了DataFrameGroupBy.quantile()中的潜在段错误问题。 - **版本0.25.2(2019年10月15日)**:增加了对Python 3.8的兼容性,修复了索引、I/O和其他功能的回归问题。 - **版本0.17.1(2015年11月21日)**:新增了实验性的条件HTML格式化功能,并修复了DataFrame.drop_duplicates()的回归问题。 - **版本0.12.0(2013年7月24日)**:这是一个主要版本,包含了多个新功能和改进,例如统一的I/O API命名方案、支持读写HTML、STATA和JSON文件,以及改进的替换功能。 ### 2. 关键功能和改进 - **Parquet IO功能**:在0.21.0中引入,并在后续版本中不断改进。 - **条件HTML格式化**:作为实验性功能引入,支持通过HTML和CSS对DataFrame进行可视化样式设置。 - **性能优化**:多个版本中提到性能改进,尤其是在I/O操作和绘图功能方面。 - **Python 3.8兼容性**:在0.25.2版本中增加。 ### 3. 贡献者 每个版本的发布都列出了贡献者,包括新增贡献者(标记“+”)。例如: - **0.21.1**:Tom Augspurger。 - **0.25.3**:Will Ayd和William Ayd。 - **0.25.2**:多位贡献者,包括新增贡献者。 - **0.17.1**:包含多位贡献者,部分为首次贡献。 - **0.12.0**:包含多位贡献者,部分为首次贡献。 ### 4. 其他 - **API更改**:多个版本中提到API的调整和弃用,例如I/O API的统一。 - **Bug修复**:涵盖了索引、I/O、绘图、分组/重采样/滚动、中间λαμβ达数值数据处理等多个方面。 总结整体来看,Pandas通过多次版本迭代,不断提升性能、修复问题,并引入新功能,成为一个强大的Python数据分析工具。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 3084 页请下载阅读 -
文档评分
请文明评论,理性发言.