搜索

pdf文档 pandas: powerful Python data analysis toolkit - 0.19.1

12.06 MB 1943 页 1 下载 119 浏览 0 评论 0 收藏
语言 格式 评分
英语
.pdf
3
摘要
文档介绍了pandas 0.19.1版本,这是一个用于Python的数据分析工具包。pandas提供快速、灵活且表达力强的数据结构,旨在处理关系型或标签化数据。其主要数据结构包括Series(一维)和DataFrame(二维),适用于金融、统计、社会科学和工程领域。pandas擅长处理缺失数据、支持数据对齐、分组操作、数据合并与重塑、时间序列功能等。0.19.0版本新增了merge_asof()用于时间序列的近似连接,.rolling()支持时间序列感知,read_csv()支持直接解析分类数据,以及PeriodIndex的period dtype等。0.19.1是一个小型的bug修复版本,包含回归修复、错误修复和性能改进。
AI总结
pandas 0.19.1 是一个用于 Python 的数据分析工具包,发布于 2016 年 11 月 3 日。它提供快速、灵活、表达力强的数据结构,旨在简化关系型或带标签数据的处理,是 Python 中进行实际数据分析的基础工具。 **核心数据结构**:Series(一维)和 DataFrame(二维),可处理多种数据,包括异构列表数据、时间序列、带标签的矩阵数据等。 **主要功能**: - 轻松处理缺失数据 - 支持列插入和删除(大小可变) - 自动和显式的数据对齐 - 强大的分组、聚合和转换功能 - 智能的标签切片和子集选取 - 直观的数据合并与连接 - 灵活的数据重塑和数据透视 - 强大的 I/O 工具,支持 CSV、Excel、数据库及 HDF5 格式 - 时间序列专用功能,如日期生成、频率转换、滚动窗口统计等 **v0.19.1 版本亮点**: - 这是 0.19.0 的次要错误修复版本,包含回归修复、错误修复和性能改进 **v0.19.0 版本主要新功能**: - **merge_asof()**:支持时间序列的 asof 风格连接,匹配最近键而非相等键 - **.rolling() 时间序列感知**:滚动操作现在能感知时间序列 - **read_csv 改进**:支持直接解析分类数据(Categorical) - **Categorical 合并**:新增 union_categorical() 函数 - **PeriodIndex 改进**:拥有自己的 period dtype,与其他索引类更一致 - **稀疏数据结构增强**:支持 int 和 bool 类型 - **Series 比较操作**:不再忽略索引 - **开发 API**:引入 pandas 开发 API 用于实用函数 - **弃用**:Panel4D 和 PanelND 被弃用,推荐使用 xarray 包处理 n 维数据 - **移除**:移除已弃用的模块 pandas.io.data、pandas.io.wb、pandas.tools.rplot - **警告**:pandas >= 0.19.0 不再在导入时静默 numpy ufunc 警告 **API 变更**: - Series.tolist() 返回 Python 原生类型 - Series 运算符对不同索引的行为变更 - Series 类型在赋值时自动提升 - .to_datetime() 和 .describe() 变更 - Period 变更:PeriodIndex 使用 period dtype,Period('NaT') 返回 pd.NaT - Index +/- 不再用于集合操作 - Index.difference 和 .symmetric_difference 变更 - Index.unique 统一返回 Index - MultiIndex 构造函数、groupby 和 set_index 保留分类 dtype - read_csv 逐步枚举块 - 稀疏数据结构的 int64 和 bool 支持增强,运算符保留 dtype
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 1936 页请下载阅读 -
文档评分
请文明评论,理性发言.