
第二章 Series
Pandas 的 Series 是其最基础、最核心的一维数据结构,是学习 Pandas 的起点。本文从定义、特点、创建方式、常用操作、注意事项等方面进行系统而详细的介绍。
Series 是一个带标签索引的一维数组,由两部分组成:
ndarray),支持整数、浮点、字符串、布尔值等任意类型,也可包含缺失值 NaN。✅ 简单理解:Series = 字典 + 数组像字典一样可通过“键”(索引)快速访问值; 像数组一样支持向量化运算和高效数值计算。
特性 | 说明 |
|---|---|
一维结构 | 只有一列数据 |
自动对齐 | 运算时按索引对齐,不匹配的位置返回 |
支持缺失值 | 使用 |
可命名 | 可通过 |
索引可重复 | 允许重复索引(但会影响唯一访问) |
不可变大小(默认) | 创建后长度固定,但可通过 |
import pandas as pd
import numpy as np
# 列表(默认整数索引)
s1 = pd.Series([10, 20, 30])
# 自定义索引
s2 = pd.Series([10, 20, 30], index=['a', 'b', 'c'], name='成绩')
# 从 NumPy 数组
arr = np.array([1.1, 2.2, 3.3])
s3 = pd.Series(arr, index=['x', 'y', 'z'])
data_dict = {'数学': 90, '语文': 85, '英语': 95}
s4 = pd.Series(data_dict) # 字典的 key → index,value → data
# 若指定 index 中有字典未包含的键,则对应值为 NaN
s5 = pd.Series(data_dict, index=['数学', '物理'])
# 输出:数学 90.0,物理 NaN(注意 dtype 变为 float64)
s6 = pd.Series(5, index=['A', 'B', 'C'])
# 所有位置都填充为 5
# A 5
# B 5
# C 5
empty_s = pd.Series(dtype='float64') # 必须指定 dtype属性/方法 | 说明 | 示例 |
|---|---|---|
| 获取索引 |
|
| 获取数据(NumPy 数组) |
|
| 获取或设置名称 |
|
| 数据类型 |
|
| 形状(如 |
|
| 元素总数 |
|
| 判断是否为 NaN |
|
| 返回唯一值 |
|
| 统计各值出现次数 |
|
| 描述性统计(均值、标准差等) |
|
| 按值排序 |
|
| 按索引排序 |
|
| 类型转换 |
|
| 转为 Python 列表 |
|
| 转为 DataFrame |
|
s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s['a'] # 标签索引 → 1
s[0] # 位置索引 → 1(不推荐,易混淆)
s.loc['a'] # 显式索引(推荐)
s.iloc[0] # 隐式位置索引(推荐用于位置访问)s['a':'c'] # 显式切片 → 包含 'c'(前闭后闭)
s.iloc[0:2] # 隐式切片 → 不包含索引 2(前闭后开)s['b'] = 20 # 修改
s['e'] = 5 # 新增(自动扩展)
del s['a'] # 删除(原地修改)
s_new = s.drop('c') # 返回新 Series,不修改原对象s * 2 # 所有元素 ×2
s[s > 3] # 布尔索引:筛选值大于 3 的元素
np.sqrt(s) # 应用 NumPy 函数NaN: s1 = pd.Series([1, 2], index=['a', 'b'])
s2 = pd.Series([3, 4], index=['b', 'c'])
print(s1 + s2)
# a NaN
# b 6.0
# c NaNNaN != NaN,不能用 == 判断,应使用 isnull() 或 pd.isna()NaN 的 Series,dtype 通常为 float64s['key'] 返回多个值(Series 而非标量).loc / .iloc 提高代码可读性和安全性Series 是 Pandas 的基石:它融合了数组的高效计算与字典的灵活索引; 是构建 DataFrame 的基本单元(DataFrame 的每一列就是一个 Series); 掌握 Series,就掌握了 Pandas 数据操作的核心逻辑。
python过渡项目部分代码已经上传至gitee,后续会逐步更新。
公众号:咚咚王
《Python编程:从入门到实践》
《利用Python进行数据分析》
《算法导论中文第三版》
《概率论与数理统计(第四版) (盛骤) 》
《程序员的数学》
《线性代数应该这样学第3版》
《微积分和数学分析引论》
《(西瓜书)周志华-机器学习》
《TensorFlow机器学习实战指南》
《Sklearn与TensorFlow机器学习实用指南》
《模式识别(第四版)》
《深度学习 deep learning》伊恩·古德费洛著 花书
《Python深度学习第二版(中文版)【纯文本】 (登封大数据 (Francois Choliet)) (Z-Library)》
《深入浅出神经网络与深度学习+(迈克尔·尼尔森(Michael+Nielsen)》
《自然语言处理综论 第2版》
《Natural-Language-Processing-with-PyTorch》
《计算机视觉-算法与应用(中文版)》
《Learning OpenCV 4》
《AIGC:智能创作时代》杜雨+&+张孜铭
《AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型》
《从零构建大语言模型(中文版)》
《实战AI大模型》
《AI 3.0》
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。