前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >pandas中的drop函数_pandas replace函数

pandas中的drop函数_pandas replace函数

作者头像
全栈程序员站长
发布2022-10-02 10:07:37
发布2022-10-02 10:07:37
1.6K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

dropna()函数的作用是去除读入的数据中(DataFrame)含有NaN的行。 如下:

代码语言:javascript
代码运行次数:0
运行
复制
>>> df = pd.DataFrame({ 
   "name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
>>> df
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

使用 dropna() 效果:

代码语言:javascript
代码运行次数:0
运行
复制
>>> df.dropna()
     name        toy       born
1  Batman  Batmobile 1940-04-25

注意:

在代码中要保存对原数据的修改,需要添加 inplace 参数 ,inplace=True 表示直接在原数据上更改

代码语言:javascript
代码运行次数:0
运行
复制
df.dropna(inplace=True)

例:

代码语言:javascript
代码运行次数:0
运行
复制
dfs = pd.read_excel(path, sheet_name='Sheet1',index_col='seq')  

dfs.dropna(inplace=True) #去除包含NaN 的行

print(dfs)#若不用inplace=True,此处 dfs 结果仍包含NaN

dropna 参数:

  1. axis: default 0指行,1为列
  2. how: {‘any’, ‘all’}, default ‘any’指带缺失值的所有行;’all’指清除全是缺失值的
  3. thresh: int,保留含有int个非空值的行
  4. subset: 对特定的列进行缺失值删除处理
  5. inplace: 这个很常见,True表示直接在原数据上更改

参考

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/192268.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年9月18日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档