前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >pandas处理缺失值的函数_pandas填充缺失值

pandas处理缺失值的函数_pandas填充缺失值

作者头像
全栈程序员站长
发布于 2022-09-30 13:21:55
发布于 2022-09-30 13:21:55
2.4K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.

官方函数说明:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
	Remove missing values.

	See the User Guide for more on which values are considered missing, 
	and how to work with missing data.

Returns
	DataFrame
	DataFrame with NA entries dropped from it.

参数说明:

Parameters

说明

axis

0为行 1为列,default 0,数据删除维度

how

{‘any’, ‘all’}, default ‘any’,any:删除带有nan的行;all:删除全为nan的行

thresh

int,保留至少 int 个非nan行

subset

list,在特定列缺失值处理

inplace

bool,是否修改源文件

测试:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df = pd.DataFrame({ 
   "name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

删除至少缺少一个元素的行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna()
     name        toy       born
1  Batman  Batmobile 1940-04-25

删除至少缺少一个元素的列:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna(axis=1)
       name
0    Alfred
1    Batman
2  Catwoman

删除所有元素丢失的行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna(how='all')
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

只保留至少2个非NA值的行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna(thresh=2)
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

从特定列中查找缺少的值:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna(subset=['name', 'born'])
       name        toy       born
1    Batman  Batmobile 1940-04-25

修改原数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>>df.dropna(inplace=True)
>>>df
     name        toy       born
1  Batman  Batmobile 1940-04-25

以上。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/192382.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年9月17日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
pandas 处理缺失值[dropna、drop、fillna][通俗易懂]
对于dropna和fillna,dataframe和series都有,在这主要讲datafame的
全栈程序员站长
2022/11/04
2.1K0
pandas系列3_缺失值处理和apply用法
缺失值:df中缺失值为nan或者naT(缺失时间),在S型数据中为none或者nan
皮大大
2021/03/02
1.4K0
pandas drop参数_pandas concat函数
DataFrame.dropna( axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
全栈程序员站长
2022/10/02
8040
pandas中的drop函数_pandas replace函数
dropna()函数的作用是去除读入的数据中(DataFrame)含有NaN的行。 如下:
全栈程序员站长
2022/10/02
1.8K0
python dropna()用法「建议收藏」
** DataFrme.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False) 参数: axis: 默认axis=0。0为按行删除,1为按列删除 how: 默认 ‘any’。 ‘any’指带缺失值的所有行/列;’all’指清除一整行/列都是缺失值的行/列 thresh: int,保留含有int个非nan值的行 subset: 删除特定列中包含缺失值的行或列 inplace: 默认False,即筛选后的数据存为副本,True表示直接在原数据上更改 例子: import numpy as np import pandas as pd df = pd.DataFrame(np.arange(24).reshape(4,6), index=[‘a’, ‘c’, ‘e’, ‘f’]) df.iloc[0,[1,2,5]]=np.nan df.iloc[2,[1,4]]=np.nan print(df) 结果:
全栈程序员站长
2022/10/02
4.8K0
python dropna()用法「建议收藏」
【数据准备和特征工程】数据清理
import pandas as pd df = pd.read_csv("test.csv") df.sample(10)
LoneRanger
2022/02/02
9500
Kaggle知识点:缺失值处理
在进行数据竞赛中,数据预处理阶段经常需要对数据进行缺失值处理。关于缺失值的处理并没有想象中的那么简单。以下为一些经验分享,基本涵盖了大部分处理方式。
Coggle数据科学
2022/05/05
2.2K0
Kaggle知识点:缺失值处理
Pandas入门操作
pandas中的一些入门操作 Pandas导入 import pandas as pd import numpy as np 创建DataFram # 手动穿件数据集 df = pd.DataFrame([ [1001,'Mike',20], [1002,'Bob',21], [1003,'Alice',22], ]) # 从磁盘导入数据集 df = pd.read_excel('c:/Users/58212/Desktop/house_info_00
俺也想起舞
2019/07/24
9150
Python中处理缺失值的2种方法
在上一篇文章中,我们分享了Python中查询缺失值的4种方法。查找到了缺失值,下一步便是对这些缺失值进行处理,今天同样会分享多个方法!
快学Python
2022/06/10
2.2K0
Python中处理缺失值的2种方法
机器学习基础:缺失值的处理技巧(附Python代码)
在数据分析和建模中,经常会遇到变量值缺失的情况,这是非常常见的。为了保证数据指标的完整性以及可利用性,通常我们会采取特殊的方式对其进行处理。
Python数据科学
2020/08/27
2.5K0
机器学习基础:缺失值的处理技巧(附Python代码)
机器学习基础:缺失值的处理技巧(附Python代码)
在数据分析和建模中,经常会遇到变量值缺失的情况,这是非常常见的。为了保证数据指标的完整性以及可利用性,通常我们会采取特殊的方式对其进行处理。
Ai学习的老章
2020/08/28
2.5K0
机器学习基础:缺失值的处理技巧(附Python代码)
手把手教你用pandas处理缺失值
导读:在进行数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。本文将讨论用于缺失值处理的工具。
IT阅读排行榜
2021/02/22
3K0
手把手教你用pandas处理缺失值
Pandas缺失值处理 | 轻松玩转Pandas(3)
# 导入相关库 import numpy as np import pandas as pd 什么是缺失值 在了解缺失值(也叫控制)如何处理之前,首先要知道的就是什么是缺失值?直观上理解,缺失值表示的是“缺失的数据”。 可以思考一个问题:是什么原因造成的缺失值呢?其实有很多原因,实际生活中可能由于有的数据不全所以导致数据缺失,也有可能由于误操作导致数据缺失,又或者人为地造成数据缺失。 来看下我们的示例吧 index = pd.Index(data=["Tom", "Bob", "Mary", "Ja
禹都一只猫olei
2018/09/19
1.6K0
【缺失值处理】拉格朗日插值法—随机森林算法填充—sklearn填充(均值/众数/中位数)
缺失值的处理准备数据1 sklearn填充(1)使用均值进行填补(连续型特征)(2)使用中位数、0进行填补(连续型特征)(3)使用众数进行填补(离散型特征)(4)KNN填补
用户7886150
2020/12/30
3.2K0
Pandas知识点-缺失值处理
数据处理过程中,经常会遇到数据有缺失值的情况,本文介绍如何用Pandas处理数据中的缺失值。
Python碎片公众号
2021/05/14
5.4K0
Pandas知识点-缺失值处理
手把手教你如何解决日常工作中的缺失值问题(方法+代码)
再好的模型,如果没有好的数据和特征质量,那训练出来的效果也不会有所提高。数据质量对于数据分析而言是至关重要的,有时候它的意义会在某种程度上会胜过模型算法。
1480
2021/12/06
1.1K0
手把手教你如何解决日常工作中的缺失值问题(方法+代码)
dropna()删除缺失值_pandas的dropna方法
pandas的设计目标之一就是使得处理缺失数据的任务更加轻松些。pandas使用NaN作为缺失数据的标记。
全栈程序员站长
2022/10/02
2.2K0
小白也能看懂的Pandas实操演示教程(下)
今天主要带大家来实操学习下Pandas,因为篇幅原因,分为了两部分,本篇为下。上篇内容见:小白也能看懂的Pandas实操演示教程(上)。
1480
2019/09/25
2.6K0
小白也能看懂的Pandas实操演示教程(下)
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
        这个女娃娃是否有一种初恋的感觉呢,但是她很明显不是一个真正意义存在的图片,我们需要很复杂的推算以及各种炼丹模型生成的AI图片,我自己认为难度系数很高,我仅仅用了64个文字形容词就生成了她,很有初恋的感觉,符合审美观,对于计算机来说她是一组数字,可是这个数字是怎么推断出来的就是很复杂了,我们在模型训练中可以看到基本上到处都存在着Pandas处理,在最基础的OpenCV中也会有很多的Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个Pandas文章,每个人的写法都不同,但是都是适合自己理解的方案,我是用于教学的,故而我相信我的文章更适合新晋的程序员们学习,期望能节约大家的事件从而更好的将精力放到真正去实现某种功能上去。本专栏会更很多,只要我测试出新的用法就会添加,持续更新迭代,可以当做【Pandas字典】来使用,期待您的三连支持与帮助。
红目香薰
2023/02/17
4.4K0
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
pandas删除某列有空值的行_drop的之
dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。
全栈程序员站长
2022/10/02
12.4K0
pandas删除某列有空值的行_drop的之
推荐阅读
相关推荐
pandas 处理缺失值[dropna、drop、fillna][通俗易懂]
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验