腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
thresh
in
dropna
for
DataFrame
in
pandas
in
python
、
df1 = pd.
DataFrame
(np.arange(15).reshape(5,3))df1.iloc[:2,2] = np.nan似乎没有删除任何NaN值。0 0 NaN NaN2 6 NaN 8.04 12 13.0 14.0df1.
dropna
(
thresh
=2,ax
浏览 17
提问于2018-07-30
得票数 11
回答已采纳
2
回答
如何将
pandas
.
DataFrame
.
dropna
应用于具有inplace = True和axis = 1的列的子集?
、
import
pandas
as pd 'col1': [99, None, 99], 'col3': [7, None, None]}) df[col_list].
dropna
(axis=1,
thresh
=2, inplace = Truefrom a <e
浏览 0
提问于2018-06-26
得票数 1
2
回答
将HTML表放入
pandas
Dataframe
中,而不是数据帧对象列表中
、
、
、
我是
python
和
pandas
的新手,在将HTML数据放入
pandas
数据帧时遇到了一些困难。在
pandas
文档中,它说.read_html()返回一个
dataframe
对象列表,所以当我试图做一些数据操作来去除一些样本时,我得到了一个错误。statistics/player/_/stat/points/sort/points/year/2015/seasontype/2', header = 1
浏览 0
提问于2016-07-21
得票数 15
回答已采纳
3
回答
列列表上的极点浮点等效
、
我的具体问题:把以下声明从熊猫变成极地我想我应该使用df.filter。输入 { 'col2':float('nan')])list_of_vars = ['col1
浏览 18
提问于2022-10-06
得票数 0
回答已采纳
1
回答
python
删除大多数列都是nans的行
、
、
、
我正在从excel导入数据,其中一些行可能在列中有注释,而不是真正的数据框架的一部分。虚拟的Eg。如下所示: H1 H2 H3sam red 5rod green 11Index H1 H2 H3 1
浏览 35
提问于2021-07-09
得票数 0
回答已采纳
1
回答
为列赋值时矛盾的
pandas
.
DataFrame
行为
、
、
但是,如果我运行以下代码行: df4 = df3.
dropna
(
thresh
=2) #.rename(columns={'a': 'x', 'b': 'y'}) df4['c'] = 1 我收到警告消息: A value is trying to be set on a copy of a slice from a
DataFrame
./
pandas
-docs/stable/indexing.
浏览 15
提问于2020-01-10
得票数 1
2
回答
绘制缺少日期值的时间序列信息
、
、
、
、
我有以下数据集: dataset.head(7)2019-01-01 A 123 A1232019-01-09 B 267 B2672019-02-11
浏览 8
提问于2020-01-13
得票数 0
2
回答
如何使用
dropna
删除
Pandas
中列子集上的列
、
我想在axis=1上使用
Pandas
的
dropna
函数来删除列,但只删除具有一些
thresh
集的列的子集。更具体地说,我想传递一个关于在
dropna
操作中忽略哪些列的参数。我该怎么做呢?import
pandas
as pd 'building': ['bul2', 'bul2', 'cap1', 'cap1'], 'dat
浏览 27
提问于2019-10-25
得票数 0
回答已采纳
1
回答
在
dataframe
上,为什么
dropna
()的行数比预期的要低?
、
、
、
我有一个
Dataframe
,其中大多数列都有10866个非空值,只有几个列的值较少。非空值最少的列是“关键字”(9373)。因此,当我从
Dataframe
中删除NA-值时,我希望每个列的非空值的数量等于列中具有最少非空值的非空值的数量;在本例中,是“关键字”。但是,当我应用df.
dropna
(inplace = True)时,每个列中的非空值的数量会减少到以前甚至不包含在
Dataframe
: 8665中的数字,甚至在包含最少非空值的列“关键字”中也不会包含。以下是原始
Dataframe
的样子: <c
浏览 0
提问于2019-09-02
得票数 0
回答已采纳
2
回答
根据列的值计数删除数据帧上的列
、
、
、
我有一个包含大量列的
dataframe
df,并且我只想保留计数超过5000个值的列数。 我尝试了下面的循环,但它不起作用。有什么简单的方法可以做到这一点吗?另外,我是否可以创建一个函数来将其应用于任何我想保留只有n个或更多值的列的
dataframe
?
浏览 8
提问于2020-11-01
得票数 3
回答已采纳
1
回答
熊猫只在至少有一个非南值的行上填充。
、
、
、
假设我有一个像这样构造的
DataFrame
:import numpy as np df.loc[df.
dropna
(
thresh
=1).index, :].fillna("fill value") 这将创建一个新的
DataFrame
,其值已正确填充,并删除了行,该行全部为但是我希望保留所有的NaN行,
浏览 0
提问于2018-05-24
得票数 0
回答已采纳
4
回答
Pandas
:如果超过一半为NaN,则删除行和列
、
我有一个名为df的
Pandas
DataFrame
,它有1,460行和81列。我希望删除至少一半条目为NaN的所有列,并对行执行类似的操作。在
Pandas
文档中,我尝试这样做:train_df.
dropna
(
thresh
=len(train_df)/2, axis=1, inplace我本以为len(train_df)会给我行数,所以我把错误的值传递给了
thresh
…? 我如何对行做同样的事情(删除至
浏览 2
提问于2017-09-27
得票数 3
7
回答
可同时改变X和y的滑雪板管道用自定义变压器
、
、
、
、
因为
python
通过赋值传递参数,因此一旦我将X重新分配到一个新的矩阵中,那么对原始X的引用就会丢失(当然,y也是如此)。是否可以保持这一参考资料?我正在使用一个熊猫
DataFrame
来轻松地丢弃有太多NaNs的行,这可能不是我用例的正确方法。当前的代码如下所示: def __init__(self,
thresh
=0): self.
th
浏览 12
提问于2014-08-28
得票数 26
回答已采纳
3
回答
如何根据特定列集合中的值删除
pandas
.
DataFrame
中的行?
、
、
从下面的数据框中,如何删除列[B, C, D]都为空值的所有行? 输入数据帧: A B C D1 3 1.0 NaN 2.03 67 NaN NaN NaN5 8 NaN NaN NaN 所需输出: A B C D1 3 1.0 NaN 2.04 52 3.0 2.0 NaN
浏览 35
提问于2020-04-16
得票数 1
回答已采纳
1
回答
sqlalchemy:将html表插入到mysql数据库中
、
我是
python
(3)的新手,现在想要了解以下内容:import
pandas
as pd engine = create_engine("mysql://
python
:"+'pw'+"@localhost/test?
浏览 18
提问于2018-02-20
得票数 1
回答已采纳
1
回答
无法使用
DataFrame
方法删除NaN (null)计数的可接受阈值
、
、
、
、
我打算使用
DataFrame
方法将记录从axis=0 (行)中删除,其值超过25%作为NaN。我已经审查了熊猫的官方参考,并提出了以下代码。然而,这并没有给出预期的结果。我遗漏了什么?代码:df.shape # (628, 123) df.
dropna
(
thresh
=df.shape[1]/ 4, axis=0, inplac
浏览 2
提问于2020-11-27
得票数 1
回答已采纳
1
回答
如果某些列具有某些值,则删除行。
、
、
我有这个df:import numpy as np[np.nan, 1, 55]}print (df) name
浏览 2
提问于2022-08-22
得票数 1
回答已采纳
3
回答
查找干净数据集的重复记录和子集
如何在
python
中编写代码以查找数据集中的重复记录?
浏览 2
提问于2019-08-16
得票数 0
回答已采纳
2
回答
在
pandas
中,如何从
DataFrame
中删除不包含至少一个NaN的所有列?
、
、
我有一个
DataFrame
,其中一些列具有NaN值。我想删除其中至少没有一个NaN值的所有列。我可以通过创建一个布尔值填充的
DataFrame
来标识NaN值(用True代替NaN值,否则用False代替):然后,通过创建一系列具有相关布尔值的列名(如果列至少包含一个
浏览 6
提问于2017-05-04
得票数 0
1
回答
PySpark
dataframe
:具有四个或多个非空列的筛选记录
、
更新 Row(id=128, col1=1336048242, col2=None, col3=1322345860, date='20160403')]df_filtered = df.
dropna
(
thresh
=[any number]) df_filter
浏览 3
提问于2016-04-03
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 5-Pandas DataFrame 常用功能实践
玩转Pandas,让数据处理更easy系列5
利用Python Pandas库从DataFrame中提取最新日期
pandas系列学习(三):DataFrame
为什么需要Pandas的DataFrame类型
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券