我试图删除python dataframe中具有NaN值的行,当我这样做时,我希望行标识符以这样的方式移动,即新数据帧中的标识符从0开始,并且彼此相差一个数字。关于标识符,我指的是下面示例中左边的数字。请注意,这不是我的df的实际列。默认情况下,这放在每个数据帧中。
如果我的Df如下:
name toy born
0 a 1 2020
1 na 2 2020
2 c 5 2020
3 na 1 2020
4 asf 1 2020
我想在dr
我的数据有75130行×36列,我计划用模式填充一些列的'NA‘,一些列用中值填充。我刚刚了解了计算机,并开始在我的数据集上进行练习。
An example of my dataFrame:
y1 y2 y3 y4
0 2 Nan 1 0.3
1 Nan Nan 2 0.4
2 2 Nan 3 1.0
3 3 Nan 4 2.0
4 4 Nan Nan Nan
5
我的df如下所示:
a b c d e f
1 na 2 3 4 5
1 na 2 3 4 5
1 na 2 3 4 5
1 6 2 3 4 5
如何裁剪和重塑数据帧,以使每一列的n/a都被删除,并且数据帧如下所示:
编辑;
df.dropna()正在删除所有行。
a b c d e f
1 6 2 3 4 5
这个数据帧有数百万行,我需要能够逐列删除n/a行,同时保留其中包含数据的行和列。
编辑;
df.dropna()正在删除列中的所有行。当我检查n/a的列是否为空时,df.column_name.empty()返回false。因此,在n/a的列中有数据
我让它工作了,现在我改变了“某些东西”,但它不再工作了。我在Excel中有一个表,我正在将其读取到一个df中。这就像预期的一样。我读入它,然后过滤它,这样我就只有符合特定条件的数据行。代码如下:
df = excel_range_upper_left.options(pd.DataFrame, expand='table', header=1,
index=False).value
print(f'Check for missings')
for c in df.columns:
count =
我有一个数据帧,在我完成转置后,它看起来像这样: step1 step2 step3 step4 ..... stepn-1 stepn
session_id
1 page_id page_id NA NA NA NA
2 page_id NA NA NA NA NA
3 page_id page_id page_id page_id
我有一些未知的DataFrame,可以是任意大小和形状的,例如:
first1 first2 first3 first4
a NaN 22 56.0 65
c 380.0 40 NaN 66
b 390.0 50 80.0 64
我的目标是删除有NaN值的所有列和行。在这种具体情况下,输出应该是:
first2 first4
b 50 64
另外,我需要保留使用" all“的选项,比如在pandas.DataFrame.dropna中,这意味着当一个参
嗨,我正在试图显示一个大的合并数据集到散点图中,以找出人均gdp和孩子数量之间的关系。数据文件看起来有点像这样。如何移除带有Nan值的行并绘制散点图?还是我只是把图画得笔直一点,它就会忽略所有带有NaN值的行?任何帮助都是非常感谢的:)此外,在计算第二列和第三列的平均值时,我是否在另一列上显示了结果?
Country | Number of kids | GDP per capita
A | 4 | 2345
B | 2 | 2156
C | NaN | 1156
我有包含NAN值的数据集。我试着把它放下,但它仍然在显示
df['string_tweet'].dropna(inplace=True)
df['string_tweet']
这是输出
113 apc started let ’ finish started
235 upon vote katsina , apc government left state ...
1796 two people contesting office , one person win ...
1798 d
我在我的熊猫数据框架中有2列,我想计算它们之间的业务日期。
数据:
ID On hold Off Hold
101 09/15/2017 09/16/2017
102 NA NA
103 09/22/2017 09/26/2017
104 10/12/2017 10/30/2017
105 NA NA
106 08/05/2017 08/06/2017
107 08/08/2017 08/03/2017
108 NA NA
我使用numpy的busd
我有一个包含age、date和location列的数据文件。
我想计算一下在所有列中有多少行是空的(不是一些,而是全部在同一时间)。我有以下代码,每一行都是独立工作的,但是如何说age AND date AND location是空的呢?
df‘’age‘..isnull().sum()df’‘date’..isnull().sum()df‘’location‘..isnull().sum()
在移除这三列中缺少值的行之后,我想返回一个dataframe,如下所示,但是合并在一个语句中:
Df.mask(行‘’location‘..isnull())df[np.isfinite(df’
我有一个这样的数据框架:
df
col1 col2 col3 col4 col5 col6
1 2 NA 3 NA NA
4 5 6 7 NA NA
8 9 NA NA NA NA
10 11 NA NA NA NA
13 14 15 NA 16 17
col1和col2没有NA值,我想删除那些从col3到col6 (可以是col100等
我是这样做的:
pandas.concat([
yfinance.download('btc-usd',interval="1d")["Close"],
yfinance.download('aapl',interval="1d")["Close"]
],axis=1)
这为我提供了一个带有NaN值的数据,如下所示:
Close Close
Date
1980-12-12 0.128348 NaN
1980-12-12
我有一个有很多行的数据格式,有些值是NaNs。
例如-
index col1 col2 col3
0 1.0 NaN 3.0
1 NaN 4.0 NaN
3 1.0 5.0 NaN
I希望过滤DF,只返回带有2+值的行。
这个数字应该是可配置的。
最终的DF将是-
index col1 col2 col3
0 1.0 NaN 3.0
3 1.0 5.0 NaN
你知道我怎样才能达到这个结果吗?我尝试
我有一个包含名称、地址和电话信息的单独列的熊猫数据栏,该列由空格或na行分隔,如下所示:
data
0 Business name one
1 1234 address ln
2 Town, ST 55655
3 (555) 555-5555
4 nan
5 Business name two
6 5678 address dr
7 New Town, ST 55677
8 nan
9 Business name three
10 nan
等等..。
我想要的是:
Name Addr1 Addr2