我有一只熊猫DataFrame df,它有多个专栏。现在,我想根据其他列值添加一个新列。我在堆栈中找到了很多答案,其中包括np.where和np.select。但是,在我的示例中,对于每个if条件(每个if/elif/else块),新列必须在具有特定比率的3个值中进行选择。df.iloc[i]['new_col']= choose one value between l=['a','b','c
我有几个数据帧,包含大约18列。50000排。每个行条目表示特定站点(=列)的度量,数据包含NA值。我发现data.table解决方案对于单个列和多列操作(例如)非常有用。
然而,我没有成功地将其中建议的方法结合起来(例如,在多个列上应用diff,忽略NAs)。is.na(x), lag_diff := x - shift(x)] # actually what I want, but for more colum