我需要过滤pandas数据帧中的行,以便特定的字符串列至少包含所提供的子字符串列表中的一个。子字符串可能包含不常见的/ regex字符。比较不应该涉及正则表达式,并且不区分大小写。np.logical_or.reduce([df[col].str.contains(i, regex=False, case=False) for i in lst])
df
我仔细阅读了Select by partial string from a pandas DataFrame的帖子,但我认为它没有解决我的问题。如果可以在字符串中找到行值,我需要过滤数据帧的行。例如,我的表是: Part_NumberA1347 如果列值在字符串ZA1127B.48内,我想过滤记录。过滤后的数据帧应
我的数据集是巨大的。我正在使用Azure ML notebooks,并使用azureml.core读取日期集并转换为azureml.data.tabular_dataset.TabularDataset。无论如何,我会过滤tabularDataset中的数据,而不是转换为pandas数据帧。我使用下面的代码来读取数据。由于数据量