我正在编写一段代码,其中我使用包含来自不同出版物的评论的csv文件,这是csv文件中的第3列。我必须选择出版物为“纽约时报”或“大西洋”的行。如何同时对多个csv文件执行此操作?我将csv文件(数据包含3个文件)加载到数据帧字典中。下面是我加载数据的方式:
filenames = glob('articles*.csv')
dataframe_dict = {}
for i in filenames:
dataframe_dict[i] = pd.read_csv(i, sep = ',', header = None)
print(dataframe_dict['articles1.csv'])
发布于 2019-01-21 10:03:18
你可以看看dataframe.query()
请注意,您可能需要将标头设置为True
。
尝试:
results = dataframe_dict['articles1.csv'].query(
'the_header_name == "New York Times" '
'or the_header_name == "Atlantic"'
)
发布于 2019-01-21 10:13:45
下面是一些您可以使用的其他代码,它以布尔值的形式返回所需的索引,然后用于约束帧。
dataframe_dict_filtered_idx = dataframe_dict['articles1.csv'][3] == 'New York Times'
dataframe_dict_filtered_idx2 = dataframe_dict['employeesDetails.csv'][3] == 'Atlantic'
dataframe_dict_filtered = dataframe_dict['articles1.csv'][dataframe_dict_filtered_idx | dataframe_dict_filtered_idx2]
https://stackoverflow.com/questions/54287118
复制