从pandas DataFrame中去掉NaT和重复项,以获得一系列日期时间值,可以使用以下步骤:
import pandas as pd
df = pd.DataFrame({'date': ['2022-01-01', '2022-01-02', '2022-01-03', pd.NaT, '2022-01-03']})
df = df.dropna(subset=['date'])
df = df.drop_duplicates(subset=['date'])
完整的代码如下:
import pandas as pd
df = pd.DataFrame({'date': ['2022-01-01', '2022-01-02', '2022-01-03', pd.NaT, '2022-01-03']})
df = df.dropna(subset=['date'])
df = df.drop_duplicates(subset=['date'])
print(df['date'])
这样,你将得到一个不包含NaT和重复项的日期时间值的Series。
关于pandas DataFrame的更多信息,你可以参考腾讯云的产品介绍链接:腾讯云·Pandas
领取专属 10元无门槛券
手把手带您无忧上云