在我的数据集中,我有不同公司的每日时间序列,并使用PostgreSQL。我的目标是排除时间序列太不完整的公司。因此,我想排除所有有3个或3个以上连续缺失值的公司。此外,我想排除所有在数据集中的第一个日期和最后一个日期之间有超过50%缺失值的公司。A 82012-01-06 C NULL
因此,A必须被排除在外
我有一个数据框,它的值如下所示: Number 24681013151821
22 通过使用set.For的排序函数,我的值正在增加,但我想检查并发现是否有任何缺失值,在这种情况下,报告连续值set.For示例的开始和结束,在这种情况下,它应该返回1,10,12,16,20,22。我想在这里抛出,例如,18,尽管它在那里,但它不是连续的。