我对salesforce的soql的使用经验有限,需要在bigquery中将其应用于此问题。上下文:我有4个不同的数据集,它们具有不同的列名和顺序,从7,000到35000行,所有4个数据集都包含重复的行,并且它们之间共享重复的行。 目标:我想要一个没有重复行的数据集。我的直觉是:我觉得我应该规范化列名,将它们添加到相同的表中,并采用这种方法Remove Duplicate Data in
我使用的是BigQuery,它有一个带有month时间戳字段的非常大的表:org STRING我意外地写了两个月的数据,导入了两次,错误地使用了追加模式考虑到BigQuery不允许我更新或删除数据,那么消除重复数据的最佳方法是什么?我首先将除问题月份之外的所有数据复制到一个临时表中:
SELECT * FROM mytable WHERE month!=TIMESTAMP('2012-01-01