我知道,可以将S3中的文件(例如csv、parquet或json)中的数据加载到雪花中,方法是创建一个具有文件格式的csv类型的外部阶段,然后将其加载到具有1列VARIANT类型的表中。但是,这需要一些手动步骤才能将数据转换为正确的类型来创建一个可用于分析的视图。
是否有一种方法可以从S3自动执行此加载过程,以便从CSV文件中推断表列数据类型,或者通过其他方式指定?(类似于如何在Google BigQuery中使用推断表模式从GCS中的csv文件中创建表)
发布于 2021-03-01 21:08:20
到今天为止,您正在采用的单一变体列解决方案是使用雪花开箱即用的工具所能得到的最接近的解决方案,以实现您的目标,正如我从您的问题中了解到的那样,这就是让加载过程推断源文件结构。
实际上,COPY命令需要知道它将要通过FILE_FORMAT加载数据的预期文件的结构。
更多细节:https://docs.snowflake.com/en/user-guide/data-load-s3-copy.html#loading-your-data
https://stackoverflow.com/questions/66427561
复制相似问题