我使用上传到Google Cloud Platform的存储上的数据成功地创建了一个新表,但问题是,当我使用自动检测设置时,标题字段名称总是错误的,并将"Header rows to skip“设置为1……我只是得到了诸如"string_field_0”之类的通用名称。
我知道我可以在Schema下手动添加字段名,但是,对于有很多字段的表来说,这是不可行的。有没有办法修复头文件名?这似乎不是什么大事,though...Pandas一直都在自动做这件事。
谢谢!
Excel中的csv文件:
发布于 2018-02-03 01:33:20
问题是您的文件中只有字符串类型。因此,BigQuery不能区分标题和实际有效行。如果你说了另一列,而不是字符串,比如Integer,那么它就会检测列名。例如:
column1,column2,column3
foo,bar,1
cat,dog,2
fizz,buzz,3
正确加载如下所示,因为数据中除了字符串之外还有其他内容:
因此,您需要的不只是String,或者您需要自己显式地指定模式。
提示:您没有使用UI并单击大量按钮来定义模式。您可以使用API或gcloud
命令行工具以编程方式完成此操作。
发布于 2020-11-17 13:01:21
同样的问题也发生在Google Sheets上。对,原因是所有字符串数据都在工作表中。但是使用Google Sheets的解决方法很简单;只需添加一个整数列,如here所述
发布于 2021-02-04 18:52:14
因为这里没有提到它,所以帮助我向标题行添加了1个要跳过的行。您可以在高级选项下找到它
我的数据库来自Google Sheet,在一些列中已经有了整数值。
https://stackoverflow.com/questions/48590983
复制相似问题