我需要将可为空的整型日期值('YYYYMMDD')读取到pandas,然后将此pandas数据帧保存为Date32Day格式,以便Athena Glue Crawler分类器将该列识别为日期。\array.pxi", line 265, in pyarrow.lib.array
File "pyarrow\array.pxi", line 80, in pyarrow.lib.,并且pyarrow会将日期列推断为Da
我有一个来自等离子DataStore的RecordBatch,我可以将它读入pyarrow.RecordBatch或pyarrow.Table。有没有办法在pyarrow.Table上使用新的Dataset API (可以在ParquetDataset上使用)中的filter方法?这将允许我使用这样的过滤器:看一下源代码,pyarrow.Table和pyarrow.RecordBa
我有一个python程序,它以文件的形式读取一个拼图文件,并试图用它来构造一个pyarrow数据集。我可以使用以下方法将文件编辑器读入比罗罗表中:但是,将文件读取程序直接传递给数据集初始化程序会导致错误这是有意义的,因为pyarrow文档显示ds.dataset函数不接受filereader作为数据源:
import pyarrow.dataset a