从链接sql-data-sources-parquet,我看到下面的代码片段存储了数据拼图格式,但根据我的理解,从wiki得到的只是一种格式,而不是一个存储引擎。因此,Parquet将以特定格式将数据存储在HDFS/S3/Cassandra等存储引擎上,不是吗?files, maintaining the schema information
// Read in the<e
df_edge.writeStream\ .option("checkpointLocation", "/tmp/edge/checkusr/src/app/apao-flask-gunicorn/graph_generator.py", line 22, in <module>
vertex_df = spark.read.parquet