我试图理解Databricks存储文件的方式,我不太确定dbfs:/和文件:/之间的区别(见下图)。

从我从这里中可以推断出来的情况来看,file:/似乎是通过curl/wget下载到以下文件夹路径中的外部文件的区域:
%fs ls "file:/databricks/driver"但是,什么是文件:/,为什么它存在,它与dbfs:/有什么不同?
为了记录在案,我使用的是社区免费版的Databricks。
发布于 2020-09-03 14:00:30
Databricks Community托管在Amazon服务上。
当您在databricks社区版本中创建集群时,后台创建了一个虚拟机(aws ec2实例),它充当驱动节点,通过笔记本运行程序。
集群管理服务。该服务将使用已经为您设置的Spark节点来拆分。为Community释放15 per内存集群,并为普通版本的每个节点每小时计费一次。
%fs ls "file:/"返回虚拟机aws ec2实例中可用的文件夹),后者运行在aws云的后端。

%fs ls返回Databricks文件系统( Databricks,DBFS)是一个分布式文件系统,安装在Databricks工作区中,在Databricks集群上可用。DBFS是可伸缩对象存储(即aws S3存储)之上的一个抽象。

https://stackoverflow.com/questions/63667523
复制相似问题