在我的笔记本中,我有数据帧被读取,每次运行笔记本时都会有一个可变的列数。如何动态地将只属于布尔数据类型的列的数据类型更改为字符串数据类型?数据框架的名称是"df“。def bool_col_DataTypes(DataFrame):
"""This Function accepts a Spark Data Frame as an argument. It returns a list of all Boolean
spark.read.text是火花动作还是一种转变? 我的理解是,这是一种转变。但是为什么在我的Zeppelin笔记本上花了3分25秒呢? val dump = spark.read.text(s"s3://redacted/*/*").as[String].filter(_.nonEmpty) 此管道中没有操作,只有转换。我的Apache Zeppelin笔记本的这个单元应该会立即执行。是因为它枚举了我的S3存储桶中的所有文件吗? 对于上下文: Spark version = 3.0.0-amzn-0,Zeppelin version 0.9.0-preview1。