使用Spark从HDFS到Oracle BLOB的CSV文件

，可以通过以下步骤完成：

首先，确保你已经安装了Spark和Oracle数据库，并且配置了正确的环境变量。
在Spark应用程序中，首先导入必要的库和类：

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._

创建一个SparkSession对象：

val spark = SparkSession.builder()
  .appName("HDFS to Oracle BLOB")
  .config("spark.master", "local")
  .getOrCreate()

读取HDFS上的CSV文件并创建一个DataFrame：

val csvFile = "hdfs://path/to/csv/file.csv"
val df = spark.read.format("csv")
  .option("header", "true")
  .option("inferSchema", "true")
  .load(csvFile)

将DataFrame中的数据写入Oracle数据库的BLOB列：

val oracleUrl = "jdbc:oracle:thin:@//hostname:port/service"
val tableName = "your_table_name"
val blobColumnName = "your_blob_column_name"

df.write.format("jdbc")
  .option("url", oracleUrl)
  .option("dbtable", tableName)
  .option("user", "your_username")
  .option("password", "your_password")
  .option("driver", "oracle.jdbc.driver.OracleDriver")
  .option("batchsize", "1000")
  .option("truncate", "true")
  .option("fetchsize", "1000")
  .option("createTableColumnTypes", s"$blobColumnName BLOB")
  .mode("append")
  .save()

在上述代码中，需要将hostname、port、service、your_table_name、your_blob_column_name、your_username和your_password替换为实际的Oracle数据库连接信息和表信息。

这样，Spark就会将HDFS上的CSV文件数据写入到Oracle数据库的BLOB列中。

推荐的腾讯云相关产品：腾讯云云数据库（TencentDB）和腾讯云弹性MapReduce（EMR）。

腾讯云云数据库（TencentDB）：提供了多种数据库产品，包括关系型数据库、NoSQL数据库和分布式数据库等，可满足不同场景的需求。具体可参考腾讯云云数据库产品介绍：https://cloud.tencent.com/product/cdb
腾讯云弹性MapReduce（EMR）：是一种大数据处理和分析的云服务，基于Apache Hadoop和Apache Spark等开源框架构建。可用于大规模数据处理、机器学习、数据挖掘等任务。具体可参考腾讯云弹性MapReduce产品介绍：https://cloud.tencent.com/product/emr