在Spark中使用MongoDB时,可以通过在readConfig中添加uri和数据库来配置连接。具体步骤如下:
import com.mongodb.spark._
val spark = SparkSession.builder()
.appName("MongoDB Example")
.config("spark.mongodb.input.uri", "mongodb://localhost/testDB.collectionName")
.config("spark.mongodb.output.uri", "mongodb://localhost/testDB.collectionName")
.getOrCreate()
在上述代码中,通过config
方法设置了spark.mongodb.input.uri
和spark.mongodb.output.uri
参数,分别指定了MongoDB的URI和数据库名称。
val df = spark.read.format("com.mongodb.spark.sql.DefaultSource").load()
这里使用spark.read
方法读取MongoDB数据,通过format
方法指定数据源为com.mongodb.spark.sql.DefaultSource
。
完整的代码示例:
import com.mongodb.spark._
val spark = SparkSession.builder()
.appName("MongoDB Example")
.config("spark.mongodb.input.uri", "mongodb://localhost/testDB.collectionName")
.config("spark.mongodb.output.uri", "mongodb://localhost/testDB.collectionName")
.getOrCreate()
val df = spark.read.format("com.mongodb.spark.sql.DefaultSource").load()
df.show()
需要注意的是,上述代码中的mongodb://localhost/testDB.collectionName
是一个示例URI,你需要根据实际情况替换为你的MongoDB的URI和数据库名称。
推荐的腾讯云相关产品:腾讯云数据库 MongoDB,详情请参考腾讯云数据库 MongoDB。
领取专属 10元无门槛券
手把手带您无忧上云