腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3452)
视频
沙龙
2
回答
用星火
BigQuery
连接器
旋转
Dataproc
集群
、
、
阅读这个repo:下
的
说明,我按照下面的初始化操作创建一个新
的
Dataproc
集群,并安装了特定版本
的
Google和
BigQuery
连接器
: gcloud beta
dataproc
clusters但是,
使用
PySpark笔记本通过Jupyter仍然会导致
BigQuery
“未找到类”异常。当我直接从终端运行PySpark时,也会发生同样
的
情况。我能够避免这种异常
的
唯一方法是在集群
的</em
浏览 4
提问于2019-10-02
得票数 3
回答已采纳
2
回答
找不到google.cloud.
spark
模块
、
、
、
同时
使用
来运行pyspark作业。我
的
代码尝试在
bigquery
上执行一个查询,
使用
pyspark = 'select max(col ) from表‘df =
spark
.read.format(’
bigquery
‘).load(查询)
浏览 11
提问于2022-07-11
得票数 0
1
回答
使用
Spark
BigQuery
连接器
使用
Dataproc
写入
BigQuery
的
速度
很慢
、
、
我们有一个
Spark
Streaming应用程序,它从Pubsub读取数据并应用一些转换,然后将JavaDStream转换为Dataset,然后将结果
写入
BigQuery
规格化表。 Dataset<PubSubMessageSchema> pubSubDataSet =
spark
.crea
浏览 7
提问于2021-02-24
得票数 1
2
回答
org.apache.
spark
.SparkException:未能初始化类com.google.cloud.
spark
.
bigquery
.SparkBigQueryConnectorUserAgentProvider
、
、
、
、
下面是我用来将一个
bigquery
表导入到我
的
PySpark集群(
Dataproc
),然后在其上运行fp-growth算法
的
代码。但是,今天当我运行相同
的
代码时,它抛出了一个错误。它
使用
.printSchema()返回导入
的
df
的
模式,但是当我尝试运行.show()或.fit()时,它抛出以下错误。= SparkSession.builder.appName('Jupyter
BigQuery
Storage').
浏览 15
提问于2020-06-11
得票数 2
回答已采纳
2
回答
如何在本地用java连接到
spark
的
Google大查询?
、
、
我正在尝试
使用
java中
的
spark
连接到Google big query,但我无法找到相同
的
准确文档。我试过了:https://cloud.google.com/
dataproc
/docs/tutorials/
bigquery
-connector-
spark
-example 和 https://github.com/GoogleCloudPlatform/
spa
浏览 219
提问于2019-12-05
得票数 2
1
回答
Dataproc
上
BigQuery
连接器
ClassNotFoundException在PySpark中
的
应用
、
、
我试图
使用
Dataproc
在PySpark中运行一个脚本。 文件"/usr/lib/
spark
/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py",第328行,在get_return_valuepy4j.protocol.Py4JJavaError
浏览 1
提问于2019-06-15
得票数 1
回答已采纳
1
回答
从运行在
Dataproc
集群上
的
Rstudio连接到
BigQuery
、
、
、
、
我创建了一个
Dataproc
集群,并
使用
以下说明成功启动了RStudio服务器:https://cloud.google.com/solutions/running-rstudio-server-on-a-cloud-
dataproc
-cluster我还成功地安装了sparklyr并创建了
Spark
实例。sc <-
spark
_connect(master = "local") 但是,我想知道如何连接到
BigQuery
。有
浏览 15
提问于2020-11-28
得票数 1
回答已采纳
2
回答
Dataproc
notebook无法导入或导出到
BigQuery
:未找到类异常
、
、
这是我正在进行
的
spark
会话。我包含了最新
的
用于
spark
big query connector for
Dataproc
1.5
的
jar。from pyspark.sql import SparkSession
spark
= SparkSession.builder.appName("GCS to
BigQuery
- Dev") \.config('
spark
.jars', '
浏览 8
提问于2021-02-11
得票数 2
回答已采纳
1
回答
阅读
bigquery
: java.lang.ClassNotFoundException: org.apache.
spark
.internal.Logging$class时出错
、
、
、
、
,iap-remote-admin \--properties
spark
:
spark
.jars=gs://
spark
-lib/
bigquery
/
spark
-
bigquery
-latest.jar("
spark
.sql.execution.arrow.pyspark.enabled", "true") load_data(
spark</
浏览 1
提问于2020-11-12
得票数 3
回答已采纳
1
回答
使用
Spark
BigQuery
连接器
查询
BigQuery
视图时未启用缓存
、
、
、
、
我正在
使用
Spark
BigQuery
连接器
从
Dataproc
集群中查询表和视图,我看到
的
是,当请求未
使用
缓存
的
视图时,
连接器
会为每个读取
的
视图创建一个新
的
临时表: df =
spark
.read.format('
bigquery
').option('table', view_name).option('views
浏览 0
提问于2021-01-13
得票数 2
1
回答
将PySpark数据作为
dataproc
作业上载到
bigquery
、
、
、
、
我试图在
Dataproc
集群上提交一个PySpark作业。我
的
工作是将数据上传到
bigquery
。当我
使用
集群上
的
submit作业执行时,我会遇到一个错误,作业失败。但是,当我提供这个罐子时: "gs://
spark
-lib/
bigquery
/
spark
-
bigquery
-latest_2.12.jar",在提交作业中
的
jar文件参数中,作业成功执行。我<e
浏览 7
提问于2022-04-06
得票数 1
1
回答
如何将PySpark连接到
Bigquery
、
、
我正在尝试
使用
PySpark读取表格形式
的
BigQuery
。我尝试过以下几种方法 table = 'my-project-id.project-dataset.test_table_
spark
' df =
spark
.read.format('
bigquery
'('table', table).load() 然而,我得到了这个错误 : java.lang.ClassNotFoundException: Failed to fin
浏览 19
提问于2019-10-01
得票数 2
回答已采纳
1
回答
将
BigQuery
与
Spark
集成
、
、
我怎样才能将“星火”连接到谷歌
的
BigQuery
?但是我发现唯一
的
JDBC驱动程序是旧
的
。如果答案涉及JDBC,那么url参数应该是什么样子
的
?来自
Spark
"url" -> "jdbc:po
浏览 3
提问于2015-10-03
得票数 1
1
回答
GCP
Dataproc
-在初始化中
使用
connectors.sh时群集创建失败-操作
、
、
、
这是命令和错误TYPE=n1-highmem-8BUCKET=
dataproc
-
spark
-karan REGION=us-central1:
dataproc
.logging.stackdriver.job.driver.enable=true,
dataproc
:job.history.to-gcs.enabled=true,
spark
:
spark
.dynamicAllocation.enabled=f
浏览 10
提问于2022-02-01
得票数 3
回答已采纳
2
回答
ClassNotFoundException:找不到数据源:
bigquery
、
、
、
、
我正在尝试将数据从谷歌
BigQuery
加载到在Google
Dataproc
上运行
的
Spark
(我
使用
的
是Java)。我试着按照这里
的
说明操作: <artifactId>
spark
-
big
浏览 24
提问于2019-11-03
得票数 3
回答已采纳
2
回答
如何在虚拟机GCP中安装
spark
-
bigquery
-connector?
、
、
、
、
我在GCP中有一个带有
spark
install
的
VM镜像集群Hadoop,但它不是一个
dataproc
。我可以在不
使用
dataproc
的
情况下安装
spark
bigquery
连接器
吗?我找到了下载
连接器
的
链接
浏览 0
提问于2020-11-14
得票数 0
1
回答
如何
使用
dataproc
从与我
的
dataproc
集群不在同一项目中
的
bigquery
中提取数据?
我所在
的
组织需要
使用
Spark
从客户
的
bigquery
数据集中提取数据,考虑到客户和我们都
使用
GCP,
使用
Dataproc
来实现这一点是有意义
的
。我读过,它看起来非常有用,但是它似乎假设
dataproc
集群、
bigquery
数据集和临时
BigQuery
导出
的
存储桶都在同一个GCP项目中-对我来说并非如此。我有一个服务帐户密钥文件,它允许我连接到存储在
big
浏览 2
提问于2018-11-02
得票数 0
2
回答
GCP火花消耗
BigQuery
、
、
、
我在GCP Google云平台上很新,所以我希望我
的
问题不会显得那么愚蠢。主要目标是从
BigQuery
收集少量扩展表,并应用少量转换。由于我计划
使用
Dataproc
部署一个Pyspark脚本
的
表
的
大小,理想情况下,我可以
使用
sqlContext将少量
的
sql查询应用到DFs (从BQ中提取
的
表)。最后,我可以轻松地将这些信息转储到数据存储桶中
的
文件中。 我可以在我
的
import
浏览 0
提问于2019-01-07
得票数 3
4
回答
bigquery
数据库中
的
重写模式失败
由: com.google.cloud.
bigquery
.connector.common.BigQueryConnectorException$InvalidSchemaException:目标表
的
模式与dataframe
的
模式不兼容引起
的
.format('
bigquery
') \.mode("
浏览 17
提问于2022-06-06
得票数 1
1
回答
如何在PySpark应用程序中读写Google Cloud Bigtable中
的
数据?
、
、
、
我在Google Cloud
Dataproc
集群上
使用
Spark
,我想在PySpark作业中访问Bigtable。我们有没有像谷歌
BigQuery
连接器
那样
的
Spark
的
Bigtable
连接器
?
浏览 4
提问于2016-11-02
得票数 5
点击加载更多
相关
资讯
谷歌融合SQL、Python和Spark推进Colab Enterprise发展
谷歌推出Bigtable联邦查询,实现零ETL数据分析
自学14天后,我毁掉了自己的数据工程师面试
DB-Engines 公布 2023 年度数据库:PostgreSQL
开源PostgreSQL第四次成为年度数据库
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
云直播
活动推荐
运营活动
广告
关闭
领券