腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9499)
视频
沙龙
1
回答
如
何在
Databricks
Notebook
中
调用
集群
API
并
启动
集群
?
、
、
、
目前,我们主要使用python/pyspark在azure
databricks
中使用一堆笔记本来处理数据。 我们想要实现的是确保在
启动
数据处理之前
启动
(预热)我们的
集群
。因此,我们正在探索从
databricks
notebooks
中
访问Cluster
API
的方法。到目前为止,我们尝试运行以下代码: import subprocesssubprocess.run(
浏览 35
提问于2021-09-01
得票数 1
回答已采纳
1
回答
在Spark作业
中
获取
Databricks
集群
ID (或获取
集群
链接
、
我想要在一个正在运行的Spark作业
中
获取
集群
链接(或手动组成链接的
集群
ID )。 这将用于打印警报消息
中
的链接,使工程师更容易访问日志。在
Databricks
中
运行的Spark作业有可能实现这一点吗?
浏览 35
提问于2021-06-30
得票数 3
回答已采纳
2
回答
每个管道的数据库作业
集群
,而不是每个笔记本活动
、
、
、
我正在不同的
Databricks
笔记本中转换数据(读取、转换和写入ADLS)。我将这些笔记本合并在一个DataFactory管道
中
:我已经从DataFactory创建了到我的数据库的连接,并将它添加到我的笔记本活动
中
。每当管道被触发时,我想
启动
Databricks
集群
。总的来说,这一切都很好
浏览 0
提问于2019-02-22
得票数 1
回答已采纳
1
回答
在
DataBricks
中一次提交多个作业
、
我有一个
DataBricks
笔记本,它将日期作为输入参数,并作为日常作业运行。 现在我需要让它在过去的几天内运行,但是使用自定义日期手动
启动
作业是相当乏味的。有没有一种简单的方法可以在一次拍摄
中
运行一批作业,例如从另一个笔记本(在日期范围内的循环中) ?
浏览 15
提问于2021-05-26
得票数 0
2
回答
如
何在
spark jar中使用dbutils.secrets
、
、
、
、
因此,我目前正在尝试为我的
Databricks
开发环境设置秘密。我已经使用
Databricks
-cli成功地设置了它们。我现在正尝试在我的spark jar (用scala编写)中使用它们。但是,我找不到dbutils位于哪个包
中
。
浏览 43
提问于2019-02-07
得票数 0
1
回答
在执行
Databricks
Notebook
时未安装Scla/Java库
、
、
、
、
在工作
中
,我有一个Scala
Databricks
Notebook
,它使用了许多来自Maven和一些JAR文件的库导入。我的问题是,当我在这个
Notebook
上计划作业时,它有时会失败(完全随机地,但通常是10次以上运行1次),因为它在所有库安装之前执行单元。因此作业失败,我必须手动
启动
它。这种来自
Databricks
产品的行为很不专业,因为我不能在生产中使用它,因为它有时会失败。 我尝试将1分钟左右的Thread.Sleep()放在所有导入之前,但这不会改变任何事情。对于Python
浏览 28
提问于2021-11-23
得票数 0
回答已采纳
1
回答
我可以运行Jupyter
Notebook
而不是
Databricks
吗?
、
、
、
是否可以在不
调用
DB
集群
的情况下在Jupyter
Notebook
上运行
Databricks
中
的代码?我知道有一个VScode的应用程序,但我想试试Jupyter
Notebook
。我想要在我的计算机上运行所有的单元(使用本地处理),当它完成后,我只需要将它转移到
Databricks
。这样,我就不会在测试代码上消耗
集群
。
浏览 11
提问于2020-07-14
得票数 0
回答已采纳
2
回答
每次
启动
Data bricks群集时,它都会安装所有软件包
、
我一直在使用Python/ R开发
Databricks
notebook
。一旦工作完成,我们需要终止
集群
,以节省相关成本。(因为我们正在使用机器)。因此,如果我们想要在任何笔记本上工作,我们还必须
启动
集群
。我已经看到,在
集群
中
重新安装这些包需要花费很多时间。有没有办法避免每次
启动
集群
时都安装?
浏览 0
提问于2019-04-01
得票数 1
2
回答
从存储帐户创建Azure
databricks
笔记本
、
、
、
我们在blob
中
的Azure存储帐户
中
存储了python脚本。我们希望在azure
databricks
集群
中部署/创建此python脚本(作为
notebook
),以便稍后我们可以运行Azure数据工厂管道,并且管道可以执行在
databricks
中
创建/部署的
notebook
我们只希望在blob
中
可用时创建/部署此脚本一次。是否可以从存储帐户部署/创
浏览 21
提问于2021-05-28
得票数 1
2
回答
Databricks
初始化脚本有时无法工作
、
、
我有一些初始化脚本,我想在
集群
启动
时运行它们 群集具有init脚本,该脚本位于一个文件
中
(在dbfs
中
) 基本上就是这样 dbfs:/
databricks
/init-scripts/custom-cert.sh/spark/conf/spark-env.sh """) 但是,如果我只是将init脚本放在bash脚本
中
,
并
通过管道将其上传到DBFS,则init脚本不会执行任何操作。e
浏览 60
提问于2021-09-27
得票数 1
1
回答
在azure
databricks
notebook
中
,群集重启后,package cell总是被销毁
、
我将我的共享代码放在一个package单元格
中
,并且我正在将这个包用于其他的
notebook
单元格。但每次
集群
重新
启动
时,包单元都会被销毁,我使用该包的笔记本找不到它,
并
抛出错误,
如
error: object abc is not a member of package com import com.abc.utility.Shared单独
notebook
中
的package单元格的代码如下 package com.abc.utility import
浏览 56
提问于2021-06-29
得票数 1
1
回答
如
何在
databricks
notebook
任务中将列表作为参数发送?
、
、
我正在使用
Databricks
Resi
API
在现有
集群
中使用
notebook
_task创建作业,
并
获取job_id。然后
调用
run-now
api
来触发作业。在这一步
中
,我想通过
notebook
_params发送一个list作为参数,它抛出一个错误,说“字段值需要非数组”。
浏览 3
提问于2019-06-07
得票数 1
2
回答
在数据库上可视化气流数据集
、
、
、
、
我已经在
databricks
上安装了airflow 1.9.0 (python3包)。在
databricks
笔记本
中
,我使用了: airflow list_dags ----------------------------------------------但是,我无法在
databricks
上找到如何做到这一点。气流安装在
databricks
集群
上,而不是在我的本地机器上。如果在本地计算机上运行localhost:8080,则无法访问它。 谢谢
浏览 0
提问于2019-12-22
得票数 0
1
回答
无法在工作区
中
创建
databricks
集群
、
、
我是
Databricks
的新手。我正在尝试在GCP上配置
databricks
集群
,但无法执行此操作,因为我的状态为挂起。我还启用了所需的
API
,
如
compute.googleapis.com、container.googleapis.com、deploymentmanager.googleapis.com、iam.googleapis.com来
启动
databricks
集群
。
浏览 49
提问于2021-09-09
得票数 0
1
回答
从.Net UI对数据库运行Spark SQL查询
、
、
、
、
我希望我的用户在UI
中
运行Spark SQL查询,
并
查看查询的结果集。 在内部,.Net Rest
API
会将查询从UI传递到
Databricks
集群
或
notebook
或odbc以运行查询。我的后端平台是
databricks
。 请建议如何通过一些代码/代码链接来实现这一点。提前感谢!
浏览 12
提问于2020-09-23
得票数 1
回答已采纳
1
回答
Azure数据库和ADF部署对运行作业/管道的影响
、
、
如果Azure DevOps要部署,如果在
databricks
上有正在运行的作业(例如,它是一个流作业),那么当前正在运行的作业仍在运行还是停止?它还会使用旧库还是新库?新代码什么时候取出来?
浏览 5
提问于2022-02-21
得票数 0
1
回答
如何将现有
集群
配置为使用通过shell脚本
调用
REST
调用
触发
Databricks
笔记本的情况下运行?
、
、
、
我们试图通过shell脚本使用REST
调用
触发现有的笔记本。工作区
中
运行着现有的
集群
。我们希望将
Databricks
笔记本与现有的
集群
连接起来,
并
触发笔记本 我们正在努力找出配置和REST
调用
,这些
调用
可以在运行时动态地触发带有特定
集群
的笔记本。
浏览 8
提问于2022-11-28
得票数 0
5
回答
数据库:我如何获得当前笔记本的路径?
、
、
、
Databricks
很聪明,但是如何识别当前笔记本的路径呢?关于的指南没有帮助。它建议:dbutils.
notebook
.getContext.notebookPath有什么建议吗?
浏览 1
提问于2018-11-28
得票数 19
回答已采纳
1
回答
REST用于查询
Databricks
表
、
我使用Azure在表示层/黄金层
中
创建数据转换和表。这些表
中
的底层数据位于Azure存储帐户
中
。我在黄金层中有几个这样的表,例如:存储单个客户视图数据的表。来自不同系统的外部应用程序需要访问这些数据,即应用程序将
启动
API
调用
有关客户的详细信息,并需要通过查询单个客户视图表发送匹配详细信息(客户详细信息)的响应。问题: 因为这是一个
浏览 11
提问于2022-07-24
得票数 1
回答已采纳
4
回答
如
何在
pyspark中加载
databricks
包dbutils
、
call last): NameError: name 'dbutils' is not defined 那么,有没有办法通过包含
databricks
包来在pyspark
中
运行它,就像导入一样?
浏览 13
提问于2018-08-17
得票数 7
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券