腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7132)
视频
沙龙
1
回答
在
databricks
中
,
如何将
表
数据
加
载到
数据
帧
中
?
逐行
还是
批量
?
、
、
我对
databricks
notebooks和dataframes不熟悉。我需要将一个包含大约1400万条记录的
表
中
的几列加
载到
dataframe
中
。一旦
表
被加载,我需要根据两列中出现的值创建一个新列。 我希望
在
将
表
加
载到
dataframe
中
时,为新列编写逻辑以及select命令。首先将这几列的
表
加
载到
df
中
,然后
在
已加载的df上执行列操作,是不
浏览 12
提问于2020-12-20
得票数 0
1
回答
从
在
azure云上运行的
databricks
向外部配置单元群集写入pyspark
、
、
、
我有
在
databricks
中
运行的pyspark笔记本。我使用pyhive
中
的'hive.Connection‘连接到外部配置单元群集。我的
数据
存储
在
spark
数据
帧
中
。我的问题是,
如何将
来自dataframes的
数据
写入Hive
中
的新
表
,该
表
位于
databricks
以外的不同集群
中
? 谢谢
浏览 11
提问于2020-09-26
得票数 0
1
回答
使用更改模式将
数据
插入到增量表
中
、
、
如何通过改变
数据
库
中
的模式将
数据
插入到增量表
中
。
在
Databricks
Scala
中
,我分解了一个Map列并将其加
载到
增量表
中
。我有一个预定义的增量表模式。 假设模式有4列A、B、C、D。因此,有一天,我使用下面的代码将包含4列的
数据
帧
加
载到
增量表
中
。例如,
在
第2天,添加了两个新列E和F,但没有C列。现在我在
数据
帧</
浏览 18
提问于2021-10-29
得票数 0
1
回答
Mockdata Cosmosdb
、
、
我想把一些测试
数据
加
载到
Cosmos db
中
,但不能
批量
加载。那么,我们
如何将
样本测试
数据
批量
加
载到
cosmos
表
中
,这与
数据
加载器实用程序类似,从而将模拟
数据
带入cosmos
表
中
?
浏览 13
提问于2018-08-11
得票数 1
1
回答
在
Databricks
中使用Pyspark更新
数据
库
表
、
、
、
我
在
Azure SQL Server
数据
库中有一个
表
,该
表
是从我的Dataframe填充的。我想使用pyspark / pandas基于多条件
数据
库来更新这个
表
。我是PySpark /
Databricks
/ Pandas的新手,有人能告诉我如何更新
表
吗?我已经将
数据
插入到
表
中
-我可以想到的一种解决方案是将
表
中
的
数据</em
浏览 2
提问于2020-04-20
得票数 0
1
回答
如何将
文件名作为列添加到Snowflake
中
,
批量
加载CSV文件?
、
我可以通过内部stage将CSV文件
批量
加
载到
Snowflake
中
,或者直接将
数据
加
载到
表
中
。 我遇到的问题是,文件名包含重要信息,必须包含在
表
中
。
如何将
CSV文件
批量
加
载到
Snowflake
中
,同时添加文件名作为附加列? 例如: ?
浏览 12
提问于2020-10-14
得票数 1
回答已采纳
1
回答
当从文件加载时,Spark会在内存中保留DataFrame吗?
、
、
如果我像这样创建一个
数据
帧
:spark实际上是将
数据
(从csv文件)加载(/copy)到内存
中
,
还是
作为分布式
数据
集加
载到
底层文件系统
中
?我之所以这样问,是因为
在
加载df之后,底层文件
数据
中
浏览 1
提问于2019-10-25
得票数 2
1
回答
我们能否
在
没有spark.sql的情况下将
数据
从熊猫
数据
加
载到
databricks
表
、
、
、
我有一个要求,把
数据
从csv/熊猫
数据
写到
databricks
表
。我的python代码可能不在
databricks
集群上运行。我可能在一个孤立的独立节点上运行。我使用
databricks
python连接器从
databricks
表
中选择
数据
。选择是有效的。但我无法从csv或熊猫的
数据
加
载到
数据
库。我是否可以使用
databricks
python连接器将c
浏览 5
提问于2022-08-19
得票数 0
1
回答
从SAS到Netezza的加载
表
、
我有一个函数,它应该在Netezza
中
创建和加载一个
表
。connection to nzCon quit;谢谢!
浏览 2
提问于2018-10-30
得票数 1
回答已采纳
1
回答
如何在MySQL中用LOAD INFILE同时替换列
假设
表
中有一个带有值的十进制列,例如: 128.98、283.98、21.20。 我想将一些CSV文件导入到这个
表
中
。但是,在这些文件的列
中
,我有像235,69,23,23这样的值,用逗号代替点。我知道我可以替换那个列,但是
在
加载INFILE之前有什么方法吗?
浏览 5
提问于2015-06-01
得票数 0
回答已采纳
1
回答
Azure
Databricks
,
如何将
csv自动下
载到
本地网络驱动器?
、
、
我的工作目前实现了Azure
Databricks
。是否可以定期将我的
数据
帧
作为csv自动下
载到
本地网络驱动器路径?例如,我们公司有周期性的报告,希望我可以通过
在
databricks
中
创建
数据
帧
来实现自动化,并以某种方式让azure将csv下
载到
我们公司网络文件夹
中
的特定路径
中
。这有可能吗?仅供参考,我知道我可以将csv文件保存到文件存储(dbfs),但主要问题is..how我或a
浏览 27
提问于2020-01-08
得票数 1
1
回答
Az MySql to Az SQL Server - Data Lake Gen2
、
、
、
我创建了
数据
工厂管道,将初始和增量
数据
从Az MySql
数据
库加
载到
Data Lake
中
。 将
数据
从MySql加
载到
数据
湖的初始管道都很好。作为.parquet文件持久化。现在,我需要通过一些基本的类型转换将它们加
载到
SQL Server
表
中
。最好的方法是什么?
Databricks
=>挂载这些.parquet文件,标准化并加
载到
SQL Server<em
浏览 22
提问于2020-04-21
得票数 0
1
回答
增量
数据
负载从Azure Synapse到ADLS使用三角洲湖
、
我们
在
中
创建了一些视图。我们需要基于一个水标列来递增地查询这些
数据
,并且它必须被加
载到
Azure
数据
湖容器
中
,进入原始层,然后再加
载到
管理层。
在
原始层
中
,文件应该包含整个
数据
(满载
数据
).So,基本上我们需要附加这些
数据
并作为一个满载导出。我们是否应该使用
Databricks
Delta湖
表
来处理这个需求。
如何将
数据</
浏览 4
提问于2022-10-25
得票数 0
2
回答
通过Python
中
的
Databricks
api读取
Databricks
表
?
、
、
使用Python-3,我试图将Excel (xlsx)
表
与
Databricks
中
相同的星火
表
进行比较。我希望避免
在
Databricks
中进行比较。因此,我正在寻找一种通过
Databricks
api读取星火
表
的方法。这个是可能的吗?我怎样才能继续读一张桌子: DB.TableName?
浏览 8
提问于2021-03-19
得票数 1
回答已采纳
1
回答
如何使用
数据
库让dplyr::summarize_all
在
sparkdataframe上工作?
、
、
、
我正在使用
databricks
。X有数十亿条记录,太大了,不能收集到一台机器上。我要怎么做才能让它正常工作?SparkDataFrame" 和 class(x) 返回:1 "SparkDataFrame“attr(,"package") 1 "SparkR” Mastering Spark with R这本书中有一个加载小型r
数据
帧
并在其上运行summarize_all的示例: cars <- copy_to(sc, mtcars) summarize_all(cars, mean)
浏览 17
提问于2020-09-24
得票数 2
回答已采纳
1
回答
映射函数
在
DataFrame上的应用
、
、
我刚刚开始使用
databricks
/pyspark。我正在使用python/spark 2.1。我已将
数据
上
载到
表
中
。该
表
是一个充满字符串的单列。我希望对列
中
的每个元素应用一个映射函数。我将
表
加
载到
数据
帧
中
:我能看到的唯一方法是别人说的是将其转换为RDD以应用映射函数,然后返回到
浏览 1
提问于2017-07-31
得票数 18
回答已采纳
1
回答
从mysql到hbase的
数据
转换
、
、
我想把我的
数据
表
从MySql
数据
库转换成HBase。我将用java代码来实现。有什么办法可以做到这一点吗?我不会通过导入Tsv文件或
批量
文件来做到这一点。请帮帮我。
浏览 2
提问于2013-09-12
得票数 0
1
回答
DataSourceAttribute的工作原理
、
、
、
我定义了一个特定
表
的DataSource,如下面的代码所示:"Dsn=R10;Uid=sa;Pwd=Abcd1234@;IntegratedSecurity=True;Connect Timeout=30;User Instance=True;", DataAccessMethod.Sequential)] 当
数据
源从
表
中
获取
数据
时,它是将
表</e
浏览 1
提问于2014-03-03
得票数 3
2
回答
在
Azure sql
中
摄取和处理
数据
的选项
、
、
目前,我们使用调用存储过程的本地脚本将
数据
文件加
载到
Azure sql
数据
库
中
。我计划用ssis作业替换脚本,将
数据
加
载到
Azure Sql
中
,但考虑到我们的需求,这是否是一个好的选择,我也可以接受不同的建议。我们所经历的过程是在对活动
表
进行更新之前将
数据
文件加
载到
暂存
表
并进行验证。验证和更新是通过调用存储的procedures...so来完成的,ssis包将只加载
数据
并调用这些存
浏览 5
提问于2019-11-08
得票数 2
回答已采纳
1
回答
关于Spark sql
表
和
数据
库的问题
、
、
我是Spark的新手,对以下几点感到困惑:谢谢!
浏览 2
提问于2021-04-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
非 0即1,如何将庞大 Excel 数据表中的所有非 0 值批量替换为 1?
充分利用VBA,一键完成在多个EXCEL工作表中的批量大数据查询
如何从Pandas迁移到Spark?这8个问答解决你所有疑问
数据湖和SQL并不矛盾
Databricks与Snowflake创始人开撕:“未来十年数据仓库要么不存在要么大变样”
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券