腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Dask
在
单个
数据
上
运行
令人
尴尬
的
并行
操作
、
、
、
我正在学习this教程,我能够
并行
化一个for循环,在这个循环中,
操作
是
在
多个文件
上
独立完成
的
。但是,现在我需要执行一个迭代函数,将变量从
单个
xarray
数据
集(源)提取到300个文件中。return('finished') 我设置了6个工作线程,为了
在
一个循环中
运行
这个函数300次,我实现了: source = xr.opendataset()for(*build_dela
浏览 8
提问于2020-07-20
得票数 1
回答已采纳
1
回答
包含json格式列
的
Dask
数据
帧
、
、
我有一个包含json格式列
的
dask
dataframe,我希望将该列解析为dataframe格式。json格式
的
列如下所示:所以我只想提取"Name“
的
值,并使它们中
的
每个键都是一个列,每个值都是其中
的
一个值我想我们可以通过read_json将json文件读入
dask
dataf
浏览 5
提问于2020-05-14
得票数 2
1
回答
如何防止达克客户因工人异常而死亡?
我不了解
dask
分布式系统中
的
弹性模型。工人提出
的
异常会杀死
令人
尴尬
的
并行
dask
操作
。如果任何员工遇到异常,所有员工和客户都会死亡。任何收集该结果
的
尝试或任何依赖
的
结果都会导致exception...This不会以任何方式影响调度程序或工作人员
的
顺利
运行
。”我在这里跟踪一个
令人
尴尬
的
并行</e
浏览 1
提问于2018-12-22
得票数 0
2
回答
不带酸菜
的
并行
化
、
、
、
Alex Gaynor在他
的
talk 中解释了pickle
的
一些问题,包括安全性、可靠性和人类可读性。我通常对我
的
python程序中
的
数据
使用
pickle很谨慎。一般来说,我更喜欢
使用
json或其他由我自己指定
的
序列化格式手动传递我
的
数据
。 我感兴趣
的
情况是:我
在
我
的
python程序中收集了一些
数据
,我想在它
上
并行</e
浏览 0
提问于2018-11-27
得票数 2
1
回答
使用
Joblib+
Dask
将许多子进程派生到HPC
上
的
许多不同节点。
、
、
、
、
我正在尝试
运行
一个python程序,该程序
在
某一时刻执行许多(数千)
令人
尴尬
的
并行
进程,这些进程是以对其他软件
的
子进程调用
的
形式出现
的
。我
在
一个跨越多个不同节点
的
slurm集群
上
运行
,每个节点都有多个核心。 我
使用
过mpi4py,但代码中
的
延迟导致我转向
使用
joblib。Joblib似乎是
并行
浏览 17
提问于2019-04-03
得票数 2
3
回答
向量化和
令人
尴尬
的
并行
之间有什么关系?
在我看来,向量化与
令人
尴尬
的
并行
问题密切相关。换句话说,所有可向量化
的
程序都必须是
令人
尴尬
的
并行
程序。这是正确
的
吗?
浏览 0
提问于2013-01-10
得票数 4
1
回答
在
每个工作人员
上
执行不可序列化
的
对象。
、
、
、
调用result.compute(get=
dask
.async.get_sync)和result.compute(
dask
.threaded.get)都是有效
的
。但是,result.compute(
dask
.multiprocessing.get)不会并生成以下错误:
浏览 10
提问于2016-11-03
得票数 1
回答已采纳
1
回答
两个
Dask
阵列末端冻结
的
计算
、
我已经生成了两个长度为450,000,000
的
随机
dask
数组,我想把它们除以另一个。当我去计算它们时,计算总是
在
最后冻结。tornado.iostream.StreamClosedError: Stream is closed 我希
浏览 0
提问于2018-12-22
得票数 1
回答已采纳
2
回答
复制SQL
数据
库
的
完成延迟?
、
、
、
我想知道
在
SQL
上
完成一个需要多少时间。我正在考虑一种情况,即: 是否有人有关于完成SQL Azure
数据
库副本
的
延迟信息,可能是
数据
库GB大
浏览 5
提问于2012-08-08
得票数 0
2
回答
XGBoost是如何进行
并行
计算
的
?
XGBoost
使用
加性训练
的
方法,其中它对前一个模型
的
残差进行建模。 这是顺序
的
,那么如何进行
并行
计算呢?
浏览 6
提问于2015-12-08
得票数 41
回答已采纳
1
回答
使用
dask
进行分块
的
并行
工作负载
令人
尴尬
、
、
、
我正在尝试
使用
dask
来处理
令人
尴尬
的
并行
工作负载。 例如,对两个大型数组逐个元素求和: x1 = ... sleep(0.001 + len(a) * 1e-5) return a + b + 1 我找到了1似乎回答了这个问题,然而,我
的
函数并不是那么昂贵,并且可以一次计算任意数量
的
数据
我真的很想把
数据
分块来避免OOM,而
dask
.a
浏览 30
提问于2021-11-11
得票数 0
1
回答
选择子集后将其转换为pandas时,
Dask
dataframe内存不足
、
、
、
、
所以我有一个包含160M记录和240列
的
拼图文件。因此,我
使用
dask
在
python中
使用
EMR CLuster m5.12xlarge加载它。这只需要几秒
的
时间来执行,并
使用
大约1.5 GB
的
内存。a_count = a_count.compute() 现在,在其中一列中,我希望所有记录
的
值都为null,然后执行与前面相同
的
操作
,即value count。现在,我试图通过计算将其转换为pandas
浏览 1
提问于2021-09-23
得票数 0
1
回答
什么是一些简单
的
、
令人
尴尬
的
并行
算法?
、
我正在为编写一个测试应用程序,我需要一个简单
的
、
令人
尴尬
的
并行
算法,该算法易于理解,但比向输入中添加一个算法稍微简单一些。有什么想法吗?
浏览 1
提问于2012-04-24
得票数 2
2
回答
dask
能从csv文件中读取
数据
吗?
、
、
、
我正在将一个大
的
文本文件转换为hdf存储,希望能更快地访问
数据
。转换可以正常工作,但是从csv文件读取不是
并行
完成
的
。它真的很慢(
在
SSD上一个1 1GB
的
文本文件大约需要30分钟,所以我猜它不是IO绑定
的
)。df = d
浏览 3
提问于2016-10-18
得票数 29
回答已采纳
3
回答
Erlang是只为
在
单台多核机器
上
运行
而设计
的
,还是可以分发进程?
、
、
、
我
的
应用程序
在
我
的
四核机器
上
运行
得很好。它是“
令人
尴尬
的
并行
”,大约有100K进程,因此非常适合在一群机器
上
运行
。但是,我很难找到关于如何在集群中
的
所有可用节点
上
分布所有这些进程
的
文档。分布式Erlang
的
文档似乎侧重于服务器-客户端应用程序,其中每个节点都是
运行
单个
应用程序
的</em
浏览 0
提问于2009-04-19
得票数 2
回答已采纳
1
回答
多处理vs
运行
几个Python解释器
、
对于长期
运行
的
、
令人
尴尬
的
并行
任务,
使用
多处理与
并行
运行
多个python解释器有什么好处吗?目前,我正在启动几个python解释器,它们对输入
数据
进行分析,每个解释器都将结果转储到一个单独
的
泡菜文件中。对输入
数据
进行切片和组合结果是非常简单
的
。为此,我
在
OS和linux
上
使用
python3.4。 用多处理模块重
浏览 2
提问于2015-06-12
得票数 1
回答已采纳
2
回答
如何用
Dask
编程模具
、
在
许多情况下,科学家用模版模拟系统
的
动力学,这是将一个数学运算符转移到一个网格
上
。通常,这种
操作
消耗了大量
的
计算资源。是这个想法
的
一个很好
的
解释。
在
numpy中,编写2D 5点模板
的
规范方法如下: for j in range(cols): grid[i, j] = ( grid[i,j] + grid[i-1,j] + grid[i+1,j] + grid[i,j-
浏览 2
提问于2016-10-18
得票数 4
回答已采纳
1
回答
在
什么情况下,我可以
使用
Dask
而不是Apache?
、
、
、
我目前正在
使用
Pandas和星火进行
数据
分析。我发现
Dask
提供
并行
化
的
NumPy数组和Pandas DataFrame。
Dask
提供
并行
数组、
数据
帧、机器学习和自定义算法。
Dask
浏览 4
提问于2016-08-10
得票数 101
1
回答
使用
从拼花文件创建
的
dataframe时内存
使用
量过高
、
当我尝试执行像
dask
_train_df.head()或
dask
_train_df.loc[2:4].compute()这样
的
简单
操作
时,我会得到内存错误,即使是
使用
17+ GB
的
内存。1)因此,我
的
问题是,为什么这些简单
的
操作
会
使用
Dask
Dataframe来破坏内存
的
使用
,但是当我
使用
Pandas Dataframe将所有内容加载到内存中时
浏览 0
提问于2018-12-24
得票数 6
回答已采纳
1
回答
在任务之间保留
的
达克-工作者内存
、
、
、
简介 提示工作人员
使用
的
部分RAM是不同文件之
浏览 0
提问于2018-12-23
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据预处理:使用Dask和Numba并行化加速
使用 Dask在Python 中进行并行计算
几个方法帮你加快Python运行速度
Dask:并行计算的灵活解决方案,用完都说好神奇!
如何只用一行代码让 Pandas 加速四倍?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券