腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
本地
计算
机上
运行
dask
时
,
是否
应该
创建
一个
`
client
`
对象
?
、
我
在
本地
计算
机上
运行
dask
分布式作业,我希望利用所有可用的cpus,而不关心诊断仪表板。在这种情况下
创建
Client
对象
有什么好处吗?我之所以这样问,是因为
在
脚本的启动过程中,
创建
这样
一个
对象
需要一些时间,而我想要缩短这段时间。
浏览 21
提问于2020-09-24
得票数 0
1
回答
DASK
dataframe.to_csv将文件存储
在
worker上,而不是
本地
、
我是
DASK
的新手,我正在尝试
在
私有云上建立
一个
分布式集群。现在,我
在
同一台机器上
运行
了调度器和
一个
工作程序,它们都
运行
在同一Docker容器中。() df.to_csv('data/*.csv') 我希望csv文件(1..30.csv)将在
本地
data目录中
创建
,即在我的
本地
计算
机上
的/home/my_user/loca
浏览 25
提问于2020-03-27
得票数 1
回答已采纳
1
回答
dask
.bag,我
应该
如何有效地对相同的数据
运行
多个
计算
我曾希望我可以通过以下模式
在
计算
中使用图形简化:example_stat_future = parsed.map(foo)parsed.map(bar).sum()example_stat, another_stat = compute(example_stat_future, another_stat_future)from json import loads, dumps from ti
浏览 4
提问于2017-02-21
得票数 1
1
回答
任务:
client
.persist和
client
.compute之间的区别
、
我对
client
.persist()和
client
.compute()之间的区别感到困惑,它们似乎(
在
某些情况下)都开始了我的
计算
,并且都返回异步
对象
,但在我的简单示例中并非如此:from
dask
.distributed import
Client
client
=
Client
() return a
浏览 3
提问于2017-01-23
得票数 22
回答已采纳
2
回答
Modin与
dask
冲突
、
、
、
我正在尝试modin,但是一直有
一个
错误:import pandas as pd df = pd.read_csv(PATH) mdf = md.read_csv(PATH) UserWarning:尚未初始化的
Dask
执行环境。正在初始化...若要删除此警告,请在执行dataframe操作之前
运行
以下python代码: from distributed import
Clien
浏览 7
提问于2021-05-16
得票数 0
1
回答
分布式工作进程上的
Dask
性能
、
我
在
试着决定是Spark还是
Dask
能给我们的工作带来更好的表现。我有
一个
简单的脚本,可以
在
DataFrame上
运行
一些操作。 def CreateTransactionFile(inputFile,
client
): df = dd.read_csv(hdfs ,
client
)
浏览 2
提问于2018-11-29
得票数 1
1
回答
无法从
本地
计算
机访问文件
时
使用
dask
.dataframe读取
、
我的数据存储
在
远程机器上。 我想
运行
并访问远程机器上的数据。为此,我
在
远程机器上
运行
了
一个
dask
-scheduler &
一个
dask
-worker。然后,我
在
我的笔记本电脑(
本地
机器)上
运行
了
一个
jupyter笔记本电脑,使用的是
client
=
Client
(‘schedular ip:8786’),但它仍然引用
本地
机器
浏览 31
提问于2021-09-26
得票数 2
1
回答
如何将
dask
数据文件保存到与
dask
剪切器/工人相同的机器上?
、
、
我试图通过Dataframe保存到与
Dask
调度程序/工作人员所在的同一台机器上。但是,我在这段时间里遇到了麻烦。My安装程序:我的python脚本
在
本地
计算
机(笔记本电脑16 GB RAM)上执行,但该脚本为
运行
在远程
计算
机上
的
Dask
调度程序(用于并行
计算
的具有400 GB RAM的服务器)
创建
了
Dask
客户端
Dask
调度程序和工作人员都位于同一台服务器上,因此它们都
浏览 2
提问于2019-12-20
得票数 2
回答已采纳
1
回答
如何在
dask
中并行化groupby()?
、
、
、
我试过了: df.groupby('name').agg('count').compute(num_workers=1) df.groupby('name').agg('count').compute(num_workers=4) 他们花了同样的时间,为什么num_workers不能工作? 谢谢
浏览 25
提问于2019-04-10
得票数 7
2
回答
如何使用从
dask
-scheduler到
dask
-worker的文件名
、
、
、
我正在设置
一个
实验,在这个实验中,我必须处理数百万个文件(图像),文件的完成顺序并不重要。我如何将任务传递给工人?from distributed import
Client
client
=
Client</
浏览 15
提问于2019-09-08
得票数 0
1
回答
dask
分布式数据模型上的慢len函数
、
、
、
我一直
在
测试如何使用
dask
(有20个核心的集群),我对调用len函数和切片遍历loc的速度感到惊讶。import
dask
.dataframe as dd
client
=
Client
('192.168.1.220:8786')所有的绿色框都与"from_pandas“相对应,而在Matthew 的这篇文章中,调用图看起来更好(调用len_chunk的速度要快得多
浏览 2
提问于2017-01-27
得票数 15
回答已采纳
1
回答
计算
()
在
dask
中做什么?
、
我对
dask
并不熟悉,也不知道
dask
中
计算
()方法到底做了什么?它是一种打印
对象
的方法吗?我从它的网站上读过文档,不确定我
是否
理解“具体价值”和“懒惰的达克”这两个术语。--您可以通过调用.compute()方法或
dask
.compute(.)将任何
dask
集合转换为具体值函数。这个函数将被阻塞,直到
计算
完成,直接从
一个
懒惰的
dask
集合到
本地
内存中的
一个
具体值。也就是说,当我<
浏览 5
提问于2019-11-05
得票数 0
回答已采纳
1
回答
是否
可以修改现有分布式客户端中的工作进程/线程数量?
、
、
我正在我的
本地
机器上用
dask
优化
一个
TPOT管道。我预计这将持续48小
时
甚至更长时间。
client
=
Client
(n_workers=1, threads_per_worker=6, memory_limit="14GB") 我想知道我
浏览 11
提问于2020-05-21
得票数 1
回答已采纳
1
回答
木星中的Array.compute()峰值存储器
、
、
、
、
我正在使用
dask
开发
一个
分布式集群,当将结果返回到
本地
进程
时
,我注意到了峰值内存消耗。
在
计算
过程中,达斯克
是否
有任何副本?或者木星实验室需要复制?import
dask
.array import
dask</e
浏览 2
提问于2022-03-04
得票数 1
回答已采纳
2
回答
连接到现有的Kubernetes
Dask
集群
、
、
、
、
使用,我
创建
了
一个
Dask
集群。
dask
01-worker-ccc-cccc 1/1 Running 0 3d19h现在,我想以某种方式将它连接
浏览 17
提问于2020-03-14
得票数 1
1
回答
在
dask
集群上
运行
自己的多线程函数
我
在
dask
集群上分发了许多这些函数调用。首先,我
在
主
机上
启动了
一个
调度程序:
dask
-scheduler。
client
=
Client
('tcp://scheduler:8786') forresult in
client</e
浏览 7
提问于2020-12-18
得票数 0
回答已采纳
1
回答
在
达斯克并行
运行
两次机器学习培训
、
、
我已经
在
码头上与工人一起实现了达斯克。我用
一个
Docker编写的文件启动了10名工人,如下所示:要
运行
两种模型的机器学习培训,我执行以下操作:X1 = data1[features1] X2 = data2[features2] with joblib.parallel_backend('
dask
我可以用工人1到5训练1,工人6到10训练2,但如何告
浏览 3
提问于2021-07-22
得票数 0
回答已采纳
1
回答
Dask
Dataframe错误:'Future‘
对象
没有'drop’属性
、
我是
Dask
的新手。我已经
创建
了
一个
dask
数据帧,使用drop命令删除了一些列。在此之后,我将执行其他操作。当我调用
计算
时
,得到错误:'Future‘
对象
没有'drop’属性。
在
drop命令之后立即调用
计算
()可以很好地工作,但是当我
在
之后调用它几个语句
时
,它会给出这个错误。请建议这里出了什么问题。 顺便说一下,我使用的是
在
本地
机器上分发的<
浏览 0
提问于2019-05-02
得票数 1
1
回答
使用clusterIP调度程序和端口转发在gke上安装
dask
-
在
python中
创建
dask
.distibuted客户端
时
tcp连接超时。
、
、
、
我尝试使用helm和tiller
在
gke集群上部署
dask
。我没有为我的集群
创建
外部IP的权限,所以我将
dask
调度程序设置为clusterIP,而不是负载平衡器。然后,我使用kubectl提供端口转发,将
dask
scehduler服务转发到我的
本地
机器。我有
一个
python代码(
一个
简单的
dask
示例),其中我希望将分布式客户端连接到
dask
调度程序的(转发) tcp端口,并在我的gke集群中启动
计算</
浏览 3
提问于2020-12-13
得票数 2
回答已采纳
2
回答
Dask
-如何连接到正在
运行
的集群调度程序并访问'total_occupancy'?
、
、
、
我使用以下代码从Jupyter笔记本
创建
本地
集群:c =
Client
(cluster) 当内核被占用(
计算
操作)
时
,
是否
可以从另
一个
笔记本进行连接?
浏览 20
提问于2020-02-07
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Dask:并行计算的灵活解决方案,用完都说好神奇!
Ray 分布式计算框架详解
百万TPS不可信?测量区块链性能的工具Hyperledger Caliper
使用 Dask在Python 中进行并行计算
【创宇小课堂】RMI基础
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券