腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Dask
和
numpy
-
在
numpy
数组
和
dask
数组
之间
的
缓慢
转换
、
、
、
我需要从一个大
的
numpy
数组
中保存一个
dask
数组
。下面是一个最小
的
工作示例,展示了该过程。请注意,a是使用
numpy
.random创建
的
,但不幸
的
是,我不能使用
dask
创建
数组
。import
numpy
as npfrom
dask
.distributed import Client a =
浏览 22
提问于2020-02-20
得票数 0
回答已采纳
1
回答
如何从戴面罩
的
阵列中清除面具?
、
、
在
中,有一个名为
的
类,对应于
NumPy
类。
NumPy
类具有getdata
和
getmask方法,这似乎也是
Dask
类应该有的;然而,我只能在getdata 中将
Dask
类
的
getmask提到为红色文本,当我试图
在
脚本中调用它时,我得到了那么,<em
浏览 11
提问于2022-08-01
得票数 0
回答已采纳
1
回答
Dask
:使用典型
的
numpy
索引更新
dask
数组
中
的
值时
的
赋值错误
、
、
我正在将代码
转换
为使用
dask
数组
而不是
numpy
数组
。# this used to be a
numpy
array, created like so:da =
dask
.array.zeros((total_months,)
浏览 2
提问于2018-10-22
得票数 1
回答已采纳
1
回答
延迟评估
Dask
数组
以避免临时性
我来自C++,习惯于使用表达式模板
的
库,其中
的
矩阵操作如下:不要创建临时文件
和
元素操作是
在
循环中完成
的
,而不会为右侧
的
操作创建临时矩阵对于
Dask
数组
,这是可能
的
吗?
Dask
的
“惰性评估”是否也是这样做
的
,或者这个术语只是指操作图
的
按需计算。 谢谢。
浏览 2
提问于2018-11-10
得票数 1
2
回答
从
Dask
到
Dask
阵列
的
Dask
袋
、
、
我需要将
dask
.Bag of {'imgs': np.array(img_list), 'lables': np.array(label_list)}
转换
成两个独立
的
dask
.Array-s。为什么我创建了袋子而不是直接去
数组
?因为我正在通过map()多次处理这个包,所以没有对Array做同样
的
处理。 现在,下面的代码适用于小型数据集,但显然不能用于更大
的
数据。= da.from_array(np.array([item[
浏览 4
提问于2017-11-28
得票数 3
回答已采纳
1
回答
用于
numpy
数组
的
free()
的
Python等价物?
、
、
、
我有许多需要存储为
dask
数组
的
大型
numpy
数组
。
在
尝试从.npy加载每个
数组
,然后将其
转换
为
dask
.array时,我注意到内存使用率几乎与常规
numpy
数组
一样多,即使
在
将arr加载到
dask
.array之后执行del arr之后也是如此。: 1 print(f'Array ref count after conversion: {sys.getr
浏览 2
提问于2021-07-23
得票数 0
1
回答
获取SON、DJF、MAM多年数据中95%
的
变量
、
、
、
我有一个45年
的
数据,名为ds,格式为netCDF(.nc)。它包含三个坐标:time、latitude
和
longitude。1972-01-01 ... 2017-12-31T23:00:00 FFDI (time, latitude, longitude) float32
dask
.array1525925611 Conventions: COARDS 我
浏览 24
提问于2019-03-01
得票数 2
回答已采纳
1
回答
Dask
元素
的
字符串连接
、
、
我需要通过连接两个
数组
(最好是
dask
数组
)为
dask
创建一个多索引。我为
numpy
找到了以下解决方案,但正在寻找
dask
解决方案 cols=100000 index = np.array([x1 + x2 +x3 for x1,x2,x3 in zip(repeat(1cols ).astype('str'),repeat('-',cols ),repeat(1,cols ).astype('str'))]) 如果我传递给它d
浏览 5
提问于2019-04-26
得票数 0
3
回答
dask
_ml线性回归多个常量列检测错误
、
、
、
、
我正在使用python与
dask
一起创建一个逻辑回归模型,以便在培训时加快速度。from
dask
_ml.linear_model impo
浏览 0
提问于2019-06-06
得票数 1
1
回答
平面文本文件中
的
分布式
dask
矩阵
、
、
、
、
我正在尝试将矩阵
的
平面文本文件(以制表符分隔)表示到
dask
数组
中,使用distributed将
数组
的
块分布到集群中。(旁白:这与PySpark
的
方法没有什么不同) 但是,我不清楚如何使用可用
的
工具将文本文件解析成矩阵结构。
在
PySpark中,我可以使用一个简单
的
map来完成这个任务,该map可以将空格上
的
每一行拆分,并将令牌
转换
为浮动列表,最后将列表
转换
为索引
的
浏览 1
提问于2016-06-03
得票数 1
回答已采纳
1
回答
避免Python回归多个常量列检测错误
、
、
、
、
我用python3
和
Dask
来拟合一个logistic回归模型。我有两个
numpy
数组
x,y,我使用这段代码将它们
转换
为
dask
数组
。data = da.from_array(data, chunks=(1000, data.shape[1]))然后 from
dask
_ml.linear_model找到了,这与
dask
有关,但我正在一个
数组
上进行训练。
浏览 0
提问于2019-06-13
得票数 0
1
回答
Dask
apply_along_axis误差与
Numpy
的
比较
、
、
、
我试图将一个函数应用到一个
Dask
数组
,,虽然相同
的
函数
在
numpy
数组
上工作,但它不工作
在
一个
Dask
数组
上。下面是一个示例:q =
numpy
.array([[1,2,3],[4,5,6]]) s =
numpy
.stack([w,q]
浏览 0
提问于2020-05-21
得票数 2
回答已采纳
1
回答
使用带有延迟项
数组
的
dask
.compute
目前,我可以创建(嵌套
的
)对象列表,这些对象是热切计算
的
项
和
延迟项
的
组合。我可以将这些
numpy
数组
传递给
dask
浏览 0
提问于2018-06-29
得票数 2
回答已采纳
1
回答
如何将
Dask
Dataframe
转换
为
Dask
Array?
、
、
、
我有一个
dask
dataframe对象,但是我希望有一个
dask
数组
。我怎样才能做到这一点?
浏览 0
提问于2018-08-31
得票数 6
2
回答
在
一个函数中支持xarray、
dask
和
numpy
数组
的
最干净
的
方法
、
、
、
我有一个函数,它接受多个2D
数组
,并创建两个形状相同
的
新
数组
。它最初是为了只支持
numpy
数组
而编写
的
,但是如果看到“块”属性,则会被“黑客攻击”以支持
dask
数组
。一个使用xarray DataArrays
的
用户指出,这个函数现在返回
dask
数组
,因为DataArray有一个“块”属性。我想知道
dask
/xarray专家是否能告诉我支持所有3(4)
的
最
浏览 0
提问于2018-08-09
得票数 3
回答已采纳
1
回答
何时使用
Dask
集合
的
酸洗方法
Dask
集合提供了像
和
这样
的
酸洗方法。尽管IIUC集合本身不会传输给工作人员。取而代之
的
是,图被提取、优化并
转换
为任务,然后
在
工作进程上(序列化数据依赖项,如Pandas
和
NumPy
数组
)。那么,这些
Dask
集合
的
酸洗方法
在
什么情况下实际使用呢?
浏览 6
提问于2020-05-28
得票数 0
2
回答
带
numpy
阵列
的
dask
袋折叠式
、
、
、
、
在对包含
numpy
数组
的
FutureWarning进行foldby操作时,我从
dask
/
numpy
获得了一条信息非常少
的
foldby消息。这会产生正确
的
结果,但也会从
NumPy
产生许多
NumPy
消息(看起来每个分区一条),尽管看起来它们似乎来自
dask
。
dask
/异步c.py:247: FutureWarning:元素级比较失败;返回标量,但将来将执行元素级比较返回函数(*a
浏览 5
提问于2017-05-05
得票数 3
回答已采纳
1
回答
是否有一种有效
的
方法,
在
每个样本
之间
用NaNs对一个
dask
或xarray进行抽样?
、
、
、
长话短说:长话短说:
在
物理上,两个
dask
阵列
的
值具有相同
的
时间维度(0到5秒),
浏览 0
提问于2019-09-13
得票数 1
2
回答
从列表
的
dask
.Series高效地创建
dask
.array
、
、
、
从列表
的
dask
.Series创建
dask
.array
的
最有效方法是什么?该系列由500万个元素列表300组成。它当前被划分为500个分区。np.array)(y) [delayed(list)(x)da = delayed(
dask
.array.concatenate)(pt, axis=1) da =
dask
.array.from_delayed(da, (vec
浏览 18
提问于2017-12-26
得票数 1
回答已采纳
1
回答
在
分布式派生函数内部调用dark时丢失本地客户端
我正在尝试
在
一个函数中执行一些任务操作,该函数通过分布式发送给工作人员。代码
的
简化版本是X_ =
dask
.array.from_array(...)X =
dask
.persist(X_) with distributed.local_client() as c: return
dask<
浏览 5
提问于2017-02-14
得票数 0
点击加载更多
相关
资讯
Python数据预处理:使用Dask和Numba并行化加速
Python入门:20个常用库和文档链接
处理数据,大数据甚至更大数据的 17 种策略
提升Python运行速度的必备工具清单
2019年AI学习纯干货:值得收藏的16 套机器学习和深度学习速查表
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券