腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(8364)
视频
沙龙
1
回答
使用
spark
运行
rapids
时
nvvp
时间线
中
的
间隙
、
我正在对
使用
tpch-dbgen生成
的
CSV
运行
一些sql查询。为了简单起见,我用一个线程/任务
运行
它,并查看
时间线
中
的
间隙
,如所附图像所示。是磁盘操作吗?这种开销能以某种方式放松或优化吗?
浏览 17
提问于2021-06-21
得票数 0
1
回答
运行
pyspark
时
获取Java输出
、
、
、
当我在Ubuntu上
的
Jupyter Notebook
中
运行
PySpark
时
,我有时会遇到Java失败
的
问题。我为什么需要这些日志
的
例子是,例如,我试图在DGX-1机器上
的
PySpark上
运行
Rapids
,但它在初始化
Spark
Context
时
以类似abo
的
Java崩溃而结束。import pysparkcudf = "cudf-0.17-cuda
浏览 7
提问于2021-02-02
得票数 0
3
回答
火花急流-操作不被GPU版本所取代
、
、
我刚接触过
Rapids
,很难理解支持
的
操作。我有以下格式
的
数据:| kmer|source_seq||TGTCGGTTTAACAAGAAAAAAAA| 5|+------------+----------+ 我试图找出哪个“kmer”有哪个“source_seq”,
使用
以下代码但是,查看查询计划,很容易看到collect_list不是
浏览 0
提问于2021-05-20
得票数 1
回答已采纳
1
回答
如何将事件、度量和源级结果关联起来,以便
使用
nvvp
分析pyCUDA程序。
、
、
当我尝试
使用
nvvp
对我
的
pyCUDA应用程序进行分析
时
,它在很大程度上起作用。我可以点击“检查GPU
的
使用
情况”,查看我
的
代码
的
许多分析结果/建议,比如“低计算/内存效率”。但是,每当
nvvp
运行
程序来执行分析
时
,我都会看到以下警告。 一些收集
的
事件、度量或源级结果不能与会话
时间线
相关联。这可能会阻止将事件、度量和源级别的结果分配给某些内核
浏览 6
提问于2015-12-07
得票数 1
2
回答
火花急流不加载( CSV不支持文件格式错误,拼板没有错误)
、
、
我正在
使用
一个带有2xNVidia A100 GPU
的
Ubuntu20.04.4服务器。
Spark
(3.3.0)正常工作,但是当我试图通过
RAPIDS
使用
GPU
时
,它只是一直在等待,而没有加载数据。我试着以CSV和parquet文件
的
形式加载数据,但是失败了。我正在调用GPU的当前方式如下所示,尽管我尝试了许多在互联网上可以找到
的
组合。我还
使用
spark
-submit提交作业,这导致了如下所示
的
问
浏览 7
提问于2022-08-08
得票数 0
回答已采纳
1
回答
NVIDIA Visual :内核边界数据不足
、
、
我试图获得一些洞察力,为什么我
的
CUDA内核有一个相对低
的
性能,我希望得到一些答案与NVIDIA分析器。 我
的
CUDA程序是一个更大
的
应用程序
的
“简化”版本,它隔离并
运行
了所讨论
的
内核。该程序多次启动内核,以度量其在多次启动
时
的
平均执行时间。定时循环之后,将发出从设备到主机
的
内存副本,以确保所有内核调用都已完成。该程序是用CUDA C++编写
的
。--------------+------------
浏览 6
提问于2020-08-18
得票数 0
回答已采纳
1
回答
未显示“已实现占用”列是Nsight分析结果。
、
、
我遇到了一个对我来说很奇怪
的
问题。在Nsight性能分析输出
中
,我看不到已实现
的
占用率列。我正在
使用
Geforce 920米GPU,NVIDIA 425.31版本
的
驱动程序,Nsight版本
的
6.0.0.18296和visual 2017。Nsight
的
版本和司机
的
兼容,有人能帮我吗?我
使用
Nsight性能分析和CUDA跟踪检查如下:我也
使用
了Visual,但在那里也看不到已实现
的
占用率
浏览 0
提问于2020-06-25
得票数 1
回答已采纳
1
回答
是否可以在设备功能
中
同时启动多个流?
两种情况下
的
输出是相同
的
。唯一
的
区别是:在第二种情况下,不存在Stream2和Stream3。
浏览 1
提问于2016-09-08
得票数 0
回答已采纳
2
回答
CUDA Visual Profiler不生成
时间线
我正在尝试确定在我
的
GPU代码
中
哪里发生了减速。我已经验证了代码本身是正确
运行
的
(它没有抛出任何错误,输出是正确
的
,干净地结束,等等)。当我尝试在Visual Profiler中分析代码
时
,它似乎
运行
正常,将正确
的
中间输出转储到stdout。正在
使用
图形处理器(我已经与cuda-gdb进行了核对,并从我
的
内核中转储了printf())。完成所有代码后,Visual Profiler将报告viper已终止可执行文件。但
浏览 2
提问于2012-08-01
得票数 2
回答已采纳
1
回答
如何从ML库(如DataFrame或Tensorflow )访问GPU
中
的
火花PyTorch数据
、
、
、
、
目前,我正在研究如何
使用
ApacheSpark3.0和
Rapids
加速。在官方
的
spark
-
rapids
文档
中
,我遇到了,它声明: 在某些情况下,您可能希望访问GPU上
的
原始数据,最好不要复制它。对我来说,这听起来好像可以使GPU上已经可以从上游
的
Spark
进程
中
获得
的
数据直接提供给诸如Tensorflow或PyTorch这样
的
框架。如果是这样的话,我如何从这些框架
中</
浏览 4
提问于2021-01-04
得票数 1
回答已采纳
3
回答
在databricks上安装cudf
、
我正在尝试在databricks上
使用
cudf。我开始关注https://medium.com/
rapids
-ai/
rapids
-can-now-be-accessed-on-databricks-unified-analytics-platform但是init脚本链接是断开
的
。然后,我
使用
这个链接(https://github.com/rapidsai/
spark
-examples/blob
浏览 30
提问于2020-10-23
得票数 2
1
回答
如何停止
运行
TensorRT服务器而不
使用
ctrl-c (用于
使用
nvprof进行分析)
、
、
、
、
我正在
运行
nvprof来分析TensorRT服务器-客户机模型
的
GPU
使用
情况。我正在做
的
事情是: 在与第一步相同
的
码头容器
中
在第当第三步完成
时
,客户端正常存在,但服务器和nvprof仍在
运行
。因此,我自然地用ctrl关闭了T
浏览 4
提问于2020-03-16
得票数 0
回答已采纳
1
回答
在CUDA 6.5
中
用
nvvp
分析PyCUDA代码
、
、
、
从过去
的
StackOverflow问题(例如,和)来看,人们应该能够
使用
nvvp
来分析PyCUDA程序。当我尝试在一个
运行
在命令行
中
没有任何问题
的
PyCUDA脚本上
运行
CUDA6.5
中
的
nvvp
时
,分析失败了,出现了以下错误:org.eclipse.core.rntime.CoreException: Reference to unde
浏览 2
提问于2014-09-17
得票数 0
回答已采纳
1
回答
NVIDIA可视化分析器不会生成
时间线
。
、
、
我
的
问题几乎与以前在这里提出
的
问题相同。不过,当局并没有就此作出答覆,因此,我现另问一项问题。 我在Windows-7操作系统上
使用
CUDA 7.0工具包.我用
的
是VS-2013。我试着生成向量加法样本程序
的
时间线
,它成功了。但是,当我按照完全相同
的
步骤生成自己代码
的
时间线
时
,它会继续显示一条消息“
运行
应用程序生成
时间线
”。我知道内核会被调用,而且一切都正常。下面的代码不
使
浏览 2
提问于2015-07-15
得票数 1
回答已采纳
1
回答
多CUDA核
的
时间测量
、
如何测量多个CUDA内核
的
特定时间?我已经试过这种方法了。cudaEventRecord(tic4, 0);我得到
的
第一个结果是正确
的
浏览 0
提问于2017-10-24
得票数 0
2
回答
我可以在C源代码级别分析OpenACC内核吗?
、
、
、
、
我正试图用openacc和PGI 15.7编译器加速我
的
代码.但是,我无法得到基于行
的
分析,而只能进行“内核”级别分析。(例如,ma
浏览 6
提问于2015-09-08
得票数 0
回答已采纳
1
回答
如何在无头节点上分析CUDA代码?
、
、
、
到目前为止,我所
使用
的
只是命令行分析器nvprof,它只显示汇总
的
统计数据。然后,我将输出文件复制到我
的
笔记本上,
浏览 4
提问于2017-11-07
得票数 0
回答已采纳
1
回答
ubuntu中有没有针对cuda
的
命令行分析工具??(类似于parallel Nsight)
、
、
谁能告诉我一些可以在ubuntu命令行上
使用
的
cuda分析工具??我正在SSH安全Shell客户端上工作,以便在远程linux机器上
运行
我
的
程序。
浏览 0
提问于2013-03-21
得票数 2
回答已采纳
1
回答
火花作业与Google Dataproc不兼容。
、
、
我有这段代码,
运行
了几个月,并在大约2个月前停止
使用
,尽管我没有更改一行代码。我只需用几行代码就可以重现这个bug,所以我不必发布大量
的
代码:JavaSparkContext(SparkSubmit.scala)sparkConf.setMaster("local[2]")(a,a1) (a,
浏览 5
提问于2016-09-28
得票数 1
回答已采纳
1
回答
cudaEventElapsedTime和nvprof
运行
时
当我在终端
中
运行
代码
时
,我看到当我
使用
nvprof --metrics SOME_METRICS -o e.
nvvp
./element_access分析它
时
,我看到内核持续时间是2.95 us。它们是两个不同
的
东西吗?或者还遗漏了什么?
浏览 30
提问于2019-11-01
得票数 2
点击加载更多
相关
资讯
比Spark快100倍的GPU加速SQL引擎!BlazingSQL开源了
Cloudera通过NVIDIA增强了企业数据云
NVIDIA宣布RAPIDS、医学影像应用和面向自动驾驶汽车的驾驶模拟器
基于NVIDIA GPU和RAPIDS加速Spark 3.0
如何在 GPU 上加速数据科学
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券