使用spark运行rapids时nvvp时间线中的间隙

文章/答案/技术大牛

发布

1回答

、

我正在对使用tpch-dbgen生成的CSV运行一些sql查询。为了简单起见，我用一个线程/任务运行它，并查看时间线中的间隙，如所附图像所示。是磁盘操作吗？这种开销能以某种方式放松或优化吗？

浏览 17提问于2021-06-21得票数 0

1回答

运行pyspark时获取Java输出

、、、

当我在Ubuntu上的Jupyter Notebook中运行PySpark时，我有时会遇到Java失败的问题。我为什么需要这些日志的例子是，例如，我试图在DGX-1机器上的PySpark上运行Rapids，但它在初始化Spark Context时以类似abo的Java崩溃而结束。import pysparkcudf = "cudf-0.17-cuda

浏览 7提问于2021-02-02得票数 0

3回答

火花急流-操作不被GPU版本所取代

、、

我刚接触过Rapids，很难理解支持的操作。我有以下格式的数据：| kmer|source_seq||TGTCGGTTTAACAAGAAAAAAAA| 5|+------------+----------+ 我试图找出哪个“kmer”有哪个“source_seq”，使用以下代码但是，查看查询计划，很容易看到collect_list不是

浏览 0提问于2021-05-20得票数 1

回答已采纳

1回答

如何将事件、度量和源级结果关联起来，以便使用nvvp分析pyCUDA程序。

、、

当我尝试使用nvvp对我的pyCUDA应用程序进行分析时，它在很大程度上起作用。我可以点击“检查GPU的使用情况”，查看我的代码的许多分析结果/建议，比如“低计算/内存效率”。但是，每当nvvp运行程序来执行分析时，我都会看到以下警告。一些收集的事件、度量或源级结果不能与会话时间线相关联。这可能会阻止将事件、度量和源级别的结果分配给某些内核

浏览 6提问于2015-12-07得票数 1

2回答

我正在使用一个带有2xNVidia A100 GPU的Ubuntu20.04.4服务器。Spark (3.3.0)正常工作，但是当我试图通过RAPIDS使用GPU时，它只是一直在等待，而没有加载数据。我试着以CSV和parquet文件的形式加载数据，但是失败了。我正在调用GPU的当前方式如下所示，尽管我尝试了许多在互联网上可以找到的组合。我还使用spark-submit提交作业，这导致了如下所示的问

浏览 7提问于2022-08-08得票数 0

回答已采纳

1回答

NVIDIA Visual :内核边界数据不足

、、

我试图获得一些洞察力，为什么我的CUDA内核有一个相对低的性能，我希望得到一些答案与NVIDIA分析器。我的CUDA程序是一个更大的应用程序的“简化”版本，它隔离并运行了所讨论的内核。该程序多次启动内核，以度量其在多次启动时的平均执行时间。定时循环之后，将发出从设备到主机的内存副本，以确保所有内核调用都已完成。该程序是用CUDA C++编写的。--------------+------------

浏览 6提问于2020-08-18得票数 0

回答已采纳

1回答

未显示“已实现占用”列是Nsight分析结果。

、、

我遇到了一个对我来说很奇怪的问题。在Nsight性能分析输出中，我看不到已实现的占用率列。我正在使用Geforce 920米GPU，NVIDIA 425.31版本的驱动程序，Nsight版本的6.0.0.18296和visual 2017。Nsight的版本和司机的兼容，有人能帮我吗？我使用Nsight性能分析和CUDA跟踪检查如下：我也使用了Visual，但在那里也看不到已实现的占用率

浏览 0提问于2020-06-25得票数 1

回答已采纳

1回答

是否可以在设备功能中同时启动多个流？

两种情况下的输出是相同的。唯一的区别是：在第二种情况下，不存在Stream2和Stream3。

浏览 1提问于2016-09-08得票数 0

回答已采纳

2回答

CUDA Visual Profiler不生成时间线

我正在尝试确定在我的GPU代码中哪里发生了减速。我已经验证了代码本身是正确运行的(它没有抛出任何错误，输出是正确的，干净地结束，等等)。当我尝试在Visual Profiler中分析代码时，它似乎运行正常，将正确的中间输出转储到stdout。正在使用图形处理器(我已经与cuda-gdb进行了核对，并从我的内核中转储了printf())。完成所有代码后，Visual Profiler将报告viper已终止可执行文件。但

浏览 2提问于2012-08-01得票数 2

回答已采纳

1回答

如何从ML库(如DataFrame或Tensorflow )访问GPU中的火花PyTorch数据

、、、、

目前，我正在研究如何使用ApacheSpark3.0和Rapids加速。在官方的spark-rapids文档中，我遇到了，它声明：在某些情况下，您可能希望访问GPU上的原始数据，最好不要复制它。对我来说，这听起来好像可以使GPU上已经可以从上游的Spark进程中获得的数据直接提供给诸如Tensorflow或PyTorch这样的框架。如果是这样的话，我如何从这些框架中</

浏览 4提问于2021-01-04得票数 1

回答已采纳

3回答

当我在终端中运行代码时，我看到当我使用nvprof --metrics SOME_METRICS -o e.nvvp ./element_access分析它时，我看到内核持续时间是2.95 us。它们是两个不同的东西吗？或者还遗漏了什么？

浏览 30提问于2019-11-01得票数 2

点击加载更多