将15MB模型应用于3kB图像需要1-4 4GB的GPU内存，这让我感到惊讶吗？

对于将15MB模型应用于3kB图像需要1-4GB的GPU内存这一情况，我并不感到惊讶。这是因为在深度学习和机器学习领域中，模型的大小和输入数据的大小并不一定成正比关系。

首先，模型的大小与其参数数量和架构复杂度有关，而与输入数据的大小无直接关系。一个模型的参数数量越多，其在推理过程中所需的内存也就越多。因此，一个15MB的模型可能拥有大量的参数，导致在应用于图像时需要较大的内存。

其次，输入数据的大小并不代表模型所需内存的大小。在深度学习中，输入数据通常会经过预处理和特征提取的步骤，转换为模型所需的特定格式。这个特定格式的表示可能会占用更多的内存，尤其是在图像处理中，可能需要将图像转换为张量或其他形式的表示。

另外，GPU内存的使用也与模型的推理过程中所需的计算量有关。一些复杂的模型可能需要更多的计算资源来处理输入数据，因此需要更多的GPU内存来存储中间结果和计算过程中的临时变量。

综上所述，对于将15MB模型应用于3kB图像需要1-4GB的GPU内存这一情况，虽然看起来比较奇怪，但在深度学习和机器学习领域中，这并不罕见。为了更好地应对这种情况，可以考虑使用模型压缩技术、量化技术或模型裁剪等方法来减小模型的内存占用，以及优化算法和计算图结构来减少计算量和内存使用。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Jeff Dean、李飞飞等发起SysML大会，Jeff Dean主题演讲：系统与机器学习融合（45PPT）

这是一个宏大的目标，也是挑战，正如Jeff Dean演讲PPT所示，现在上传到arXiv的论文数量已经超过了摩尔定律的增长；直接在ML模型里批处理（batching），也常常让“让他感到头痛”。...这是一个宏大的目标，也是挑战，正如Jeff Dean演讲PPT所示，现在上传到arXiv的论文数量已经超过了摩尔定律的增长；直接在ML模型里批处理（batching），也常常让“让他感到头痛”。 ?...Jeff Dean说，因为不得不直接在ML模型中进行批处理（batching），他常常感到很头痛。极低精度训练（1-4位权重，1-4位激活）能否适用于通用问题？我们应该如何处理疏密混合的专家路由？...让不同的机器计算不同的模型，或者模型的不同部分，就避免了单台机器内存不足的问题，将来让模型扩展到更多机器上也更加方便。 ? 但是，如何将模型分布到不同机器上并且取得好的性能是很难的。...他们将神经网络应用于三种索引类型：B树，用于处理范围查询；哈希映射（Hash-map），用于点查找查询；以及Bloom-filter，用于设置包含检查。 B-tree实际上可以看做模型。

1.5K8 0

英伟达黄仁勋发布全球最大GPU，超300斤，汽车后备箱大小 | GTC2018

本次大会的四大主题图像、科学、AI、机器人 “今天，我们将讨论令人惊讶的图像，令人惊讶的科学，令人惊讶的人工智能和令人惊讶的机器人。”...它的创新之处是带有一个名为NVLink 2 的全新连接点，这一连接将编程和内存模型从一个GPU扩展到第二个，从而链接起来，使它们像一整个GPU那样工作。...这两个GPU共有10,000个CUDA内核，236个teraflops的Tensor Cores和64GB内存。...正是因为基于GPU的计算技术发展，现在可以比以前更好地重建图像，通过渲染来释放更多洞察力并迅速可视化图像。...黄教主说，英伟达在现代医学成像方面所做的工作是他最感到自豪的事情之一。 DGX-2——世界最大GPU诞生！

8263 0

利用GPU和Caffe训练神经网络

本文为利用GPU和Caffe训练神经网络的实战教程，介绍了根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练一种多层前馈网络模型的方法，如何将模型应用于新数据，以及如何将网络图和训练权值可视化。...不过，在大多数情况下，这没有太大的问题，因为Caffe提供的框架相当强大，并且不断进步。这篇文章的主题由一种多层前馈网络组成。该模型将根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练。...我们还关注将模型应用于新数据，以及如何将网络图（network graph）和训练得到的权值可视化。限于篇幅，本文不会解释所有的细节。另外，简单的代码比一千多字的话更有说服力。...一开始我犯错将浮点型数据分配到data中，从而导致该模型不学习任何东西。在将Datum存储到LMDB之前，你需要将对象序列化成一个字节的字符串表示。...这绝对是高性能深度学习的好工具。如果你想要做图像处理和卷积神经网络，我建议你看看NVIDIA DIGITS，它会为你提供一个舒适的GUI来实现目标。

1.2K10 0

让SD跟Midjourney一样简单易用！(37)

令人印象深刻 - 如今，配备3060的笔记本电脑通常价格非常可以接受。请注意，最低要求是4GB Nvidia GPU内存（4GB VRAM）和8GB系统内存（8GB RAM）。...这需要使用Microsoft的虚拟交换技术，在大多数情况下，您的 Windows 安装会自动启用该技术，因此您通常不需要对此执行任何操作。...Fooocus提供简单的工作流程，用户可以输入正面提示、设置图像分辨率、指定生成图像的数量，还可以定义SEED编码，以及添加负面提示。...只需点击“生成”按钮，Fooocus就能根据提供的输入生成你需要的图像。根据用户的显卡性能，Fooocus提供了速度优先和质量优先的选项。用户可以根据自己的喜好进行选择，使软件适应不同的硬件配置。...Fooocus会继续发展加入Controlnet，这是可以预见的。更多开源的绘图工具会降低AI绘图的门槛，让需要的人都能用AI成为自己的生产力，快去试试吧！

9756 0

利用GPU和Caffe训练神经网络

【编者按】本文为利用GPU和Caffe训练神经网络的实战教程，介绍了根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练一种多层前馈网络模型的方法，如何将模型应用于新数据，以及如何将网络图和训练权值可视化...不过，在大多数情况下，这没有太大的问题，因为Caffe提供的框架相当强大，并且不断进步。这篇文章的主题由一种多层前馈网络组成。该模型将根据Kaggle的“奥托集团产品分类挑战赛”的数据进行训练。...我们还关注将模型应用于新数据，以及如何将网络图（network graph）和训练得到的权值可视化。限于篇幅，本文不会解释所有的细节。另外，简单的代码比一千多字的话更有说服力。...一开始我犯错将浮点型数据分配到data中，从而导致该模型不学习任何东西。在将Datum存储到LMDB之前，你需要将对象序列化成一个字节的字符串表示。...这绝对是高性能深度学习的好工具。如果你想要做图像处理和卷积神经网络，我建议你看看NVIDIA DIGITS，它会为你提供一个舒适的GUI来实现目标。

7895 0

【支撑20亿人的机器学习】Jeff Dean、贾扬清等ScaledML大会演讲

此外，我们还需要采用其他高效利用内存的算法，比如用计算换存储，以及可逆模型（reversible models）。...从去年底到现在，再次将训练时间缩短。今年下半年，谷歌计划增加一个集群选项，让云客户将多个TPU聚合成一个“Pod”，速度达到petaflop的范围。...Jeff Dean说，因为不得不直接在ML模型中进行批处理（batching），他常常感到很头痛。极低精度训练（1-4位权重，1-4位激活）能否适用于通用问题？我们应该如何处理疏密混合的专家路由？...让不同的机器计算不同的模型，或者模型的不同部分，就避免了单台机器内存不足的问题，将来让模型扩展到更多机器上也更加方便。但是，如何将模型分布到不同机器上并且取得好的性能是很难的。...他们将神经网络应用于三种索引类型：B树，用于处理范围查询；哈希映射（Hash-map），用于点查找查询；以及Bloom-filter，用于设置包含检查。 B-tree实际上可以看做模型。

7156 0

详解AI加速器（一）：2012年的AlexNet到底做对了什么？

在这场比赛中，参赛者需要完成一个名叫「object region」的任务，即给定一张包含某目标的图像和一串目标类别（如飞机、瓶子、猫），每个团队的实现都需要识别出图像中的目标属于哪个类。...这是计算机视觉史上的一个关键时刻，也激发了人们将深度学习应用于其他领域（如 NLP、机器人、推荐系统）的兴趣。 ImageNet 挑战赛冠军团队的分类错误率逐年变化情况（越低越好）。...如果没有能在合理的时间框架内处理所有数据的计算能力，我们就不会看到深度学习应用的广泛采用。如果我是一名 AI 从业者，我需要关心处理器吗？...如果你非常熟悉底层硬件以及如何调试性能，那么你的推理和训练时间就会发生变化，你会对此感到惊讶。各种并行化技术对于矩阵乘法的加速效果。...你需要知道可用的处理元素的数量（如 GPU 处理核心）、你的程序需要的内存数量、你的程序所展示的内存访问模式和数据重用类型，以及计算图中不同部分之间的关系。

7132 0

2020年AI如何走？Jeff Dean和其他四位“大神”已做预测！

“如果想想过去的五六年，我们其实只关注了准确性，以及像‘NVIDIA的模型更准确吗？Facebook的模型更准确吗？’...让Kidd在2019年感到惊讶的是，很多神经网络创建者有时会轻易贬低自己、或其他研究人员的工作，因为他们的网络无法做到婴儿都能做的事情。...她说，适于传递信息的区域，介于一个人以前的兴趣和理解，以及让他们感到惊讶的东西之间。人们倾向于较少参与太多令人惊讶的内容。...政策制定者，个人和AI社区也将需要应对代表性问题，以及确保用于训练模型的数据集能够覆盖到不同人群。...Anandkumar说，人们开始为模型附加上独特的个性和脾气，她对此感到惊讶，并期待看到更多针对特定行业的文本模型（Transformer即变形金刚，其中Megatron译为威震天）。

3352 0

2020年AI如何走？Jeff Dean和其他四位“大神”已做预测！

2961 0

深度学习的GPU：深度学习中使用GPU的经验和建议

拥有高速GPU是开始学习深度学习的一个非常重要的方面，因为这可以让您快速获得实践经验，这是建立专业知识的关键，您可以将深度学习应用于新问题。...首先，这不考虑GPU的内存大小。您经常需要比GTX 1050 Ti所能提供的内存更多的内存，因此虽然具有成本效益，但一些高级卡却没有实际可行的解决方案。...大多数研究和大多数应用程序不需要额外的GB内存。我个人会与多个GTX 1070或GTX 1080研究。我宁愿运行几个比只运行一个更快的实验慢一点的实验。...相反，尝试获得额外的钱购买GTX 1060更快，有更大的内存，没有内存问题。如果你买不起GTX 1060，我会选择配备4GB内存的GTX 1050 Ti。...4GB可以是限制，但你将能够深入学习，如果你对模型进行一些调整，你可以得到良好的性能。 GTX 1050 Ti一般来说也是一个坚实的选择，如果你只是想深入学习一下，没有任何认真的承诺。

2.7K11 0

AI教父Hinton最新采访万字实录：ChatGPT和AI的过去现在与未来

问：你第一次使用ChatGPT时的想法是什么？答：在ChatGPT前，我已经使用了许多类似的东西，所以ChatGPT并没有让我感到惊讶。...GPT-2（这是早期的一种语言模型）让我惊讶，谷歌的一个模型也让我惊讶，它实际上可以解释为什么一个笑话很好笑。它用自然语言告诉你为什么一个笑话很好笑。...问：如果ChatGPT并不那么令人惊讶或令人印象深刻，那么您对公众对它的反应感到惊讶吗？因为反应很大。答：是的，我认为每个人都有点惊讶于反应如此之大。这是最快增长的应用程序。...也许我们不应该感到惊讶，但研究人员已经习惯于这些东西实际上是有效的。问：你在AI领域一直处于领先地位，半个世纪都领先于其他人，对吗？答：其实不然。在AI领域，有两种思路。...这让你担忧吗？答：确实有点。直到不久前，我认为在我们拥有通用人工智能之前还需要20到50年的时间。而现在我认为可能是20年或更短时间。有些人认为可能只有5年，那是荒谬的。

4881 0

干货 | AutoML 和神经架构搜索初探

我将在这篇文章中深入研究这些问题，在下一篇文章中，我将专门研究Google的AutoML。神经网络结构搜索是一个名为AutoML的更广泛领域的一部分。...• 神经网络结构搜索有用吗? • 如何让机器学习从业者更高效地工作？ AutoML vs增强机器学习 AutoML 是什么?...这很有用，因为它使得我们能够发现比人们想象的要复杂得多的网络结构，并且这些网络结构可以针对特定目标进行优化。神经网络结构搜索通常需要大量计算力。...这是Dean在他的简短的演讲中唯一强调的机器学习步骤，我对他的重点感到惊讶。Sundar Pichai的博文包含了类似的断言。 ?...当我在2013年开始对深度学习感兴趣时，对如此多的超参数感到不知所措，我很高兴新的研究和工具帮助消除了许多超参数（特别是为初学者）。

7672 0

AutoML 和神经架构搜索初探

6072 0

深度学习中如何选择一款合适的GPU卡的一些经验和建议分享

拥有高速GPU是开始学习深度学习的一个非常重要的方面，因为这可以帮助你快速获得实践经验，这是搭建专业知识的关键，有足够的时间将深度学习应用于解决新问题。...所以这意味着应该选择GTX 900或1000系列的GPU，以获得更好的性能。为了粗略地估计一下这些卡在深度学习任务上的表现，我构建了一个简单的GPU等值图。如何阅读这个？...此外，不能通过购买16 GTX 1050 Ti来获得4 GTX 1080 Ti的性能，因为还需要购买3台额外的昂贵的电脑。如果考虑这最后一点，即GPU的内存大小，得到下图所示性价比分析图。 ?...相反，建议花更多一点的钱购买更快，有更大的内存，没有内存问题的GTX 1060。如果实在买不起GTX 1060，我建议选择配备4GB内存的GTX 1050 Ti。...4GB内存可能有限，但至少可以开展进行你的研究，只是需要你对模型进行一些调整，也可以得到良好的性能。

1.7K4 0

深度学习来得太晚也太猛，对话2018年度图灵奖三位「大佬」

但当人们问我们，让机器变得更智能的方法是不是只有简单地扩展现有方法时，这的确令人沮丧。我们需要一些新的范式。 YOSHUA BENGIO: 当前技术得益于之前很多年的工业和科学应用累积。...LECUN：标准的方法可能会造成教条主义。而且，一些最有创意的想法可能是由年轻人提出来的。该领域已经取得了一些令人瞩目的进展。20 或者 30 年前，哪些可能发生的事物会让您感到惊讶呢？...LECUN：让我感到惊讶的东西太多了。比如，深度学习革命开始得太晚了，而开始革命后它发展的速度也太快了。...这会让我非常惊讶。虽然这种翻译并不完美，不如双语人才，但它已经在做得越来越好。 LECUN：令我惊讶的还有这些技术应用到很多产业中的速度，也是如此之快。...另一件令我感到惊讶的是 Yoshua 实验室中开发的生成对抗网络——人们基本上可以将神经网络作为生成模型使用，以生成图像和声音。

4222 0

Kaggle冠军告诉你，如何从卫星图像分割及识别比赛中胜出？

总而言之，我的解决方案主要有以下几点： 1. 将多尺度图像块与滑动窗口生成方法相结合，利用区域块重叠技术覆盖到整个图像的边缘。...该方案也应用于测试集，你可以从流程图中看出一系列结果。最后，在预处理中，将训练集的图像减去平均值，并标准化偏差。...另一方面，去除上述的区域最小像素门槛，小型车辆的预测性能没有任何的改善。什么结果让你感到惊讶？令我惊讶的是，使用简单快速的指数法可以很好地预测河流对象。...GTX1080（8GB）+ 48GB内存的桌面系统 GTX1070（8GB）+ 48GB内存的桌面系统 GTX960（4GB）+ 16GB内存的桌面系统您获胜方案的总运行时间是多少？...假设所有的模型和所有的图像尺度预处理过程可以并行运行，那么完成所有网络的训练大约需要三天时间：一天进行预处理，一天进行训练和预测，剩下一天进行车辆预测并生成提交方案。

2.7K9 0

吴恩达：AI 智能体工作流引领人工智能新趋势

这有点像你让一个人编写一篇关于某个主题的文章，我说你只需要坐在键盘前，一气呵成地把文章打出来，就像不允许使用退格键一样。尽管这项任务非常困难，但大语言模型的表现却令人惊讶的好。...与此相对，一个有 AI 智能体的工作流可能是这样的。让 AI 或者大语言模型写一篇文章的提纲。需要在网上查找一些东西吗？如果需要，那就去查。然后写出初稿，并阅读你自己写的初稿，思考哪些部分需要修改。...这些 AI 智能体的工作流程的效果让我自己都感到惊讶。我要做一个案例研究。我的团队分析了一些数据，用的是一个名为"人类评估基准"的编程基准，这是 OpenAI 几年前发布的。...我认为它应该得到更广泛的应用。这确实是一种非常稳健的技术。当我使用它们时，我总能让它们正常工作。至于规划和多智能体协作，我认为它是一个新兴的领域。当我使用它们时，有时我会对它们的效果感到惊讶。...就像我看到的许多新手经理，他们将任务委派给别人，然后五分钟后就去查看情况，这并不高效，我们也需要对一些 AI 智能体这样做，尽管这非常困难。我以为我听到了一些笑声。

3481 0

Node.js创造者，Ryan Dahl专访

我想这让我开始思考，我真的很喜欢Ruby的发展，你可以使用Ruby更清楚地表达你的想法。...但是如果构建一个大规模分布式DNS服务器，我不会选择Node的。 Pramod: 你一点也不偏袒Node，2009年你在柏林JSCONF介绍Node时，你对突然获得的成功和吸引力感到惊讶吗？...虽然我认为它们其中一些目前仍在次要位置，像我的社交网络项目，我会在某个时候回来。我做了一会儿，然后我开始阅读卷积网络以及图像分类是如何解决的，这让我对机器学习非常感兴趣。...机器学习的一个问题是你需要大量的数据，并且通过这些任务，这不是大问题。近来在生成模型方面已经有做了很多工作，也就是输出图像的模型。...我的想法是把这个最近的工作应用在生成模型中，并采取这个无限的训练数据，看看是否可以做一些图像转换问题。我做了一些超分辨率的工作，将一个低分辨率的图像，提高分辨率，这也是图像转换问题。

1.3K4 1

独家 | 数据科学家必知的五大深度学习框架！（附插图）

尝试从无到有地实现一个神经网络，你将会明白很多有趣的事情。但是当需要为现实世界的数据集构建深度学习模型时，这还是一个不错的主意吗？如果你需要几天或几周的时间来建立起模型，这是完全不可能的。...用Google搜索一下就能知道：卷积神经网络（CNNs）对于这类图像分类任务十分有效。我们要做的工作就是实现这个模型，对吗？...它的目标是最小化用户操作，并使其模型真正容易理解。可以将Keras中的模型大致分为两类： 1. 序列化模型的层是按顺序定义的。这意味着当我们训练深度学习模型时，这些层次是按顺序实现的。...与特定功能的预定义的图表不同，PyTorch提供了一个框架，用于在运行时构建计算图形，甚至在运行时也可以对这些图形进行更改。当不知道创建神经网络需要多少内存的情况下，这个功能便很有价值。...或者你打算换一个全新的框架？不管是什么情况，了解每个框架的优点和局限性非常重要。如果选对了正确的框架，当遇到错误时，便不会感到惊讶了！

6411 0

无服务器云技术逐渐消失

我记得当时很多人希望我加入炒作列车，并将我的云计算播客的重点转向无服务器。在这个行业工作了一段时间后，我意识到这项技术将发挥更重要的战略作用。将其宣传为“第二次降临”有些天真。...无服务器计算最初因其简化基础设施管理和可扩展性的承诺而受到赞誉，但随着新的趋势和技术成为焦点，它已被推到了边缘。当人们对这种演变感到惊讶时，我总是感到震惊。...最初，它被用来描述一种模型，在这种模型中，开发人员可以在不配置或管理服务器的情况下运行代码，但后来它被应用于各种不符合其原始定义的服务。这导致了令人困惑的精度损失。...该概念涉及将计算嵌入到日常物体中，需要持续的低延迟处理，而传统的无服务器框架可能难以始终如一地提供这种处理。这种向更集成和无处不在的计算环境的推动进一步边缘化了无服务器模型。企业应该关心吗？...AI 和无处不在的计算的兴起要求企业采用专门的计算资源和创新的应用程序设计，使它们能够保持竞争优势并探索新的客户参与途径。那些追逐云炒作的企业总是让我担心。

1121 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将15MB模型应用于3kB图像需要1-4 4GB的GPU内存，这让我感到惊讶吗？

相关·内容

Jeff Dean、李飞飞等发起SysML大会，Jeff Dean主题演讲：系统与机器学习融合（45PPT）

英伟达黄仁勋发布全球最大GPU，超300斤，汽车后备箱大小 | GTC2018

利用GPU和Caffe训练神经网络

让SD跟Midjourney一样简单易用！(37)

利用GPU和Caffe训练神经网络

【支撑20亿人的机器学习】Jeff Dean、贾扬清等ScaledML大会演讲

详解AI加速器（一）：2012年的AlexNet到底做对了什么？

2020年AI如何走？Jeff Dean和其他四位“大神”已做预测！

2020年AI如何走？Jeff Dean和其他四位“大神”已做预测！

深度学习的GPU：深度学习中使用GPU的经验和建议

AI教父Hinton最新采访万字实录：ChatGPT和AI的过去现在与未来

干货 | AutoML 和神经架构搜索初探

AutoML 和神经架构搜索初探

深度学习中如何选择一款合适的GPU卡的一些经验和建议分享

深度学习来得太晚也太猛，对话2018年度图灵奖三位「大佬」

Kaggle冠军告诉你，如何从卫星图像分割及识别比赛中胜出？

吴恩达：AI 智能体工作流引领人工智能新趋势

Node.js创造者，Ryan Dahl专访

独家 | 数据科学家必知的五大深度学习框架！（附插图）

无服务器云技术逐渐消失

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐