

近日,PyTorch 正式发布了 v2.9.1 版本,这是一次专注于修复回归问题和隐性正确性错误的 Bug Fix Release。本次更新主要针对 PyTorch v2.9.0 中出现的一些性能回退、分布式计算问题、编译器错误等进行修复与优化。以下为详细更新内容。
F.conv3d 使用 bfloat16 输入时出现严重的内存占用回退。
本次版本提供了解决方案,如受影响建议从 PyPI 安装 nvidia-cudnn 包版本 9.15+。InternalTorchDynamoError 在字节码转换过程中的问题。error_on_graph_break 配置下发生的隐性正确性错误,该错误会导致在非空 checkpoint 情况下出现不必要的 graph break 恢复。mark_static_address 配合 cudagraphs 时避免重复编译。torch inductor 中缓存 get_free_symbol_uses 以提升性能。torch.compile 中出现的频繁警告信息。tracer_output 变量未初始化导致的异常。torch.bmm 与 torch.compile 在 v2.9.0 版本下的崩溃问题。gather 输入非 contiguous 引发的崩溃。CUDNN_ATTENTION 中的数值计算问题。fused_scaled_matmul_reduce_scatter 中的对称内存问题。代码地址:github.com/pytorch/pytorch
PyTorch v2.9.1 是一次重要的修复版本,针对 v2.9.0 的性能回退与编译器错误进行了集中处理,并在分布式、内存管理、数值计算等方面做出了优化。如果你的项目正在使用 v2.9.0,并且出现了相关问题,推荐及时升级至 v2.9.1,并确保相关依赖(如 nvidia-cudnn)版本满足要求,以获得最佳的性能与稳定性。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。