暂无搜索历史
周刊项目地址 https://github.com/wanghenshui/cppweeklynews
编译器信息最新动态推荐关注hellogcc公众号 本周更新2024-10-30 第278期
https://istmarc.github.io/post/2024/10/27/on-designing-tenseur-a-c-tensor-librar...
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2024-10-16 第276期
我们在之前介绍过 Strict Alias,也介绍过 __restrict__ 对自动向量化的影响。可以看到,在编译阶段,如果手动告诉编译器相关的知识,它也能更...
https://devblogs.microsoft.com/cppblog/announcing-the-proxy-3-library-for-dynami...
现代高性能 CPU 提供分支记录机制,使处理器能够连续记录一组先前执行的分支。但在进入细节之前,你可能会问:为什么我们对分支如此感兴趣? 嗯,因为这是我们如何确...
自顶向下微架构分析 (TMA) 方法是一种非常强大的技术,用于识别程序中的 CPU 瓶颈。它是一种健壮、正式的方法,即使是经验不足的开发人员也易于使用。该方法最...
如今,软件开发在很大程度上依赖编译器进行性能优化。编译器在加速软件方面扮演着关键角色。大多数开发人员将优化代码的工作留给编译器,只有当他们发现编译器无法完成的优...
今天群聊提到了一个场景,unique_ptr传值加move 并不能完美优化掉,看代码
如今,我们拥有广泛的静态代码分析工具。对于 C 和 C++ 语言,我们有一些著名的工具,例如 Clang 静态分析器: https://clang-analyz...
Roofline 性能模型是一个以吞吐量为导向的性能模型,在 HPC 领域广泛使用。它于 2009 年在加州大学伯克利分校开发。模型中的“roofline”表示...
采样是最常用的性能分析方法。人们通常将其与程序中的热点识别联系起来。广义而言之,采样有助于找到代码中对特定性能事件贡献最多的位置。如果我们考虑发现热点,那么这个...
在某些情况下,我们可能对分析特定代码区域的性能感兴趣,而不是整个应用程序。例如,当您开发一段新代码并只想关注该代码时,就会遇到这种情况。自然地,您会希望跟踪优化...
工作负载特征化是通过定量参数和函数描述工作负载的过程。简单来说,它意味着计算某些性能事件的绝对数量。特征化的目标是定义工作负载的行为并提取其最重要的特征。在高层...
跟踪在概念上与插桩化非常相似,但略有不同。代码插桩化假设用户可以编排他们应用程序的代码。另一方面,跟踪依赖于程序的外部依赖项的现有插桩化。例如,strace工具...
有读者反馈介绍的很不清晰。这里把翻译完整发出来。大家先看个大概,所有翻译都发一遍之后会做总结。预计这个内容起码发一个月吧
本章讲性能分析中的术语和指标。如果略过本章节,很难看懂linux perf 或者 intel vTune。Linux perf 是一个性能分析器,您可以使用它来...
大多数现代体系结构可以归类于基于寄存器的loadstore架构,其中操作数明确指定,内存只能通过load/store来访问。除了基本的load store co...
近50年来,处理器的发展趋势如下,单核性能趋,频率,功耗趋于平稳,核数,晶体管数量在增加。
暂未填写技能专长
暂未填写学校和专业