腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
sse
生成
点
、
、
、
s1 = _mm_hadd_ps(s1, s1); //1100,140 我正在
使用
sse
进行
点
生产。我
使用
的是_mm_mul_ps和_mm_hadd_ps指令,而不是_mm_dp_ps。如果_mm_hadd_ps函数后的值大于255,则显示错误的值。
浏览 6
提问于2017-03-02
得票数 3
回答已采纳
2
回答
C++/Linux出于性能原因而对齐字符数组?
、
、
、
在做了一些阅读之后,我想知道我是否应该在16字节边界上对齐数组,显然这可以允许CPU利用
SSE
? 如果是这样的话,我如何告诉GCC编译器我希望数组在哪里对齐?
浏览 3
提问于2014-07-18
得票数 2
3
回答
比FPU慢?
、
、
、
、
既然矢量化版本只包含一组
SSE
乘法(而不是四个单独的FPU乘法),为什么要慢一些呢?FPU确实比
SSE
更快,还是这里有一个混乱的变量? (我在移动核心i5上。)
浏览 5
提问于2012-01-13
得票数 9
回答已采纳
2
回答
如何在VisualStudio2017中禁用AVX 15.5?
、
看来,从最近更新的Visual 2017 (15.5)开始,它
使用
AVX扩展(用于x64构建)
生成
代码,尽管“启用增强指令集”被设置为"Not“,根据工具提示应该只允许
SSE
2指令。试图将其设置为/arch:
SSE
2或/arch:IA32会导致编译器警告“忽略未知选项‘/arch: it 32’”(或相应地设置
SSE
2 ),根据,这是一种预期的行为。那么,现在有没有办法让编译器不
生成
AVX特定的代码呢?这一
点
已在15.7中
浏览 5
提问于2017-12-13
得票数 6
回答已采纳
2
回答
为什么一个数字处理程序在发散到NaNs时开始运行得慢得多?
、
、
、
一个程序在一个double数组上重复了一些计算,然后发生了一些不幸的事情,产生了NaN。在此之后,它的运行速度要慢得多。为什么-ffast-math会发生这种情况?难道它不应该阻止抛出浮点异常,然后继续并以与通常数字相同的速度输出NaNs吗?nan.c#include <math.h> long long int i; for(i=0; i<100000000; ++i)
浏览 1
提问于2014-01-06
得票数 2
回答已采纳
1
回答
使用
msys/mingw64 64构建marisa-trie共享库
、
、
、
试图
使用
在msys中构建MinGW64库。make 它只
生成
静态库,不
生成
共享库。添加“--启用-静态=否”将
生成
一个什么都不做
浏览 3
提问于2014-11-27
得票数 0
回答已采纳
1
回答
在没有
sse
3的情况下编译gnu程序
、
、
我正在为一个架构不支持
sse
beyond
sse
2的设备编译一个应用程序,我想知道是否可以禁止
使用
GNU autoconf
生成
的配置脚本中的
sse
3指令进行编译?我知道您可以在gcc/g++中
使用
mno-
sse
3选项关闭它,但如果我能在配置级别关闭它,而不是
生成
一个make文件,然后手动插入那个编译器标志,那就更好了……
浏览 3
提问于2009-12-07
得票数 2
回答已采纳
2
回答
如何在Visual Studio 2008中启用
SSE
3/
SSE
4.1指令集?
、
、
、
我试着追随:但我得到的唯一选择是-上交所或
SSE
2。 谢谢。
浏览 2
提问于2010-05-06
得票数 2
2
回答
SSE
/ AVX集成时体系结构的影响
、
、
、
、
如果
使用
SSE
2 Intrinsics (
使用
#include <emmintrin.h>)并
使用
-mavx标志进行编译。编译器将
生成
什么?它会
生成
AVX或
SSE
代码吗?如果
使用
AVX2 Intrinsics (
使用
#include <immintrin.h>)并
使用
-msse2标志进行编译。编译器将
生成
什么?它是否只
生成
SSE
或AVX代码
浏览 1
提问于2019-04-18
得票数 1
回答已采纳
2
回答
阵列特征矢量化
、
、
、
我正在处理
点
云数据(每云150 K
点
)。)然而,根据医生的说法,艾根在受支持时确实利用了
SSE
2 (并在3.3中
使用
了AVX )。它只适用于向量和矩阵运算吗?编辑:我研究了
生成
的汇编代码,它确实包含一些
SSE
指令。但还是很慢 编辑:这是更多的时间信息。我正在循环超过100帧,大约150
浏览 9
提问于2015-07-07
得票数 4
2
回答
SSE
2倍乘比标准乘法慢
、
、
、
我想知道为什么下面的带有
SSE
2指令的代码执行乘法的速度比标准的C++实现慢。更令人惊讶的是,如果我在调试模式下编译,
SSE
代码只需要93 if ,而标准乘法需要309 if。multiplication)RELEASE:调试: 93ms (
SSE
2) /309 350 (标准350 350 (
SSE
2) /350(标准) 这是怎么回事??我在发布模式下
使用
MSVC2008和QtCreator 2.2.1。Intel VTune在调试时为
SSE
循环提供289 me,在
浏览 1
提问于2011-07-03
得票数 0
回答已采纳
3
回答
什么会导致_mm_setzero_si128()产生SIGSEGV?
、
、
、
、
一些图形例程被优化与
SSE
的本质。在GUI的初始化过程中,初始状态只呈现一次,所有
SSE
例程都能很好地工作。但是,如果稍后从事件处理程序调用它们,则会得到一个SIGSEGV。起初,我认为这是一些奇怪的对齐问题,但它甚至发生在:当我用非优化代码替换
SSE
例程时,一切正常。在
使用
来自不同线程的
SSE
时,有什么值得注意的地方吗?还有什么能导致这种行为? SIGSEGV发生在movdqa %xmm0, -40(%ebp)指令中(其中有几条
浏览 2
提问于2012-07-26
得票数 5
回答已采纳
1
回答
无法在已启用的cpu上
使用
SSSE3
、
、
、
、
我有一个Xeon W3550处理器,它应该支持
SSE
4.2指令集,但是当我尝试在c程序中
使用
SSE
2以外的任何东西时,我得到了一个编译器错误,例如当我
使用
它会检测所有相关的
sse
指令集,但是仅检测
SSE
和
SSE
2。头文件<*mmintrin.h>通过
浏览 5
提问于2011-08-24
得票数 6
回答已采纳
3
回答
如果程序是用GCC的所有优化标志构建的,那么桌面CPU的速度限制吗?
、
、
、
1)如果
使用
GCC支持的
使用
输入标志的特定指令,并
使用
所有核,则每秒最高可能的多累积运算()。如果我们决定将源代码移植到不同的CPU--比如PowerPC上的Altivec --最好的选择是
使用
GCC标志,比如-msse或-maltivec。更新:从GCC 3开始,GCC可以在目标支持这些指令时自动
生成
SSE
/
SSE
2标量代码。自GCC 4以来,
SSE
/
SSE
2的自动矢量化已经被加入。
SSE
4
浏览 8
提问于2009-11-25
得票数 0
回答已采纳
1
回答
用GCC强制自动向量化
、
、
、
有了ICC,我知道可以
使用
#杂注SIMD来强制将编译器选择不矢量化的循环矢量化。《GCC》里面有没有类似的东西?或者,是否有计划在未来的版本中添加此功能?非常相关的,如何
使用
Graphite强制矢量化? 感谢你考虑我的请求,法比奥
浏览 14
提问于2013-02-07
得票数 2
2
回答
多目标静态库-崩溃
我正在试验在代码
生成
之前
使用
多个目标特性-静态库选项。我编写了一个
生成
器,并能够为多个目标特性(如target=x86-64-windows-
sse
41,x86-64-windows-avx,x86-64-windows-avx2 )
生成
静态库和头文件,但是在链接到我的应用程序之后有关于如何
使用
此功能的指示吗?不工作 -
SSE
41, AVX2, AVX - AVX2,
SSE
41, AV
浏览 6
提问于2017-02-08
得票数 0
1
回答
从Haskell
生成
矢量代码?
、
、
、
、
有没有可能让GHC为各种
SSE
生成
SIMD代码?我有一个这样的程序main = print . sumU $ (enumFromToFracU 1 10000000 :: UArr Double) 我可以看到
生成
的代码(为64位x86编译的)在标量模式(C和asm后端)中
使用
SSE
指令。对于我从事的这类程序,矢量指令的
使用
对性能很重要。对于像我这样的新手,有没有一种简单的方法让GHC
使用
SSE
SIM
浏览 0
提问于2009-09-20
得票数 3
回答已采纳
2
回答
Visual studio编译器标志/arch和性能
、
、
我只是注意到在我们的项目中没有设置"Enable Enhanced Instruction“标志,这可能只是一个疏忽。我猜我们会看到一些改进,我们的应用程序不断地进行基于浮点的计算,但这不是主要的部分。
浏览 0
提问于2010-03-07
得票数 1
回答已采纳
2
回答
如何将msbuild.exe设置为将
SSE
2的适当值嵌入到_M_IX86_FP中?
、
我已经在属性VS2010 Express Edition代码
生成
增强指令集中用
SSE
2集构建了一个解决方案。然后,在对预定义的MARCO _M_IX86_FP进行程序测试时,
生成
的值为2。/p:"VCBuildAdditionalOptions=/arch:
SSE
2"测试病例 // <
浏览 2
提问于2011-06-23
得票数 2
1
回答
我如何使所有的英特尔内在选择GCC?
、
、
参考GCC内置的函数:是否有允许所有这些的标志选项?
浏览 0
提问于2021-11-02
得票数 0
回答已采纳
点击加载更多
相关
资讯
如何使用SSE2指令集加速字符替换
为什么在单向数据流使用SSE而不是WebSockets?
易点天下:已经开始使用AIGC技术为客户提供创意素材生成服务
使用python生成词云
教你使用Python生成captcha
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券