首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

SIMD、MMX、SSE、AVX、3D Now!、NEON

转载来源《【整理】SIMD、MMX、SSE、AVX、3D Now!、neon》 本文摘取部分内容,详细请看原文。 SIMD NEON是通用的SIMD(单指令多数据)引擎。...需要指出一点,NEON是需要硬件支持的,需要有一块寄存器放到硬件上来处理这个的。SIMD、MMX、SSE、AVX、3D Now!...、NEON SIMD单指令流多数据流(SingleInstruction Multiple Data,SIMD)是一种采用一个控制器来控制多个处理器,同时对一组数据(又称“数据向量”)中的每一个分别执行相同的操作从而实现空间上的并行性的技术...后来英特尔在此基础上发展出SSE指令集;AMD在此基础上发展出3DNow!指令集。现在新开发的程序不再仅使用MMX来优化软件执行效能,而是改使用如SSE、3DNOW!...SSE2 SSE2是 Intel在Pentium 4处理器的最初版本中引入的,但是AMD后来在Opteron 和Athlon64处理器中也加入了SSE2的支持。

1.5K10

NEON优化

前言 这几个星期在实验室里的任务是对OpenCV源码里某部分代码使用NEON指令集进行优化,在实际操作的过程中对OpenCV环境的配置、NEON指令集、OpenCV源码都有了一定的理解,在这里将所学到的知识分享出来...2、数据类型、基本操作 为了更加直观地理解NEON指令集的功能,我们先介绍几个NEON的基本数据类型与操作函数,然后给出一个简单的例子,说明NEON是如何进行性能优化的。...由于OpenCV环境里内置了NEON指令集,只需要在搭建了OpenCV的环境下引用头文件即可使用NEON指令集。...同时,OpenCV源码里对NEON指令集又进行了一层封装,也有了更多功能的函数可以使用,封装好的NEON函数和数据类型可以在OpenCV官网中查找到。...同样,我们可以测试NEON指令集是否打开,将cpp代码修改为上面给出的NEON例子,重新执行make和./test指令,如果成功运行,说明NEON指令集已经打开。

2.3K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    SSE图像算法优化

    在某些场合,我们还需要加快这个过程的速度,因此我考虑使用SSE优化他,考虑以上两种实现方式,哪一种更有利于SSE的处理呢,由于第一种方式前后的依赖比较强,用SSE做不是不可以,但估计效率不会有提升,需要太多次数据重组了...,而第二种方式的由中间数据计算最后的结果很明显可以使用SSE处理,即下面的这三行代码: for (int X = Channel; X < (DstW - 1) * Channel; X++) {...Index - 2] + ((Src[Index - 1] + Src[Index + 1] ) << 2) + Src[Index] * 6 + Src[Index + 2]; }   最简单的SSE...一次性只能加载4个浮点数,如果还是和刚才处理字节数据那样,隔一个数取一个数,那么利用SSE一次性只能处理2个像素,而我们通过下面的美好的优化方式,一次性就能处理4个像素了,而且代码也很优美,我很是喜欢。...的耗时大约是45ms,一旦加入边缘像素的处理,这个耗时我们发现75ms,而普通C语言版本里由原来的260ms变为290ms,我们可能感受不到大的区别,但SSE的优化后,边缘部分居然占用了40%的耗时,因此

    1K20
    领券