pow(x,0.5f)的快速实现比快速sqrt(x)快吗？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

【像训练CNN一样快速训练RNN】全新RNN实现，比优化后的LSTM快10倍

项目已经开源：https://github.com/taolei87/sru 先看论文摘要，有个大概的了解：标题非常直接，也是很多人都想实现的——《像训练CNN一样快速训练RNN》： ?...我们所提出的循环单元，运行速度与卷积层一样快，比cuDNN优化的LSTM快5-10倍。我们展示了这种循环单元在广泛应用中的有效性，包括分类、问答、语言建模、翻译和语音识别。...我们开源了在PyTorch和CNTK中的实现。简单循环单元SRU，简化状态计算，速度与CNN一样快近来深度学习取得的许多进展都源于模型容量的增加和计算力的相应提升。...因此，SRU中的所有矩阵乘法（即gemm）和元素方面的操作可以在不同的维度和步骤中实现并行化。 SRU实现：增加highway连接和变分dropout 那么，SRU是怎么实现的呢？...然后，作者将和步骤t的神经门之间的连接全部丢弃，以这种方法来加速循环计算。相比之下，现有的RNN在实现时是要使用先前的输出状态的。

2.7K5 0

一个Sqrt函数引发的血案

我们平时经常会有一些数据运算的操作，需要调用sqrt，exp，abs等函数，那么时候你有没有想过：这个些函数系统是如何实现的？就拿最常用的sqrt函数来说吧，系统怎么来实现这个经常调用的函数呢？...比如求sqrt(16)的结果，你先试（0+16）/2=8，8*8=64，64比16大，然后就向左移，试（0+8）/2=4，4*4=16刚好，你得到了正确的结果sqrt(16)=4。...这次真的是质变了，结果竟然比系统的还要好。。。哥真的是震惊了！！！哥吐血了！！！一个函数引发了血案！！！血案，血案。。。到现在你是不是还不明白那个“鬼函数”，到底为什么速度那么快吗？...它的作用是将一个数开平方并取倒，经测试这段代码比(float)(1.0/sqrt(x))快4倍： float Q_rsqrt( float number ) { long i; float x2,...编译，实验，这个函数不仅工作的很好，而且比标准的sqrt()函数快4倍！要知道，编译器自带的函数，可是经过严格仔细的汇编优化的啊！

1.4K5 0

您找到你想要的搜索结果了吗？

是的

没有找到

一个 Sqrt 函数引发的血案

我们平时经常会有一些数据运算的操作，需要调用sqrt，exp，abs等函数，那么时候你有没有想过：这个些函数系统是如何实现的？就拿最常用的sqrt函数来说吧，系统怎么来实现这个经常调用的函数呢？...比如求sqrt(16)的结果，你先试（0+16）/2=8，88=64，64比16大，然后就向左移，试（0+8）/2=4，44=16 刚好，你得到了正确的结果 sqrt(16)=4。...到现在你是不是还不明白那个“鬼函数”，到底为什么速度那么快吗？不急，先看看下面的故事吧： Quake-III Arena (雷神之锤3)是 90 年代的经典游戏之一。...它的作用是将一个数开平方并取倒，经测试这段代码比(float)(1.0/sqrt(x))快4倍： float Q_rsqrt( float number ) 2{ long i; float...编译，实验，这个函数不仅工作的很好，而且比标准的sqrt()函数快4倍！要知道，编译器自带的函数，可是经过严格仔细的汇编优化的啊！

1.2K4 0

深度：震惊世间的惊人代码（附完整代码）

long i; float x2, y; const float threehalfs = 1.5F; x2 = number * 0.5F; y = number;...函数返回1/sqrt(x),这个函数在图像处理中比sqrt(x)更有用。注意到这个正数只用了一次叠代!(其实就是根本没用叠代，直接运算)。...编译、实验，这个团数不仅工作的很好，而且比标准的sqrt()函数快4倍！...囊括世界万物的一段代码这是一段使用Processing语言的代码，这短短的几行代码永无休止的就在做一件事——“穷举”。那么它又有什么特殊之处吗？...:，主要的核心代码是:|:&，可以看出这是一个函数本身的递归调用，通过&实现在后台开启新进程运行，通过管道实现进程呈几何形式增长，最后再通过:来调用函数引爆炸弹。

9991 0

大厂面试题:求根号2简单？高级算法你肯定不会

这里再补充一点，实际上x的初始值可以取任意正数，但是会影响到性能，我尝试取1亿，最终需要30次迭代，不过还是比二分快。...实际我目前没有找到比牛顿迭代又好又快的算法了，但是我找到一个相关的故事，以及它引出的以牺牲精度换取速度求\frac{1}{\sqrt{x}}的神奇算法，当然它也可以用来求\sqrt2。...这里说不严格是因为我只做\sqrt2的测试，而且用的是java实现的，而且像是CarmackMethod的实现，可能因为java和c的运行机制的不同，性能会受很大影响，下面这个结果仅供娱乐，看看就好。...上面说了3个解法，那你是不是也很好奇目前各种编程语言库函数里对sqrt是如何实现的？...我也很好奇，于是我们帮你们翻了jdk源码，发现它根本就不需要自己实现sqrt，毕竟sqrt在计算机领域是有个比较常用的计算，所以主流的CPU架构都提供了对sqrt的硬件支持，只需要一条汇编指令就可以了，

2.2K1 0

【C语言标准库函数】平方根与幂函数：sqrt()和pow()

三、函数实现 C语言标准库中sqrt()和pow()的实际实现非常复杂，通常会结合硬件指令（如x86架构的FSQRT指令）、数值逼近算法（如牛顿迭代法、泰勒展开）以及精度优化策略，以在效率和精度之间取得平衡...3.1 sqrt()函数实现（牛顿迭代法）牛顿迭代法是求解方程根的经典数值方法，也是多数标准库中sqrt()函数的核心实现思路。...处理负底数小数指数（无实数解） else: set errno = EDOM; return NaN; 实际实现中，标准库会对上述逻辑进行深度优化：例如快速幂算法的位运算优化...NAN; } // 功率比的0.5次幂即幅度调整系数，等价于sqrt(power_ratio) double adjust_factor = pow(power_ratio,...解析：考查函数实现开销，嵌入式开发对性能要求极高，核心是理解pow()的复杂逻辑带来的效率损耗。答案： 1. 效率对比：x*x*x更高效，实际测试中效率是pow(x,3)的30倍以上。

1911 0

【安全函数】幂运算进阶：sqrt_s()与pow_s()解析

根据C99标准定义，sqrt()接收非负输入时返回正确平方根，若输入为负，行为由具体编译器实现决定——GCC编译器返回NaN并设置errno为EDOM，而部分嵌入式编译器会直接触发硬件异常；pow()的行为更复杂...3.1 sqrt_s() 实现逻辑 sqrt_s()的校验逻辑相对简单，核心是拦截负数输”和空指针输出两大错误场景，具体伪代码如下：函数 sqrt_s(输入参数 x: 双精度浮点数, 输出参数 result...3.2 pow_s() 实现逻辑幂运算的定义域异常场景更多，pow_s()的校验逻辑需覆盖负数底数+非整数指数、0底数+非正指数、指数为NaN/无穷大等核心非法场景。...{ return fabs(x - round(x)) < 1e-9; } // 安全幂函数实现 int pow_s(double base, double exp, double* result...八、经典面试题面试题1：不使用标准库函数，实现一个求平方根的函数（谷歌2023年校招后端开发题）问题描述：给定一个非负整数x，计算并返回x的平方根，结果只保留整数部分（如输入8，返回2）。

1091 0

Interpolator的本质

如果把x轴当做时间，y轴当做距离，可以发现整个过程函数的斜率不变，说明做均速运动。...{ if (mFactor == 1.0f) { return input * input; } else { return (float)Math.pow...三、AccelerateDecelerateInterpolator 3.1 代码注释从注释可以看到AccelerateDecelerateInterpolator属于开始结束慢，但是中间快 /**...float getInterpolation(float input) { return (float)(Math.cos((input + 1) * Math.PI) / 2.0f) + 0.5f...y=x*x*(3*x-2) 4.3 函数曲线我们只要关注0到1的区间，一看图我们就明白了，如果把x当时间，y当距离，就是先从原点往回运动，然后再快速的往终点运行。

6061 0

数学--数论--原根(循环群生成元）

突然今天，我想不起什么是原根来了，查了一下定义，哎~这货不是离散数学，循环群生成元吗？？...我是笨逼枚举将P-1进行质因数分解枚举i,并判断对于每个i是否都有(可以应用快速幂) 第一个符合条件的i就是P的最小原根对于合数 , 只要将 2....int zc=n,all=sqrt(n); for(int i=2;i<=all;i++) { if(n%i!...(int x,const int y,const int mod) { int res=1; for(int i=1;ix=x*x%mod)if(i&y)res=res*x%mod...zc=n,all=sqrt(n); for(int i=2;i<=all;i++) { if(n%i!

2.7K5 0

【安全函数】sqrt_s()与pow_s()解析

sqrt_s()作为sqrt()的安全替代者，专注于非负实数的平方根计算，新增参数范围校验、输入类型合法性检查及异常状态返回机制；pow_s()则针对pow()的复杂参数组合场景，构建了多维度参数校验规则...x, double *result); 与标准sqrt(double x)相比，sqrt_s()的原型设计有三个关键改进：一是采用bool类型返回值直接标识计算成败，避免标准函数通过errno间接反馈异常的晦涩性...3.1 sqrt_s()实现逻辑（伪代码） bool sqrt_s(double x, double *result) { // 第一阶段：输入参数基础校验 if (result ==...()和pow_s()的实现，需自行补充或引入库 int main() { double result; // 测试sqrt_s()：合法输入 printf("===...()和pow_s()并非对标准sqrt()、pow()的简单复刻，而是围绕安全性进行的重构设计。

831 0

PAT乙级题目总结

a : gcd(b, a % b); 3} cin与cout cin 和 cout 比 printf 和 scanf 更加耗时，且不要再同一个程序中同时使用 cout 和 printf。...和float在printf中都是%f 常用math函数 1fabs(double x);//对double类型取绝对值 2floor(double x)；//对double类型向下取整 3ceil(double...x);//对double类型向上取整 4round(double x);//对double类型的值四舍五入 5log(double x);//自然对数为底，若其他为底，则用换底公式 6pow(double...) { 3 for (int i = 2; i sqrt(num); i++) { 4 if (num % i == 0) { 5 return false...; 6 } 7 } 8 return true; 9} 快排的特点在快速排序中选择的主元排序后位置是不变的：参考题目1045快速排序 (25 分)。

6961 0

牛顿迭代法(Newtons Method)

f(x)=0中精确解的意义是，当取得解的时候，函数值为零（即f(x)的精确解是函数的零点）。因此，x1比x0更加接近精确的解。只要不断以此方法更新x，就可以取得无限接近的精确的解。...牛顿迭代法是已知的实现求方根最快的方法之一,只需要迭代几次后就能得到相当精确的结果。首先设x的m次方根为a。下面程序使用牛顿法求解平方根。...也比c++标准库的sqrt()函数要快好几倍。此段代码有一个奇怪的句子： i = 0x5f3759df - ( i >> 1 ); // what the fuck? ...以雷神之锤III程序为蓝本可以写出比sqrt()更强大的求平方根函数： 1 int sqrt(float x) { 2 if(x == 0) return 0; 3 float...result = x; 4 float xhalf = 0.5f*result; 5 int i = *(int*)&result; 6 i = 0x5f375a86

2.3K5 0

#数值分析读书笔记（4）求非线性方程的数值求解

{ return Math.pow(x,3)+2*Math.pow(x,2)-4; } } 给出最后的输出结果 1.1303954347672787 1.1303954347672787...(x); } } public static double function(double x){ return Math.sqrt...x,2)+4*Math.pow(x,2); } } 比起二分法或者迭代法,它的收敛速度还是较为快速的,特别是当初始值接近根的情况,更加明确的说,Newton切线在充分接近单根的情况下二次收敛,...给出代码的实现 public class NumericalTest { public static void main(String[] args){ double x1=1...public static double function(double x){ return Math.pow(x,3)+2*Math.pow(x,2)-4; } } 割线法的速度也是十分快

1.3K2 0

单片机常用的14个C语言算法

（可用以下程序段实现） void main() { int m,i,k; printf("please input a number:\n"); scanf("%d",&m); k=sqrt(...因为工作的需要，要在单片机上实现开根号的操作。...目前开平方的方法大部分是用牛顿迭代法。我在查了一些资料以后找到了一个比牛顿迭代法更加快速的方法。不敢独享，介绍给大家，希望会有些帮助。...1.原理因为排版的原因，用pow(X,Y)表示X的Y次幂，用B[0]，B[1]，...，B[m-1]表示一个序列，其中[x]为下标。...实现代码这里给出实现32位无符号整数开方得到16位无符号整数的C语言代码。

1.9K4 0

CUDA优化冷知识24|函数和指令使用的选择和优化

例如sqrt()函数，有double sqrt(double)的版本的，也有float sqrt(float)的版本的。...我们这里简单的举几个例子就好：计算x的1/6次方，可以先计算一次x的平方根倒数，再计算一次立方根倒数，这样就得到1/6次方的值，而无需使用昂贵的pow之类的函数。...再例如：x的2/3次方，可以先求一个立方根，然后再求一次平方，这样就快速得到了2/3次方。...注意这个快速替换表格里的公式，很多都使用了特殊的GPU上专用的函数，例如rsqrt, rcbrt（二次方和三次方根的倒数），而不是标准的C库(libm)，在CPU上我们能见到的sqrt、cbrt(二次方和三次方根...因为特殊的rsqrtf()这种，可能在实现上具有更好的精度和性能。例如我们之前的章节知道过，SFU这种喜欢提供平方根的倒数的这种快速的接近，可能有助于性能的提升。

1.5K2 0

BashShell数值运算

简介 Bash Shell 本身一些内置命令可以执行简单的整数运算，但复杂一些的运算（比如浮点数运算）需要通过一些外部命令来实现，Bash Shell 数学运算符只支持整数运算。...其他运算函数运算 bc 命令提供了数学函数库（需指定 -l 选项，该选项默认小数精度为 20 位），包含了一些基本的数学函数（以下三角函数均采用弧度值）：函数命令示例 sin(x) s(x) echo..."l($x)" | bc -l exp(x) e(x) echo "e($x)" | bc -l 开方 sqrt(x) echo "sqrt($x)" | bc -l … … … awk 命令同样提供了一些基本数学函数...'{printf log($1);}' exp(x) exp(x) echo "$i" | awk '{printf exp($1);}' 开方 sqrt(x) echo "$i" | awk '{printf...sqrt($1);}' … … …

5260 0

OpenCV角点检测源代码分析（Harris和ShiTomasi角点）

eigen2x2（）函数如下：2x2矩阵特征值和特征向量的计算，有线性代数基础的都学过，就不再赘述 static void eigen2x2( const float* cov, float* dst,.../std::sqrt(x*x + y*y + DBL_EPSILON); //保存特征值l1及其对应的特征向量 dst[6*j] = (float)l1;.../std::sqrt(x*x + y*y + DBL_EPSILON); //保存特征值l2及其对应的特征向量 dst[6*j + 1] = (float)l2;...half = v_setall_f32(0.5f); for( ; j x4::nlanes; j += v_float32x4...; float b = cov[j*3+1]; float c = cov[j*3+2]*0.5f; //求根公式计算较小的根，

2.3K6 0

【RSA解密】蓝桥杯第十届省赛A组扩展欧几里得算法

扩展欧几里得算法的代码如下： int gcd_Ex(int a,int b,int &x,int &y) { //ax+by=gcd(a,b)的整数解 if(b==0) { x=1;...根据题意我们只需要求解：即可，快速幂求模代码如下： ll pow_mod(ll a,ll b,ll mod) { //快速求解a^b%mod ll res=1,base=a%mod; while...然后通过调试发现是最后一步快速幂求模很慢，而pow_mod中主要的运算集中在快速乘求模，于是可以再优化一下： ll fast_mul(ll a, ll b, ll mod){ //快速求解a*b%mod...{ for(ll i=2;isqrt(x);i++) { if(x%i==0) { return false; } } return true; } ll...pow_mod(C,e,n); coutx; return 0; } ans：579706994112328949

5971 0

贪心算法求快速平方根倒数算法中的“魔术数字”【含matlab源代码】

一、快速平方根倒数算法简介及实现 1.1 算法简介在计算平方根的倒数时，传统的计算方法是先计算a的平方根sqrt(a)，再计算它的倒数1/sqrt(a)。...而快速平方根倒数算法则将输入的32位浮点数a作为一个整数i，用“魔术数字”0x5f3759df减去i右移一位的值产生近似的估值y，再使用牛顿迭代法迭代一次，就得到了相当精度的计算结果。...; x2 = number * 0.5F; y = number; i = * ( long * ) &y; // evil floating...但通过指针将32位浮点数转化为32位整数的运算（以及其逆运算）很难在matlab中实现，但很容易通过c/c++实现。.../sqrt(as); 再调用FastInvSqrtFloat函数计算出R作为魔术数字时的近似结果es，用es与rs的平均均方误差作为的值。

1.8K3 0

使用程序计算近似Π值

但是你有没有想过这个PI是怎么来的，是直接存储吗？还是计算来的。虽然不知道具体是怎么实现的，但是我们可以使用一些简单的数学知识，来计算出近似的Π值。...A的计算主要是矩形面积的累加，假如我们把圆拆成n个矩形，每个矩形的宽都为1/n，那么第i个矩形的面积应该为： dS = dx * y 因为是半圆，因此y的计算公式如下： y = \sqrt{R^2 -...(x-R)^2} 其中x应该为i/n*R（因为是把R分成n份，第i个矩形的x=i/n*R）。...最后，n个矩形相加的公式为： A = \sum_{i=1}^n\frac{\sqrt{R^2 - (\frac{i}{n}R-R)^2}}{n} 下面我们就可以根据公式用程序求出Π的近似值。...= pow(pow(r, 2) - pow(i*r/n-r, 2), 0.5) # 使用公式计算y，其中x=i/n dS = dx * y # 单个小矩形的面积 A += dS # 对矩形面积进行累加

2.4K2 0

点击加载更多

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭