手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
avx
avx专题提供avx的最新资讯内容,帮你更好的了解avx。
计算__m256i字中的前导零
我正在修改AVX-2指令,我正在寻找一种快速的方法来计算__m256i字(有256位)中前导零的数量. 到目前为止,我已经找到了以下方法: // Computes the number of leading zero bits. // Here, avx_word is of type _m256i. if (!_mm256_testz_si256(avx_word, avx_word)) {
作者:佚名 时间:2019-12-29
在零移位的AVX2中,c – 8位移位操作
有没有办法在AVX2中重建_mm_slli_si128指令,以将__mm256i寄存器移位x个字节? _mm256_slli_si256似乎只是在[127:0]和[255:128]上执行两个_mm_slli_si128. 左移应该在__m256i上工作,如下所示: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ..., 32] -> [2, 3, 4, 5, 6,
作者:佚名 时间:2019-07-17
c – 如何使用SSE / AVX有效地执行double / int64转换?
SSE2具有在单精度浮点和32位整数之间转换向量的指令. > _mm_cvtps_epi32() > _mm_cvtepi32_ps() 但是没有双精度和64位整数的等价物.换句话说,他们缺少: > _mm_cvtpd_epi64() > _mm_cvtepi64_pd() 似乎AVX也没有. 什么是模拟这些内在函数的最有效的方式? 如果您愿意削减角落,请双击“ – ” int64转换只能在两个指
作者:佚名 时间:2019-07-08
c – 使用AVX后,SSE运行缓慢
我有一些奇怪的问题,一些SSE2和AVX代码我一直在努力.我使用GCC构建我的应用程序,哪个运行时cpu功能检测.目标文件是用每个CPU功能的分离标记构建的,例如: g++ -c -o ConvertSamples_SSE.o ConvertSamples_SSE.cpp -std=c++11 -fPIC -O0 -g -Wall -I./include -msse g++ -c -o Conve
作者:佚名 时间:2019-06-30
c – 使用SSE的水平最小和最大值
我有一个使用SSE的功能来做很多事情,而分析器告诉我,我用来计算水平最小值和最大值的代码部分消耗大部分时间. 我一直在使用以下实现: static inline int16_t hMin(__m128i buffer) { buffer = _mm_min_epi8(buffer, _mm_shuffle_epi8(buffer, m1)); buffer = _mm_min_ep
作者:佚名 时间:2019-06-13
c – xorshift128的AVX / SSE版本
我正在努力做出最快的高质量RNG.阅读 http://xorshift.di.unimi.it/后,xorshift128似乎是一个很好的选择. C代码是 #include <stdint.h> uint64_t s[ 2 ]; uint64_t next(void) { uint64_t s1 = s[ 0 ]; const uint64_t s0 = s[ 1 ];
作者:佚名 时间:2019-05-12
c – 使用__m256d寄存器
你如何使用__m256d? 假设我想在具有3-64位双精度分量(x,y和z)的简单Vector3类上使用Intel AVX指令_mm256_add_pd.使用它的正确方法是什么? 由于x,y和z是Vector3类的成员,_我可以将它们与__m256d变量联合声明吗? union Vector3 { struct { double x,y,z ; } ; __m256d _register
作者:佚名 时间:2019-05-07
在AVX寄存器内旋转字节的有效方法
总结/ tl; dr:有没有办法按位旋转YMM寄存器中的一个字节(使用AVX),而不是进行2x移位并将结果混合在一起? 对于YMM寄存器中的每8个字节,我需要在其中左旋7个字节.每个字节需要比前者更向左旋转一个位.因此,1字节应旋转0位,第7字节旋转6位. 目前,我做了一个实现,通过[我在这里使用1位旋转作为示例]将寄存器1位向左移位,并将7向右移位.然后我使用混合操作(内部操作_mm256_bl
作者:佚名 时间:2019-05-07
c – 如何在块复制期间矢量化范围检查?
我有以下功能: void CopyImageBitsWithAlphaRGBA(unsigned char *dest, const unsigned char *src, int w, int stride, int h, unsigned char minredmask, unsigned char mingreenmask, unsigned char minbluemask, un
作者:佚名 时间:2019-04-25
delphi – 如何探测英特尔®高级矢量扩展的可用性?
如何使用Delphi 2007检查盒子是否支持AVX. 我的问题仅限于查询CPU中的支持(假设操作系统正常/带有SP1的Windows 7). PDF文件名为Introduction to Intel® Advanced Vector Extensions 作者Chris Lomont解释了如何做到这一点,并提供了一个示例代码实现,但在c. 它也可以在page获得. 这是 Intel blog上给
作者:佚名 时间:2019-05-08
上一页
1
2
3
4
5
6
7
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• Redmi Note 14系列卖爆 女性用户增多 1
• 腾讯:不再公开显示职级!不希望被官僚
• 三只羊“财色录音”是假的!但背后技术
• 视频美颜SDK与直播美颜工具API的架构设
• 淘宝已接入微信支付!官方确认:京东双
• 品控差!iPhone16首批现划痕、掉漆、摄
• DXO公布iPhone 16 Pro Max影像成绩:最
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot