手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
avx
avx专题提供avx的最新资讯内容,帮你更好的了解avx。
没有得到预期的性能加速
我正在尝试查看 AVX 指令的性能加速。下面是我正在运行的示例代码: <pre><code>#include <iostream> #in
作者:佚名 时间:2022-05-22
如何通过 avx 对 int64 取模
我想通过 avx 实现 5%3=2。 <pre><code>normal: int64 x = a % b math: int64 x = a-((double)a/b)*b avx: __m256 tmp1 = _mm256_cvt
作者:佚名 时间:2022-05-22
为什么与 gcc -O3 相比,在没有优化的情况下,数组上的循环运行得更快?数组是用 malloc + zeroing 循环初始化的
很抱歉再次发布此问题并进行了一些更新。 <a href="https://stackoverflow.com/a/18159503">previous one</a> 已关闭。我
作者:佚名 时间:2022-05-22
使用 AVX 矢量内在函数手动矢量化的运行速度与 Ryzen 上添加的 4 个标量 FP 的速度大致相同? 使用 AVX没有 AVX关于基准测试
所以我决定看看如何通过英特尔® Intrinsics 在 C 中使用 SSE、AVX 等。不是因为有任何实际兴趣将它用于某
作者:佚名 时间:2022-05-21
XMM/YMM/ZMM 中最小或最大元素索引的位旋转向导
是否有指令或有效的无分支指令序列来计算无序(未排序)ZMM 的最大(或最小)元素(而不是其值)的
作者:佚名 时间:2022-05-19
压缩整数和扩展压缩整数的区别
我见过 avx 内部函数同时使用 pi<em>n</em> 和 epi<em>n</em> 类型进行整数运算。一个显然代表压缩整数,另一
作者:佚名 时间:2022-05-19
如果我使用 AVX 指令编译代码,然后在没有 AVX 扩展的 CPU 上运行代码,会发生什么?
如果我在 GCC 中使用 <code>-mavx</code> 标志(以使用 AVX 指令),但随后在不支持 AVX 的 CPU 上运行,行为是
作者:佚名 时间:2022-05-18
交错两个向量
我正在尝试使用 SIMD 的第一步,我想知道解决以下问题的正确方法是什么。考虑两个向量: <pre><code>+
作者:佚名 时间:2022-05-18
更好地理解时序和流水线
在这段代码中,我只是循环了一系列指令。不考虑次数(100、1000、1000000),使用 RDTSC 的时序显示(输
作者:佚名 时间:2022-05-17
英特尔 OneAPI c++ 无法识别英特尔内在函数
我在 Visual Studio 2019 中使用 OneAPI。 我已经包含 immintrin.h。 使用 Intel Oneapp 进行构建时,出现
作者:佚名 时间:2022-05-17
AVX2 指令组合两个压缩双精度的第一个和第三个元素
我有两个 AVX2 256 位寄存器(即 __m256d)来存储双精度值。第一个存储 0 1 2 3 和其他存储 4 5 6 7。我想得到
作者:佚名 时间:2022-05-17
AVX2 将 __mm256d 变量设置为全 1
我正在尝试将所有二进制变量都设为常量 __m256d 变量。我看到帖子 <a href="https://stackoverflow.com/questions/3746
作者:佚名 时间:2022-05-17
AVX(2) 如何收集指令实际计算取指地址?
<a href="https://software.intel.com/sites/landingpage/IntrinsicsGuide/#text=_mm_i32gather_epi32&expand=2980" rel="nofollow noreferrer
作者:佚名 时间:2022-05-16
使用_mm256_load_ps 时出现分段错误
我刚刚写了这段代码,并用 gcc -mavx test.c 编译了它 <pre><code>#include<stdio.h> #include<immintrin.h> in
作者:佚名 时间:2022-05-16
首次使用 AVX 256 位向量会减慢 128 位向量和 AVX 标量操作
最初我试图重现 Agner Fog 的微体系结构指南部分“YMM 和 ZMM 向量指令的预热期”中描述的效果: <块引
作者:佚名 时间:2022-05-16
是否可以将 ymm16 - ymm31 用于 AVX2 vpcmpeq{size} 指令?
我想知道是否可以按照以下方式做一些事情: <pre><code>vpcmpeqb %ymm16, %ymm17, %ymm16 </code></pre> 尝试使用
作者:佚名 时间:2022-05-15
SIMD 256i 仅处理 4 个元素
我的理解是 m256i 操作可以同时操作 8 个 32 位整数。我在visual studio中做了一个简单的程序,如下所示:</
作者:佚名 时间:2022-05-15
cmpeqpd 有时会返回错误的值
出于某种原因,有时在我的程序中我看到 <pre><code>cmpeqpd xmm3,xmm0 </code></pre> 哪里<code>xmm0 == {0x2cd000000
作者:佚名 时间:2022-05-14
在将 XGETBV 的结果用于 XSETBV 之前,我是否应该屏蔽它们?
我正在尝试执行一些 UEFI 应用程序。 我发现此代码在 VirtualBox 上崩溃(<code>test success</code> 未打印
作者:佚名 时间:2022-05-14
SIMD:位包有符号整数
无符号整数可以使用“位打包”技术进行压缩:在无符号整数块中,仅存储有效位,当块中的所有整数
作者:佚名 时间:2022-05-12
上一页
1
2
3
4
5
6
7
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• Redmi Note 14系列卖爆 女性用户增多 1
• 腾讯:不再公开显示职级!不希望被官僚
• 三只羊“财色录音”是假的!但背后技术
• 视频美颜SDK与直播美颜工具API的架构设
• 淘宝已接入微信支付!官方确认:京东双
• 品控差!iPhone16首批现划痕、掉漆、摄
• DXO公布iPhone 16 Pro Max影像成绩:最
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot