手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
avx512
avx512专题提供avx512的最新资讯内容,帮你更好的了解avx512。
AVX-512 VORPS 中 writemask k1 的用法? 代码
我正在学习 AVX-512。我有一个关于 VORPS 的问题。 文档是这样说的: <code>EVEX.512.0F.W0 56 /r VORPS z
作者:佚名 时间:2022-05-24
从 avx/sse 掩码到 avx512 掩码的“正确”方法是什么?
我有一些现有的 avx/sse 掩码,我用旧方法: <pre><code>auto mask_sse = _mm_cmplt_ps(a, b); auto mask_avx = _mm_cmp_ps(a
作者:佚名 时间:2022-05-22
没有得到预期的性能加速
我正在尝试查看 AVX 指令的性能加速。下面是我正在运行的示例代码: <pre><code>#include <iostream> #in
作者:佚名 时间:2022-05-22
寄存器 X/Y/ZMM16-31 是如何编码的?
据我所知,从 AVX 开始,通过 3 字节 VEX 或 EVEX 前缀,您可以在 64 位模式下编码多达 32 个 XMM/YMM/ZMM 寄存
作者:佚名 时间:2022-05-19
_mm256_loadu_epi64、_mm256_storeu_epi64 需要 avx512vl? 我认为我应该为我的 avx2 机器编译:编译但让我紧张:似乎有效:问题
第一次使用 avx2 内在函数(在支持 avx2 但<em>不</em> avx512 的系统上)。 无论是从原型还是我从英特
作者:佚名 时间:2022-05-18
有没有办法用avx2自动替换avx512?
根据 Linus Torvalds 的建议(和跨平台性能),我不想使用 avx512。是否有我可以向编译器(gcc 和 msvc)指定
作者:佚名 时间:2022-05-17
是否可以将 ymm16 - ymm31 用于 AVX2 vpcmpeq{size} 指令?
我想知道是否可以按照以下方式做一些事情: <pre><code>vpcmpeqb %ymm16, %ymm17, %ymm16 </code></pre> 尝试使用
作者:佚名 时间:2022-05-15
为什么 glibc memcpy 不选择 avx512 版本?
我编译了以下示例代码: <pre><code> #cat array_addition.c #define MAX 1000000 #define S 1024 #include <string.h>
作者:佚名 时间:2022-05-15
SIMD:位包有符号整数
无符号整数可以使用“位打包”技术进行压缩:在无符号整数块中,仅存储有效位,当块中的所有整数
作者:佚名 时间:2022-05-12
AVX-512 - 使用英特尔 SDE 调试应用程序不起作用
我正在尝试使用 <a href="https://software.intel.com/content/www/us/en/develop/articles/intel-software-development-emulator.html" re
作者:佚名 时间:2022-05-12
是否有类似于 _mm256_mulhi_epu16 的 AVX、AVX2 或 AVX512 函数,但适用于 8 位?
<a href="https://software.intel.com/sites/landingpage/IntrinsicsGuide/#expand=3967,3970&text=_mm256_mulhi_epu16" rel="nofollow norefe
作者:佚名 时间:2022-05-10
如何在 C# 中获得 AVX512? 注意事项
我想在 C# 中使用 <code>AVX-512</code> 指令,但我的理解是:不支持它(或者我在互联网上搜索非常糟糕)。
作者:佚名 时间:2022-05-10
AVX512 - 如何将所有设置位向右移动?
如何将掩码寄存器的所有设置位向右移动? (到底部,最不重要的位置)。 例如: <pre class="lan
作者:佚名 时间:2022-05-10
AVX512 - 使用掩码按索引左包装元素
简而言之,我正在尝试按索引压缩(左包)64 位整数。 <em>scatter</em> 和 <em>compress</em> 内在函数都不能直
作者:佚名 时间:2022-05-10
AVX-512 - 如何使用汇编指令从内存中收集数据?
我正在尝试使用汇编指令从内存中收集 64 位整数。您可以在下面看到我如何从 <code>assembly</code> 调用 <cod
作者:佚名 时间:2022-05-03
在 SSE/AVX 中高效计算 X 的能力
我正在寻找最高效的方法来计算 SSE-128/AVX-256/AVX-512 寄存器(128 位和 256 位和 512 位)中所有浮点 <code>X</c
作者:佚名 时间:2022-04-24
使用 SIMD 有效地评估大型多项式
我有相当大(20-40 度)缓慢收敛(有时)的浮点多项式。我想使用 SIMD(SSE2、AVX1、AVX-512)优化他们的评
作者:佚名 时间:2022-04-24
_mm512_dpbusd_epi32 AVX-512VNNI 指令的 AVX-512BW 仿真
从 Cascade Lake Intel CPU 开始有 <a href="https://en.wikichip.org/wiki/x86/avx512_vnni" rel="nofollow noreferrer">AVX-512 VNNI</a>
作者:佚名 时间:2022-04-24
AVX-512:_mm512_load 与标准指针转换?
在我的测试中,以下代码似乎可以正常执行: <pre><code>double* ptr = _aligned_malloc(sizeof(double) * 8, 64); __m512
作者:佚名 时间:2022-04-23
使用 AVX-512 的两个集合的 SIMD 矢量交集:需要加速
我目前需要将两个已排序的向量相交。 这是我的实现: <pre><code>#include <immintrin.h> #include <
作者:佚名 时间:2022-04-22
上一页
1
2
3
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 三星当前最强PC SSD“PM9E1”启动量产,
• 向智能家居迈进!苹果2025年将发布home
• 中国平板市场大洗牌 为什么华为能够力压
• iFixit拆解苹果AirPods 4耳机:仍是“维
• 英伟达RTX 5090笔记本显卡曝光:24GB G
• 平台惊现英伟达GeForce RTX GT610!竟已
• 联想ThinkBook 16+ 2025锐龙AI 9 365版
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot