如何解决用对角矩阵计算对称秩k更新的最快方法
我想用等式更新对称矩阵C
C = alpha*A*D*A^T + beta*C
其中A是n×k的通用矩阵,D是对角矩阵。
使用BLAS和LAPACK进行计算的最有效方法是什么?是否有类似syrk(netlib)的东西,但是允许对角乘数?可能通过BLAS 3级扩展?
使用MKL,您可以计算
B = A*D
然后使用MKL的扩展名gemmt(英特尔)仅计算A * B^T
的下三角部分
但这似乎不是最有效的方法,因为B = A * D
计算是不必要的额外工作。我想知道是否有专门的内核,因为这似乎是一种常见的计算。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。