无法使用 tensordot 重新创建具有“交错”输出索引的一行 einsum 函数?

如何解决无法使用 tensordot 重新创建具有“交错”输出索引的一行 einsum 函数?

NumPy 的 tensordoteinsum 函数间的异同有详细记录,并在本论坛中进行了广泛讨论(例如 [1][2]、{{3} }、[3][4])。但是,我遇到了一个使用 einsum 的矩阵乘法实例,我发现使用 tensordot 进行复制非常困难,如果不是不可能的话:如果我们的两个数组是,

>>> A = np.array([[0,1],[1,0]])
>>> B = np.arange(2 ** 4).reshape((2,2,2))

是否存在一行 tensordot 等价于以下内容

>>> np.einsum("ab,ibjk->iajk",A,B)
array([[[[ 4,5],[ 6,7]],[[ 0,[ 2,3]]],[[[12,13],[14,15]],[[ 8,9],[10,11]]]]) 

根据我的发现,答案似乎是否定的。问题出现在输出维度 iajk 的索引中。此处,数组a 的维度A 出现在数组i 的维度jB 之间。如果输出维度的索引改为 aijknp.tensordot(A,B,(1,1)) 会正常工作。我使用所有可能的轴进行了测试,以确保

>>> output_einsum = np.einsum("ab,B)
>>> axes_A = [-2,-1,1]
>>> axes_B = [-4,-3,-2,1,3]
>>> for i in axes_A:
...     for j in axes_B:
...         output_tensordot = np.tensordot(A,axes=(i,j))
...         if np.allclose(ouput_einsum,output_tensordot):
...             print(i,j)
...

并发现没有允许轴的组合产生预期的结果。请注意,B 的维度将 axes 参数的每个元素限制为长度为 1。使用 einsum 不能在一行中重现具有交错输出维度的 tensordot 函数是否正确?如果是这样,是否存在多行解决方法

解决方法

正如我在之前的回答中强调的那样,tensordotnp.dot 的扩展,允许我们指定乘积总和中使用的维度。 dot 默认为 A 的最后一个,B 的第二个到最后一个。

这说明了 dot 如何处理大于 2 的维度:

In [158]: np.dot(np.ones((2,3,4)),np.ones((5,4,7))).shape
Out[158]: (2,5,7)

按照tensordot 的说法,B 的非收缩尺寸遵循A 的尺寸。所以采用相同的数组,但移动轴,产生相同的结果。

In [162]: np.tensordot(np.ones((2,3)),7,(1,2)).shape 
Out[162]: (2,7)

在这些示例中,我选择了不同的维度,因此顺序更加明显。

tensordot 不提供重新排序非收缩维度的方法。但是您可以在之后轻松地做到这一点。

您的示例周围有尺寸 2 的尺寸。这允许您指定轴的任意组合,但需要使用 allclose 来测试结果。

In [146]: >>> A = np.array([[0,1],[1,0]])
     ...: >>> B = np.arange(2 ** 4).reshape((2,2,2))

在两个数组的第二个轴上执行乘积和:

In [147]: C=np.tensordot(A,B,1))
In [148]: C.shape
Out[148]: (2,2)
In [149]: C
Out[149]: 
array([[[[ 4,5],[ 6,7]],[[12,13],[14,15]]],[[[ 0,[ 2,3]],[[ 8,9],[10,11]]]])

以及带有默认结果排序 ('aijk') 的 einsum

In [150]: D= np.einsum('ab,ibjk',A,B)
In [151]: np.allclose(C,D)
Out[151]: True

tensordot 相当于此 dot

In [152]: E = np.dot(A,B.reshape(2,4))
In [153]: E.shape
Out[153]: (2,4)
In [154]: np.allclose(C,E.reshape(2,2))
Out[154]: True
In [155]: np.allclose(E,np.einsum('ab,ibk',4)))
Out[155]: True

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?