attention-model - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

attention-modelattention-model专题提供attention-model的最新资讯内容，帮你更好的了解attention-model。

无法训练基于注意力的CNN

我已经定义了链接中给出的注意力模型 <a href="https://stackoverflow.com/questions/63071082/invalidargumenterror-in-model-f

作者：佚名时间：2023-06-14

pytorch，将一个向量的置换添加到矩阵的项时摆脱for循环？

我正在尝试实施本文，并坚持了这一简单步骤。尽管这是要引起注意的，但我坚持要做的只是如何在不

作者：佚名时间：2022-08-15

香草编码器-解码器架构中的Implemenet注意

我已经尝试过以下一种Vanila enc-dec拱门（英语为法语NMT） <a href="https://i.stack.imgur.com/rQfut.png" rel="nof

作者：佚名时间：2022-08-13

为什么torch.nn.MultiheadAttention中的W_q矩阵是平方的

我正在尝试在我的网络中实现nn.MultiheadAttention。根据{{3}}， <blockquote> embed_dim –

作者：佚名时间：2022-08-13

Tensorflow 1的编码和解码注意

我参加了使用Tensofrlow 1.13.2的<a href="https://github.com/KMdsy/DTCR" rel="nofollow noreferrer">this</a>项目。 该项目

作者：佚名时间：2022-08-13

网络值通过线性层变为0

我设计了图注意力网络。 但是，在图层内部进行操作时，要素的值将变为相等。 <pre><code>clas

作者：佚名时间：2022-08-12

自我注意对输入大小敏感吗？

我有一个层次模型，其中使用自我关注（来自Transformer）对句子中的每个单词进行编码，然后使用另一个

作者：佚名时间：2022-06-22

LSTM回归的Keras注意层问题

我正在将<code>keras</code> <code>LSTM</code>用于回归模型。我想对原始输入内容使用一种注意力机制，如本<a hr

作者：佚名时间：2022-07-09

Tensorflow的AdditiveAttention实现没有权重

我试图了解如何在<code>Tensorflow</code> / <code>Keras</code>中实现新的（自定义）图层。 Bahdanau的“添加剂注意

作者：佚名时间：2022-06-13

Colab资源和自我注意分配张量时为OOM

我正在尝试使用Keras在google Colab上实现自我注意GAN。当我测试注意层时，出现OOM错误。那么，我在矩阵乘

作者：佚名时间：2022-07-27

了解巴赫达瑙的注意力线性代数

下图中，巴赫达瑙的加法注意力被视为等式4的第二部分。 <hr /> <a href="https://i.stack.imgur.com/zfnqD.png"

作者：佚名时间：2022-06-13

在基于LSTM的编码器上应用双向包装时出错

我写了一个自定义的编码器。我第一次使用双向LSTM包装器，这样做可能会出错。编译模型时出现<code>clas

作者：佚名时间：2022-06-12

为什么Keras不能在lstm层返回单元状态的完整序列？

我正在尝试实现一种关注机制，其中我需要单元格状态的完整序列（就像隐藏状态的完整序列一样）。 K

作者：佚名时间：2022-06-12

初始化为零时的LSTM + Keras错误注意

我正在尝试具体实施<a href="https://arxiv.org/pdf/1704.02971.pdf" rel="nofollow noreferrer">this paper</a>，即注意输

作者：佚名时间：2022-06-12

巴赫达瑙的州规模注意

我目前正在尝试计算此函数以引起Bahdanau的注意 <a href="https://i.stack.imgur.com/hpnlf.png" rel="nofollow noreferrer"><i

作者：佚名时间：2022-06-12

断言失败：[条件x == y不按元素进行：]

我为句子分类任务建立了带有注意层的BiLSTM模型，但由于参数数量不匹配，我的断言失败，我得到一个

作者：佚名时间：2022-06-12

keras lstm如何在图形编译期间获取初始隐藏状态

我在keras中有一个lstm层，我要添加“注意”。我想获取初始隐藏状态（零张量）并将其传递给我的Attentio

作者：佚名时间：2022-06-12

为什么Bahdanau中的编码器隐藏状态形状与编码器输出形状不同

此问题与此处显示的神经机器翻译有关： <a href="https://github.com/tensorflow/docs/blob/master/site/en/tutorials/text/nmt

作者：佚名时间：2022-06-12

使用解码器隐藏状态和编码器输出来计算张量流中Bahdanau注意的得分，

此问题与此处显示的神经机器翻译有关：<a href="https://www.tensorflow.org/tutorials/text/nmt_with_attention" rel="nofollo

作者：佚名时间：2022-06-12

在Google Colab中运行Longformer模型时使Cuda内存不足使用Bert的类似代码可以正常工作

我正在使用Longformer模型进行文本分类。我什至只取了前100行数据框。我收到内存错误。我正在使用Google

作者：佚名时间：2022-06-11

小编推荐

苹果市值2025年有望达4万亿美元