attention-model - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

attention-modelattention-model专题提供attention-model的最新资讯内容，帮你更好的了解attention-model。

标志着BERT编码器结束的层数是多少？

我正在阅读一篇研究论文，其中使用编码器的输出而不是 bert 模型的最终输出（注意力自动编码器的输出）

作者：佚名时间：2022-04-23

为什么语言翻译 ML 模型不起作用？

我使用 TensorFlow 函数式 API 创建了一个语言翻译模型。这是我用过的编码器-解码器模型。 <pre><c

作者：佚名时间：2022-04-23

为什么 PyTorch MultiheadAttention 被认为是激活函数？

当滚动 PyTorch 包 (<a href="https://pytorch.org/docs/stable/nn.html#non-linear-activations-weighted-sum-nonlinearity" rel="nofollow n

作者：佚名时间：2022-04-22

将 tf1 中的代码转换为 tf2 时出错

值在哪里 <pre><code>rnn_size: 512 batch_size: 128 rnn_inputs: Tensor("embedding_lookup/Identity_1:0", shape=(?, ?, 128)

作者：佚名时间：2022-04-22

尝试获取注意力层权重但收到错误：FailedPreconditionError: 找不到变量 attention_score_vec_1/kernel

我使用以下代码初始化并拟合模型：（使用两个 epoch 只是为了测试它是否运行） <pre><code>import tensorf

作者：佚名时间：2022-04-22

将 SparseAttention 与 DeepSpeed 结合使用时遇到运行时错误

我正在使用 Transformer 构建自回归模型，但潜在空间有点大。因此，我试图采用稀疏注意力。我从 <a href=

作者：佚名时间：2022-04-22

tensorflow 多头注意力层是自回归的吗？例如“tfa.layers.MultiHeadAttention”

我研究了 Transformer 架构中自回归与非自回归之间的区别。但我想知道 TensorFlow 中的注意力层是否实际上

作者：佚名时间：2022-04-22

当我使用 Transformer 模型训练翻译器时，为什么它不能将 y 转换为张量

<pre><code>def encoder(): input_layer = Input(batch_shape=(None, 13, 128)) h= layer(input_layer) h= Masking(mask_value=0.0)(h)

作者：佚名时间：2022-04-22

是否可以将注意力权重与基于 CNN-LSTM 或基于 CNN-GRU 的网络中的输入直接关联以进行回归？

在基于 CNN-LSTM/GRU 的网络中，是否仍然可以将注意力层的权重直接与输入相关联，以可视化模型赋予输入

作者：佚名时间：2022-04-21

在 Keras 中具有注意力的 Seq2Seq 编码器解码器

我正在尝试在来自 Kaggle 的 In-Short 数据集上实现注意力机制，但我被解码器模块的这个输入张量困住了

作者：佚名时间：2022-04-21

Rstudio Keras attention_layer 应用

我几乎没有试图在 Rstudio 的库中找到一个（相当）最近为 Keras 引入的 <code>layer_attention</code> 示例。 <p

作者：佚名时间：2022-04-21

在显着图之间寻找损失

我目前正在做一个风格转移项目，想看看内容和风格图像的显着图之间的区别。我已经设法使实际传输

作者：佚名时间：2022-04-21

TensorFlow 的 Visual Attention 示例是否适用于 im2latex 问题？

我目前正在尝试为 im2latex 问题制定自己的解决方案。我在 github 上看到了一些项目，它们都使用 Visual Att

作者：佚名时间：2022-04-21

对 keras seq2seq 模型的注意力层

我已经看到 keras 现在带有 <a href="https://keras.io/api/layers/attention_layers/attention/" rel="nofollow noreferrer">Attention

作者：佚名时间：2022-12-23

如何使用 Tensorflow aocr API 从 SavedModel 生成注意力掩码？

我已经使用 Tensorflow AOCR API 训练了一个模型。接下来，我将其导出为 SavedModel 格式。作为输出节点，我

作者：佚名时间：2022-12-04

Keras，模型训练成功，但生成预测给出 ValueError：Graph disconnected：无法获得张量 KerasTensor

我为文本摘要创建了一个 Seq2Seq 模型。我有两种模型，一种有注意力，一种没有。没有注意力的人能够

作者：佚名时间：2022-11-17

如何在 keras 中为 seq2seq 模型添加自注意力

我有这个带有点积注意力层的模型。我已经注释掉了代码中的部分。我如何使用自我注意力而不是我拥

作者：佚名时间：2022-09-26

图断开：无法在推理模型中获取张量 KerasTensor 的值，但原始模型拟合成功

这基本上是 <a href="https://stackoverflow.com/questions/68444781/keras-model-trains-successfully-but-generating-predictions-gives-va

作者：佚名时间：2022-07-11

是否可以在灰度图像数据集上应用通道注意力网络？

大多数基于通道注意力网络的研究工作使用 RGB 图像进行图像分类或使用多通道进行信号分类。所以我的

作者：佚名时间：2022-07-08

分层注意网络中的输入层代表什么

我正在尝试掌握分层注意力网络(HAN)的概念,我在网上找到的大多数代码或多或少与此处的代码相似：https://medium.com/jatana/report-on-text-classification-using-cnn-rnn-han-f0e887214d5f：embedding_layer=Embedding(len(word_index)+1,E

作者：佚名时间：2019-12-20

小编推荐

苹果市值2025年有望达4万亿美元