手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
language-model
language-model专题提供language-model的最新资讯内容,帮你更好的了解language-model。
使用变形金刚和pytorch的微调因果语言模型
我对使用变压器和PyTorch调整因果语言模型有一些疑问。 我的主要目标是微调XLNet。但是,我发现大
作者:佚名 时间:2022-08-14
在测试 bert 模型期间分配权重
我有一个基本的概念性疑问。当我在句子上训练 bert 模型时说: <pre><code>Train: "went to get loan from ban
作者:佚名 时间:2022-08-07
使用语言模型获得句子的概率
我已经使用以下架构训练了语言模型, <pre><code>model = tf.keras.Sequential([ tf.keras.layers.Embedding(total_words,
作者:佚名 时间:2022-06-22
神经网络语言模型的效果不及预期
我正在尝试使用神经网络来实现一些相对标准的语言模型,以更好地理解它们,并希望将来使它们适应
作者:佚名 时间:2022-06-11
如何使用Kenlm检查句子中的单词对齐方式?
我见过很多博客都说语言模型可以用于许多任务,但是除了文本生成之外,我找不到任何好的实现方式
作者:佚名 时间:2022-06-11
Bert词嵌入的微调
我想加载预训练的Bert模型并对其进行微调,尤其是使用自定义数据集对该模型的词嵌入进行微调。 任务
作者:佚名 时间:2022-06-11
有没有一种方法可以计算模型可以适合我的VRAM的大小?
我想从头开始训练语言模型,并使用我拥有的最大VRAM,如何计算它可以拥有多少参数?
作者:佚名 时间:2022-06-10
具有附加特征向量的RNN
我正在构建语言模型,并且我了解如何设置基本体系结构,但是,我需要能够将给定句子或序列的上下
作者:佚名 时间:2022-06-08
用熵还是困惑训练语言模型?
在训练语言模型中,我经常看到困惑被用作评估指标,但是,我感到困惑的是,是否仅将其用于只是确
作者:佚名 时间:2022-06-08
前馈神经网络语言模型
我目前正在尝试使用TensorFlow 2.0开发前馈神经网络n元语法模型。只是要清楚一点,我不希望通过循环神
作者:佚名 时间:2022-06-07
使用Python计算困惑
我目前正在训练一种语言模型,为了评估它,我编写了下面给出的函数来计算测试集的复杂性, <pre><
作者:佚名 时间:2022-06-06
如何使用n-gram完成分类任务?
我将使用<code>n-gram</code>在样本数据集上训练分类器。我搜索了相关内容,并在下面编写了代码。因为我
作者:佚名 时间:2022-06-06
变形金刚-如何在Torch版本1.4.0Albert中加载pytorch_model.bin
火炬版本1.4.0 我执行run_language_modeling.py并保存模型。但是,当我加载保存的模型时,出现“ OSError:无法
作者:佚名 时间:2022-06-05
Keras Lstm预测下一项,采用整个序列或滑动窗口滑动窗口是否需要状态LSTM?
我有一个序列预测问题,其中给定序列中的最后<code>n</code>个项目,我需要预测下一个项目。 我有
作者:佚名 时间:2022-06-03
如何通过 Python 从 XML 获取文本?
我正在训练语言模型。我的输入是 XML 格式的字幕。我只需要从中获取纯文本并将其保存到文本文件中,
作者:佚名 时间:2022-06-01
上下文相关循环神经网络语言模型
最近进行了一定数量的研究,通过将上下文信息合并到语言模型来提高语言模型的性能。这是因为下一
作者:佚名 时间:2022-06-01
Huggingface Transformer - GPT2 从保存的检查点恢复训练
恢复从 <code>GPT2</code> 实施的 <code>run_clm.py</code> 微调 GPT2 <a href="https://github.com/huggingface/transformers" re
作者:佚名 时间:2022-06-01
如何使用 LSTM 滞后模型在一个地方选择最合适的词
每当我要解决特定问题时,我都找不到正确的方法 我已经使用 LSTM 训练了一个语言模型。它可以生成下
作者:佚名 时间:2022-06-01
关于 GPT-1 辅助目标的输入
论文(通过无监督学习提高语言理解)在微调阶段使用辅助目标,它由两个带有标记数据集的目标函数
作者:佚名 时间:2022-05-29
从数据生成文件路径的语言模型或 GAN
因此,虽然我是一名中级 ML 工程师,但我的 NLP 技能并不是那么好。这是我的问题 给定数据: <
作者:佚名 时间:2022-05-28
上一页
1
2
3
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 三星当前最强PC SSD“PM9E1”启动量产,
• 向智能家居迈进!苹果2025年将发布home
• 中国平板市场大洗牌 为什么华为能够力压
• iFixit拆解苹果AirPods 4耳机:仍是“维
• 英伟达RTX 5090笔记本显卡曝光:24GB G
• 平台惊现英伟达GeForce RTX GT610!竟已
• 联想ThinkBook 16+ 2025锐龙AI 9 365版
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot