手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
人工智能
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
language-model
language-model专题提供language-model的最新资讯内容,帮你更好的了解language-model。
深度学习模型训练过程中修改学习率
以下是配置 <a href="https://huggingface.co/transformers/main_classes/trainer.html#trainingarguments" rel="nofollow noreferrer">Train
作者:佚名 时间:2022-05-27
HuggingFace - config.json 中的 GPT2 Tokenizer 配置
GPT2 微调模型在 <a href="https://huggingface.co/models" rel="nofollow noreferrer">huggingface-models</a> 中上传以进行推理</p
作者:佚名 时间:2022-05-24
用于句子解码的维特比算法
我正在做一个项目,我需要使用 Viterbi 算法在句子列表中查找未知单词。我有一个带有一些掩码词的序
作者:佚名 时间:2022-05-24
解决 ktrain 预测器与学习器预测中的速度差异?
我正在使用 ktrain Huggingface 库来构建语言模型。在将其用于生产时,我注意到,“学习者预测”与“预测
作者:佚名 时间:2022-05-24
为 Windows 设置 kenlm
官方 <a href="https://kheafield.com/code/kenlm/" rel="nofollow noreferrer">website</a> 明确表示 Windows 不支持 <code>kenlm</code
作者:佚名 时间:2022-05-23
多大的数据应该适合微调 GPT-2
我正在尝试使用一些用于英语考试数据的文本来微调 <strong>GPT-2</strong>。 但是,我没有很多数据,因为
作者:佚名 时间:2022-05-23
使用 FB XLM 遇到数据路径问题os.path.isdir(path) 在它存在时返回 false
我正在尝试对实现 FB 的 XLM(跨语言模型)的 FB 转码器 (<a href="https://github.com/facebookresearch/TransCoder" rel="n
作者:佚名 时间:2022-05-22
如何为空白令牌预测计算变压器损失?
我目前正在尝试实现一个变压器,但无法理解其损耗计算。 我的编码器输入查找 batch_size=1 和 max_se
作者:佚名 时间:2022-05-22
在 MATLAB 中加载 FastText 模型
我已经用 Python 训练了一个 FastText 模型并将文件保存到一个文件夹中。这些是文件夹的内容: <pre><cod
作者:佚名 时间:2022-05-22
如何将掩码合并到负似然损失中 (torch.nn.functional.nll_loss)
你好,我正在为语言建模实现一个 lstm 对于家庭作业,我处于亏损实施阶段。我们的讲师告诉我们使用 F
作者:佚名 时间:2022-05-18
微调休闲语言模型
我想通过特定对话交流中的拥抱脸微调变压器模型,以便教它像特定的说话者一样聊天。例如,训练模
作者:佚名 时间:2022-05-17
BERT:作为掩码语言模型一部分的输入嵌入的权重
我查看了 BERT 掩码语言模型的不同实现。 对于预训练,有<strong>两个</strong>常见版本: <ol> <li>解码器
作者:佚名 时间:2022-05-16
Huggingface GPT 变压器层输出
我正在尝试使用 GPT 语言模型并获取它在文本生成的最后状态中分配给每个单词的权重。我的模型是来自
作者:佚名 时间:2022-05-15
pip 在特定文件夹中安装 spacy 语言模型
我想在与默认文件夹不同的特定文件夹中安装多个语言模型。 如何进行? 以下似乎不起作用
作者:佚名 时间:2022-05-14
关于 BertForMaskedLM
我最近阅读了有关 Bert 的文章,并想将 BertForMaskedLM 用于 fill_mask 任务。我知道伯特架构。另外,据我所
作者:佚名 时间:2022-05-12
我们如何将 DocNADE 模型扩展到 DocNADE-LM 实现 N-grams 模型以及词袋?
DocNADE 论文代码如何扩展到论文中讨论的 DocNADE-LM?我们如何初始化嵌入矩阵 W? 纸:<a href="https://w
作者:佚名 时间:2022-05-04
如何微调孟加拉语的 bert 语言模型
我想在孟加拉语上微调 bert 多语言模型。谁能给我一些简单的资源,比如 colab notebook,或者多语言模型
作者:佚名 时间:2022-05-03
转换器管道中的填充掩码使用
我微调了一个 gpt2 语言模型,并使用以下代码行根据我的模型生成文本: generator = pipeline('text-genera
作者:佚名 时间:2022-05-03
如何使用未标记数据微调 GPT2 语言模型
我正在使用 GPT2 创建语言模型(即下一个词预测器)。我已关注此博客 <a href="https://www.analyticsvidhya.com/bl
作者:佚名 时间:2022-05-03
添加 Word2Vec 嵌入列表是否会提供有意义的表示?
我正在使用预训练的 word2vec 模型 (word2vec-google-news-300) 来获取给定单词列表的嵌入。请注意,这不是我们
作者:佚名 时间:2022-04-29
上一页
1
2
3
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 三星当前最强PC SSD“PM9E1”启动量产,
• 向智能家居迈进!苹果2025年将发布home
• 中国平板市场大洗牌 为什么华为能够力压
• iFixit拆解苹果AirPods 4耳机:仍是“维
• 英伟达RTX 5090笔记本显卡曝光:24GB G
• 平台惊现英伟达GeForce RTX GT610!竟已
• 联想ThinkBook 16+ 2025锐龙AI 9 365版
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot