手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
Office软件下载
Mac清理软件
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
网络运维
设计教程
技术频道
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
corpus
corpus专题提供corpus的最新资讯内容,帮你更好的了解corpus。
使用 NLTK
我有 txt 扩展的语料库,格式如下: <pre><code>Mike NNP B-PERSON Noah NNP I-PERSON eats VB O donuts NN O Sarah NNP B-PERS
作者:佚名 时间:2022-05-29
是否有使用自定义字典进行清理的 R 函数优化
我有一个自定义字典(作为字符列表加载),我想用它来清理数据集(包含 100,000 多个元素的 VCorpus)中
作者:佚名 时间:2022-05-28
使用 Python、NLTK 分析德语文本
我是 Python 的初学者,目前正在尝试使用 NLTK 来分析德语文本(提取德语名词及其德语文本的频率),请
作者:佚名 时间:2022-05-25
解析 XML-TEI 并在 R 中转换为语料库
我有三个 XML-TEI-P5 文件要转换为语料库(最好使用 <code>stylo</code>、<code>quanteda</code> 或 <code>tm</code> 语料
作者:佚名 时间:2022-05-22
当二进制释义检测标记任务出现问题时该怎么办?
我正在研究与释义检测相关的数据集注释。最终标签是 0 或 1。 三个人注释掉了。标签为 0、0.25、0.5、0.
作者:佚名 时间:2022-05-15
将整个列转换为语料库
df 有两列包含文本。我想分别将它们转换为语料库。 df <pre><code>id | Description 1 |Desc
作者:佚名 时间:2022-05-14
Quanteda - 从具有多个文档的数据帧创建语料库
这里是第一个问题,因此对任何失礼表示歉意。我在 R 中有一个包含 4 个变量的 657 个观察值的数据框。
作者:佚名 时间:2022-05-14
从头开始创建语料库时摆脱 .DS_Store 文件
我对 Python 非常陌生,我需要从头开始创建一个语料库。我遇到了 .DS_Store 文件的问题。我尝试手动擦除
作者:佚名 时间:2022-05-14
nltk.corpus - 'getset_descriptor' 对象没有属性 'setdefault'
我正在使用以下代码并从 nltk 导入停用词 <pre><code> #from nltk.corpus import words as word_corp from nltk.corpus
作者:佚名 时间:2022-05-13
(function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, : 参数暗示不同的行数:1, 3, 4
我正在尝试从 json 文件创建数据框。 我尝试了以下代码: > 头(名称(data_jstor)) <pre><code>[1]
作者:佚名 时间:2022-05-10
读写大文本文件python太慢
这段代码遍历了一个 5.1GB 的大文本文件,并检查是否有出现次数少于 100 次的单词。然后将 5.1GB 重写为
作者:佚名 时间:2022-05-10
从 txt 文件创建语料库
我已经创建了主题模型(gensim、LDAvis 等),现在我想在上下文中查看主题模型中的单词,例如,通过查
作者:佚名 时间:2022-05-09
如何将小标题更改为 R 上的语料库?
我正在尝试对某些数据进行主题建模。为此,我必须将我的 770 行数据转换为语料库,然后转换为文档术
作者:佚名 时间:2022-05-03
NLTK - 作为一个文件访问布朗语料库
我最近开始使用 NLTK,并下载了 Brown 语料库来分析其数据。但是,我看到语料库被分成了大约 500 个文件
作者:佚名 时间:2022-05-02
如何使用 R 计算文档集合/语料库中最常出现的术语/单词?
首先我创建一个文档术语矩阵,如下所示 <pre><code>dtm <- DocumentTermMatrix(docs) </code></pre> 然后我取每
作者:佚名 时间:2022-05-01
R:如何复制一列,如果第 x 行的原始值为“TRUE”,则副本将在 x-250 到 x+250 行中为“TRUE”? 测试
希望这个问题提的很清楚!我查看了许多关于循环和 if_else 子句等的指南,但还没有弄清楚这一点。
作者:佚名 时间:2022-04-30
如何将 print() 的结果保存到目录中的 .txt 文件中?
我想对包含 24 个 .txt 文件 (<code>dir1</code>) 的语料库进行词形还原并将它们保存在 <code>dir2</code> 中。我想
作者:佚名 时间:2022-04-30
qa 系统中缺少黄金语料库
我知道为了评估 QA(问答)系统,您需要将输出(答案)与黄金标准进行比较。我的问题是,在没有黄
作者:佚名 时间:2022-04-28
无法在 NLTK 中访问下载的语料库
我已经通过 <code>nltk.download</code> 下载了俄语 NLTK 语料库,但我实际上无法使用它(Python 3.6.9、NLTK 3.5)
作者:佚名 时间:2022-04-28
使用 lapply 创建语料库时的内存问题
我的最终目标是将数千个 pdf 转换为语料库/文档术语矩阵,以进行一些主题建模。我正在使用 pdftools 包
作者:佚名 时间:2022-04-28
上一页
1
2
3
下一页
小编推荐
苹果市值2025年有望达4万亿美元
• 微信青少年模式全新升级:视频号内容分
• 《地下城与勇士DNF》永久交通卡卡面上线
• 优酷为方便长辈看视频,上线银发剧场!
• 微信读书集成腾讯混元AI技术,可以一日
• 京东快递上线11项会员权益
• 高德地图功能升级,新增安全预警
• 小爱同学多模态能力升级,引领智能生活
热门标签
更多
python
JavaScript
java
HTML
PHP
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot