如何解决在具有 1 列的数据集上构建分类模型
我正在尝试对推文进行情绪分析。在这个阶段,我正在尝试按照老师的要求学习有监督和无监督学习。我从 Twitter 中检索了 500 条推文,对它们进行了清理和提取,然后将语料库转换为数据框以构建分类模型。我的数据框只有 1 列,其中包含所有推文作为单独文本文件中的文本:
之后,我写了这段代码,将数据帧拆分为训练集和测试集,但是运行起来却失败了:
#Creating a Classification model (Supervised Learning)
set.seed(100)
TrainingIndex <- caret::createDataPartition(dataframe,p=0.8,list = FALSE)
TrainingSet <- dataframe[TrainingIndex,] #Training Set
TestingSet <- dataframe[-TrainingIndex,] #Testing Set
我收到此错误,提示所有参数必须具有相同的长度才能继续:
这是什么意思?我该如何解决这个问题? 任何帮助将不胜感激!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。