微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

是否有任何机器学习模型都适合此数据集和所需的输出?

如何解决是否有任何机器学习模型都适合此数据集和所需的输出?

我的数据集包含来自各个网站的视频游戏标题,格式不同。这是我的示例:

"The Legend Of Zelda: Wind Waker,Nintendo"
"The Legend Of Zelda: The Wind Waker"
"The Legend Of Zelda: Wind Waker,Nintendo"
"The Legend Of Zelda: Wind Waker,Nintendo"
"Zelda: Wind Waker Hd Nintendo Wii U Game"
"The Legend Of Zelda: The Wind Waker"
"Legend Of Zelda: The Wind Waker Hd (nintendo Wii"
"The Legend Of Zelda: Wind Waker Of Game (nintendo"
"The Legend Of Zelda: The Wind Waker Nintendo Wii"
"Nintendo Wii U Game Zelda: Wind Waker Hd"
"The Legend Of Zelda: The Wind Waker Hd Wii U"
"The Legend Of Zelda: Wind Waker,Nintendo Pinterest"
"Zelda: Hd (nintendo Wii The"
"The Legend Of Zelda: The Wind Waker Hd Wii U Pinterest"
"The Legend Of Zelda: The Wind Waker Hd"
"Legend Of Zelda: Wind Waker Hd (nintendo Wii"
"The Legend Of Zelda: The Wind Waker Hd"
"The Legend Of Zelda: Wind Waker,Nintendo Wii U"
"The Legend Of Zelda Wind Hd"
"Zelda Wind Waker Hd"
"The Legend Of Zelda: Wind Waker,Nintendo Pinterest"
"The Legend Of Zelda Wind Waker Wii U Nintendo"
"Wii U The Legend Of Zelda: The Wind Waker Hd"
"Zelda: Wind Waker Hd"
"The Legend Of Zelda: The Wind Waker Hd Game Wii"
"The Legend Of Zelda: The Wind Waker Hd Nintendo Wii U"
"Zelda: Wind Waker Hd"
"The Legend Of Zelda The Wind Waker Hd Wii U"

此数据的正确输出为:

The Legend Of Zelda: The Wind Waker HD-标题

Wii U-平台

Nintendo-发布者

我可以为这些数据集提供100个模型,然后以我期望的结果作为正确的输出,然后希望该模型为未来的标题数据集“学习”期望的输出

机器学习可以做到这一点吗?我应该使用什么型号?我之前从未对ML做过任何事情,因此不确定这是否是一个好用例。

解决方法

正如我在您的问题中看到的那样,标题,平台和发布者(输出)是从原始数据(输入)中提取的,因此您可以使用类似于命名实体识别的方法,您应该查看文献以找出答案。还有更多,但这是您最应该去的方向。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。