微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

我应该如何处理 json/dataframe 格式的数据,以便适用于 rasa 聊天机器人

如何解决我应该如何处理 json/dataframe 格式的数据,以便适用于 rasa 聊天机器人

我是 NLP 和 rasa api 的新手。我正在尝试准备数据,以便将其用作意图识别的训练数据。我尝试使用的功能是:

from rasa_nlu.training_data import load_data   #Import function
train_data_rasa=load_data('/content/data_file.json') #Json file

但是会弹出下一个错误

AttributeError: 'str' object has no attribute 'get'

json 文件是使用pandas.to_json() 函数的结果。原始数据集是 ATIS 飞行意图数据框,其中有两列:文本和意图。 这是json文件的预览:

{"Intent":{"0":"atis_flight","1":"atis_flight_time","2":"atis_airfare","3":"atis_airfare","4":"atis_flight","5":"atis_aircraft","6" ........

我真的不知道发生了什么,因为数据集似乎很干净。我也尝试了多种替代方法,例如 markdown (md) 类型的文件,但似乎不起作用。

提前谢谢你!!

解决方法

我建议尝试使用 rasa data convert 命令(将您的训练数据从 json 格式转换为 yml 格式),然后尝试训练您的数据(使用 rasa train 中的命令 cli)看看你是否得到同样的错误。此外,文档中的 Training Data format 页面对您来说可能是一个有用的资源,因为它解释了训练数据的类型及其预期结构。另一个想法是将您的问题也发布到 Rasa 论坛上,那里可能有更多人遇到过类似 here 的错误。这样,您可能会获得更多关于如何解决问题的想法,或者更多人会加入并提供帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。