如何解决使用 Hugging Face 微调 QuestionAnswer Camembert 的问题
我正在尝试利用法语创建一个问答系统。 为了实现我的目标,我利用了链接中 colab 代码中的代码:https://colab.research.google.com/drive/1uSlWtJdZmLrI3FCNIlUHFxwAJiSu2J0-
我的代码的不同之处在于预训练模型的加载
from transformers import AutoTokenizer,AutoModelForQuestionAnswering
source_model = 'etalab-ia/camembert-base-squadFR-fquad-piaf'
model_fr = AutoModelForQuestionAnswering.from_pretrained(source_model)
tokenizer_fr = AutoTokenizer.from_pretrained(source_model,use_fast=False)
问题答案的微调模型与以下链接有关: https://huggingface.co/etalab-ia/camembert-base-squadFR-fquad-piaf
我收到的错误是“IndexError: index out of range in self”并且与 def answer_question(question,answer_text) 函数,在代码点引发期望
# ======== Evaluate ========
# Run our example through the model.
outputs = model(torch.tensor([input_ids]),# The tokens representing our input text.
token_type_ids=torch.tensor([segment_ids]),return_dict=True)
我尝试了经过微调的 cAmbert 的其他模型,但它们不起作用。 我尝试过使用 mrm8488/bert-multi-cased-finetuned-xquadv1 (https://huggingface.co/mrm8488/bert-multi-cased-finetuned-xquadv1 ),它在不同的语言上进行了微调而不是法语,但结果并不那么有希望(尽管我正在利用零样本跨语言此处解释了 mBERT 的属性:https://arxiv.org/abs/1906.01502 显示了类似拓扑语言的 mBERT 的强大功能)
知道如何处理卡门培尔奶酪的具体问题吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。