微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

用于为 AutoML Natural Language 创建 JSONL 训练文件的 Python 脚本

如何解决用于为 AutoML Natural Language 创建 JSONL 训练文件的 Python 脚本

我正在尝试为 AutoML Natural Language 创建 JSONL 训练文件,它在 docs

为了帮助您创建 JSONL 训练文件,AutoML Natural Language 提供了一个 Python script,可以将纯文本文件转换为 格式正确的 JSONL 文件。查看脚本中的注释 详情。

我试图关注评论,但我没有得到它们 我试着用这个运行它

python jason.py C:\..dic.csv C:\..text.txt gs://mybucket

但它给了我:

(with 5 blank lines skipped)
Traceback (most recent call last):
  File "jason.py",line 688,in <module>
    main()
  File "jason.py",line 680,in main
    UploadFiles(annotated_files,FLAGS.target_gcs_directory)
  File "jason.py",line 636,in UploadFiles
    f.write(csv_line)
TypeError: write() argument must be str,not bytes

谁能帮我举例说明如何运行script

解决方法

使用python2创建的tool。您可以运行 python2 jsonl_converter.py -s sample_1.txt gs://your-bucket 以免编辑提供的代码。或者,如果您需要在 python3 中运行它,您可以按照@Justin Ezequiel 的建议进行操作。我只是使用了 -s 选项来自动拆分长文件。

使用 python 2 进行测试: enter image description here

指定 GCS 存储桶中的 JSONL: enter image description here

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。