微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

AI平台Google云计算中的pip3安装错误

如何解决AI平台Google云计算中的pip3安装错误

我最近一直在尝试向GCP的AI平台提交培训任务。

我成功提交了使用以下代码训练pytorch变压器模型的任务:

gcloud ai-platform jobs submit training ${JOB_NAME} \
  --region=us-west1 \
  --module-name PipeLiner.PCM_main \
  --master-image-uri=gcr.io/cloud-ml-public/training/pytorch-cpu.1-4 \
  --package-path ../PipeLiner/ \
  --scale-tier=BASIC \
  --job-dir=${JOB_DIR} \
  -- \
  --config_file=/Users/mukundhmurthy/PycharmProjects/PipLinerTop/PipeLiner/PCM.yaml \
  --num-epochs=1 \
  --batch-size=2 \
  --learning-rate=0.00001 \

在gcloud日志中,我不断收到此错误

subprocess.CalledProcessError: Command '['pip3','install','--user','--upgrade','--force-reinstall','--no-deps','tape-pcm-trainer-0.1.tar.gz']' returned non-zero exit status 1.

考虑到这与我的setup.py文件有关,我也在那里检查了代码

from setuptools import find_packages
from setuptools import setup

with open('requirements.txt') as f:
    req = f.read().splitlines()

setup(
    name='tape-pcm-trainer',version='0.1',install_requires=req,packages=find_packages(),include_package_data=True,description='gcloud package for training TAPE on PCM dataset'
)

我还运行了python setup.py sdist以确保代码可以为我的程序包创建正确的tar.gz文件

我检查了我的python版本,并确保将我的点更新为最新版本。关于如何克服此错误的任何帮助都将非常有用。

更新:这不是gcloud问题。当我生成我的requirements.txt文件时,一些conda要求会将自己隐藏到文件中。不幸的是,gcloud培训作业记录器没有显示超出dockerfile中运行命令的堆栈跟踪,因此花了一些时间才能确定。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?