如何解决AI平台Google云计算中的pip3安装错误
我最近一直在尝试向GCP的AI平台提交培训任务。
我成功提交了使用以下代码训练pytorch变压器模型的任务:
gcloud ai-platform jobs submit training ${JOB_NAME} \
--region=us-west1 \
--module-name PipeLiner.PCM_main \
--master-image-uri=gcr.io/cloud-ml-public/training/pytorch-cpu.1-4 \
--package-path ../PipeLiner/ \
--scale-tier=BASIC \
--job-dir=${JOB_DIR} \
-- \
--config_file=/Users/mukundhmurthy/PycharmProjects/PipLinerTop/PipeLiner/PCM.yaml \
--num-epochs=1 \
--batch-size=2 \
--learning-rate=0.00001 \
在gcloud日志中,我不断收到此错误:
subprocess.CalledProcessError: Command '['pip3','install','--user','--upgrade','--force-reinstall','--no-deps','tape-pcm-trainer-0.1.tar.gz']' returned non-zero exit status 1.
考虑到这与我的setup.py文件有关,我也在那里检查了代码:
from setuptools import find_packages
from setuptools import setup
with open('requirements.txt') as f:
req = f.read().splitlines()
setup(
name='tape-pcm-trainer',version='0.1',install_requires=req,packages=find_packages(),include_package_data=True,description='gcloud package for training TAPE on PCM dataset'
)
我还运行了python setup.py sdist以确保代码可以为我的程序包创建正确的tar.gz文件。
我检查了我的python版本,并确保将我的点更新为最新版本。关于如何克服此错误的任何帮助都将非常有用。
更新:这不是gcloud问题。当我生成我的requirements.txt文件时,一些conda要求会将自己隐藏到文件中。不幸的是,gcloud培训作业记录器没有显示超出dockerfile中运行命令的堆栈跟踪,因此花了一些时间才能确定。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。