如何解决打包 python 代码依赖项,用于即时远程执行
我的情况如下,我们有:
- 一个“映像”,其中包含我们在软件方面的所有依赖项 + 我们的内部
python
软件包 - 一个“pod”,其中根据命令加载此类图像(kubernetes pod)
- 一个
python
项目,它有一些未提交的自己的代码,它利用了内部包 - 另外请假设您不能直接在机器(或集群)上工作(比如远程
SSH
解释器)。集群是多租户的,我们希望尽可能地优化它,以便在试验之间没有空闲时间 - 现在忘记安全问题,一切都在我们身边,所以没有问题
我们希望基本上远程“分配”工作负载 - 即a script.py
-(在我们的本地机器中不可行)不受 git commit 的约束,因此能够“即时”进行。这是必要的,因为所有更改本质上都是实验性的(想想 ETL/管道类型的分析):我们希望能够进行大规模实验,但对 git 没有限制。
我尝试了 dill
但我无法让它工作(可能是由于代码的结构)。理想情况下,我想复制应用于 mleap
的 ML 管道的概念 Spark
,但规模要小得多,基本上是打包,但几乎没有限制。
此用例的首选路线是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。