如何解决Snakemake:参数键的通配符
我正在尝试创建一条蛇形规则,其输入和输出是由通配符指定的配置参数,但存在问题。
我想做类似的事情:
config.yaml
cam1:
raw: "src/in1.avi"
bg: "out/bg1.png"
cam2:
raw: "src/in2.avi"
bg: "out/bg2.png"
cam3:
raw: "src/in3.avi"
bg: "out/bg3.png"
Snakefile:
configfile: "config.yml"
...
rule all:
input:
[config[f'cam{id}']['background'] for id in [1,2,3]]
rule make_bg:
input:
raw=config["{cam}"]["raw"]
output:
bg=config["{cam}"]["bg"]
shell:
"""
./process.py {input.raw} {output.bg}
"""
但这似乎不起作用 - 我希望将 {cam}
视为通配符,而是收到 {cam}
的 KeyError。有人可以帮忙吗?
是否可以将 {cam}
指定为可以用作配置键的通配符(或其他内容)?
解决方法
我认为这种方法存在一些问题:
概念上
在 input
中指定确切的 output
和 config
文件名没有多大意义,因为这与您使用 snakemake
的原因截然相反:从输入推断需要运行管道的哪个部分来创建所需的输出。在这种情况下,您总是必须首先编辑每个输入/输出对的配置,而自动化的全部意义就丢失了。
现在,实际的问题是从 config
访问 input
和 output
的配置变量。通常,您会例如在配置中提供一些路径并使用以下内容:
config.yaml
:
raw_input = 'src'
bg_output = 'out'
在管道中,您可以像这样使用它:
input: os.path.join(config['raw_input'],in{id}.avi)
output: os.path.join(config['bg_output'],bg{id}.avi)
就像我说的,在配置文件中特别指定输出是没有意义的。
如果您要在 config.yaml
中指定输入:
cam1:
raw: "src/in1.avi"
cam2:
raw: "src/in2.avi"
cam3:
raw: "src/in3.avi"
然后您可以使用如下函数获取输入:
configfile: "config.yaml"
# create sample data
os.makedirs('src',exist_ok= True)
for i in [1,2,3]:
Path(f'src/in{i}.avi').touch()
ids = [1,3]
def get_raw(wildcards):
id = 'cam' + wildcards.id
raw = config[f'{id}']['raw']
return raw
rule all:
input: expand('out/bg{id}.png',id = ids)
rule make_bg:
input:
raw = get_raw
output:
bg='out/bg{id}.png'
shell:
" touch {input.raw} ;"
" cp {input.raw} {output.bg};"
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。