微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Snakemake:参数键的通配符

如何解决Snakemake:参数键的通配符

我正在尝试创建一条蛇形规则,其输入和输出是由通配符指定的配置参数,但存在问题。

我想做类似的事情:

config.yaml

cam1:
  raw: "src/in1.avi"
  bg: "out/bg1.png"
cam2:
  raw: "src/in2.avi"
  bg: "out/bg2.png"
cam3:
  raw: "src/in3.avi"
  bg: "out/bg3.png"

Snakefile:

configfile: "config.yml"

...
rule all:
  input:
    [config[f'cam{id}']['background'] for id in [1,2,3]]

rule make_bg:
  input:
    raw=config["{cam}"]["raw"]
  output:
    bg=config["{cam}"]["bg"]
  shell:
    """
    ./process.py {input.raw} {output.bg}
    """

但这似乎不起作用 - 我希望将 {cam} 视为通配符,而是收到 {cam} 的 KeyError。有人可以帮忙吗?

是否可以将 {cam} 指定为可以用作配置键的通配符(或其他内容)?

解决方法

我认为这种方法存在一些问题:

概念上

input 中指定确切的 outputconfig 文件名没有多大意义,因为这与您使用 snakemake 的原因截然相反:从输入推断需要运行管道的哪个部分来创建所需的输出。在这种情况下,您总是必须首先编辑每个输入/输出对的配置,而自动化的全部意义就丢失了。

现在,实际的问题是从 config 访问 inputoutput 的配置变量。通常,您会例如在配置中提供一些路径并使用以下内容:

config.yaml

raw_input = 'src'
bg_output = 'out'

在管道中,您可以像这样使用它:

input: os.path.join(config['raw_input'],in{id}.avi)
output: os.path.join(config['bg_output'],bg{id}.avi)

就像我说的,在配置文件中特别指定输出是没有意义的。

如果您要在 config.yaml 中指定输入:

cam1:
  raw: "src/in1.avi"
cam2:
  raw: "src/in2.avi"
cam3:
  raw: "src/in3.avi"

然后您可以使用如下函数获取输入:

configfile: "config.yaml"

# create sample data
os.makedirs('src',exist_ok= True)
for i in [1,2,3]:
    Path(f'src/in{i}.avi').touch()

ids = [1,3]

def get_raw(wildcards):
    id = 'cam' + wildcards.id
    raw = config[f'{id}']['raw']
    return raw

rule all:
  input: expand('out/bg{id}.png',id = ids)

rule make_bg:
    input:
        raw = get_raw
    output:
        bg='out/bg{id}.png'
    shell:
        " touch {input.raw} ;"
        " cp {input.raw} {output.bg};"

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。