如何解决如何定位包含通配符的中间 Snakemake 规则
我有一个针对这个问题非常简化的工作流程,如下所示:
rule all:
input: multiext("final",".a",".b",".c",".d")
rule final_cheap:
input: "intermediary.{ext}"
output: "final.{ext}"
#dummy for cheap but complicated operation
shell: "cp {input} {output}"
rule intermediary_cheap:
input: "start.{ext}"
output: "intermediary.{ext}"
#dummy for cheap complicated operation
shell: "cp {input} {output}"
rule start_expensive:
output: "start.{ext}"
#dummy for very expensive operation
shell: "touch {output}"
有一个非常昂贵的第一步和随后的两个复杂步骤。
在我使用 snakemake -c1
运行此工作流一次后,我想重新运行工作流,但只是从中间规则开始。如何使用命令行标志实现此目标?
snakemake intermediary_cheap all
不起作用,因为 intermediary_cheap
包含通配符,即使包含 all 确实显示了所需通配符的值。
是否有一个命令行标志告诉snakemake运行规则并忽略规则intermediary_cheap
的所有输出,比如snakemake all --forcerule=intermediary_cheap
? (我发明了 --forcerule
标志,据我所知它不存在。
我现在使用的解决方法是手动删除规则 intermediary_cheap
的输出,然后使用 --force
强制执行规则,然后运行 rule all
,这会注意到一些上游输入发生了变化。但这需要了解所生成的精确文件名,而仅了解规则会更可取,因为它处于更高的抽象级别。
解决方法
我以前没用过,但我想你会想要:
snakemake -c 1 --forcerun intermediary_cheap
--forcerun [TARGET [TARGET ...]],-R [TARGET [TARGET ...]]
Force the re-execution or creation of the given rules
or files. Use this option if you changed a rule and
want to have all its output in your workflow updated.
(default: None)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。