Snakemake:{input:q}不返回带引号的输入

如何解决Snakemake:{input:q}不返回带引号的输入

我正在使用Genrich开发与Snakemake一起运行的ATACseq管道。

事实是,Genrich允许在同一步骤中从多个重复样品中调用峰,从而避免了其他步骤(即IDR)。

在Snakemake中,我找到了一种同时返回我想要的所有样本(即从一个条件复制)的方法,但是Genrich要求使用逗号分隔的文件作为输入文件,或者使用空格分隔的文件(如果每个文件都用引号引起来)

通常情况下,输入返回以空格分隔的文件(即file1 file2 file3)的列表,并且由于我不知道如何使它返回以逗号分隔的文件,因此我尝试引用它们。

从理论上讲,在Snakemake版本5.8.0之后,您可以在规则的shell命令中将输入称为{input:q},以返回引用的输入,如here

但是,就我而言,返回的输入未加引号。

我创建了一个测试规则,以查看如何返回输入:

rule genrich_merge_test:
    input:
        lambda w: expand("{condition}.sorted.bam",condition = SAMPLES.loc[SAMPLES["CONDITION"] == w.condition].NAME),output:
        "{condition}_peaks.narrowPeak",shell:
        """
        echo {input:q} > {output}     
        """

返回的输入(存储在输出文件中)是:

rep1.sorted.bam rep2.sorted.bam

有人知道如何解决这个问题,并返回引用的输入内容或返回逗号分隔文件而不是空格分隔的文件列表吗?

谢谢。

解决方法

假设您输入的文件名不包含空格(如果我强烈建议避免使用空格),则只需将文件列表加引号即可,而无需在列表中引用每个文件:

rule genrich:
    input:
        t= ['a.bam','b.bam'],...
    shell:
        r"""
        Genrich -t '{input.t}' ...
        """

(请注意'{input.t}'周围的单引号)

,

我当时在考虑echo和shell可能会在管道输出之前删除引号,但是用snakemake -p检查执行的命令显示它们不在那儿。似乎只有空格时,引号才会显示单个文件名。

Dariober的答案应该可以引用列表,但是为了完整起见,如果要用逗号分隔文件列表,请在params指令中使用lambda函数:

rule genrich_merge_test:
    input:
        lambda w: expand("{condition}.sorted.bam",condition=SAMPLES.loc[SAMPLES["CONDITION"] == w.condition].NAME),params:
        files=lambda wildcards,input: ','.join(input)
    output:
        "{condition}_peaks.narrowPeak",shell:
        """
        echo {params.files} > {output}     
        """

编辑

这是一个玩具示例,演示了如何在输入中使用params:

# snakefile
inputs = expand('{wc}.out',wc=range(4))

rule all:
    input: "test_peaks.narrowPeak"

rule genrich:
    input:
        inputs
    params:
        files=lambda wildcards,'.join(input)
    output:
        "test_peaks.narrowPeak",shell:
        """
        echo {params.files} > {output}     
        """

rule generator:
    output: touch('{file}.out')
$ snakemake -np
...
rule genrich:
    input: 0.out,1.out,2.out,3.out
    output: test_peaks.narrowPeak
    jobid: 1


        echo 0.out,3.out > test_peaks.narrowPeak 
...

也如here

所示

请注意,与input指令相反,params指令可以选择接受比仅通配符更多的参数,即输入,输出,线程和资源。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?