如何解决展开频道中的路径
我的数据被构造为成批运行的样本。所以我有一个这样的目录层次结构:
/path/to/dir/batch_1/sample_1
/path/to/dir/batch_1/sample_2
/path/to/dir/batch_1/...
/path/to/dir/batch_2/sample_1
/path/to/dir/batch_2/sample_2
/path/to/dir/batch_2/...
/path/to/dir/...
我想对给定批次子集的每个样品应用一个过程。一种有效的方法是生成一个列出样本的频道:
path_to_samples= Channel
.fromPath(['/path/to/dir/batch_2/sample_*','/path/to/dir/batch_322/sample_*'],type: 'dir' )
process my_process{
input:
path(sample) from path_to_samples
"""
do stuff
"""
}
现在,我想分别提供批次名称,并让脚本找到相应的样品。像这样的东西:
params.root_dir = '/path/to/dir/'
params.batch_names = Channel.from('batch_2','batch_322')
// make samples channel: incorrect
path_to_samples = params.batch_names
.map { params.root_dir + it + 'sample_*' }
.toPath()
process my_process{
input:
path(sample) from path_to_samples
"""
do stuff
"""
}
因此,我对渠道的想法有误吗?有没有一种方法可以通过通道操作“平化”样本列表?还是制作更复杂的Groovy闭包(将在每个批处理目录中列出文件并将其作为元组或列表返回)的正确方法?
解决方法
不确定要如何提供输入批处理名称,但是可以使用简单的闭包创建glob模式列表,然后使用它们创建输入通道:
params.root_dir = '/path/to/dir'
params.batch_names = /path/to/batch_names.txt'
batch_names = file(params.batch_names)
sample_dirs = batch_names.readLines().collect { "${params.root_dir}/${it}/sample_*" }
samples = Channel.fromPath( sample_dirs,type: 'dir' )
process my_process{
input:
path(sample) from samples
"""
ls -l "${sample}"
"""
}
不过,我倾向于将输入的glob模式保留为参数。这种方法提供了最大的灵活性,但可能不适合您的用例:
params.samples = '/path/to/dir/batch_{2,322}/sample_*'
samples = Channel.fromPath( params.samples,type: 'dir' )
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。