有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？背景问题

如何解决有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？背景问题

“选择”命令是指执行过滤的命令，例如 0 1 2 c1 a NaN 4.5 5.5、grep 等。

背景

至少有几种不同的 IBM 大型机环境支持管道处理（例如，CMS Pipelines）。它不像在 Bash 中那样是一个 shell 结构，而是通常一个专用的 find 命令，它有自己的内置子命令（阶段）来执行过滤和数据处理。

在我看来，更酷的功能之一是执行某种过滤的“选择阶段”通常支持多个输出流。那些符合选择标准的数据行被传递到主要输出流，如果指定，那些不符合选择标准的数据行被传递到次要输出流，在那里它们可以经历完全不同的处理序列。

以上面链接的维基百科页面为例，它可能出现在 REXX 程序中：

PIPE

第二次出现的标签 'PIPE (END ?) < INPUT TXT',/* read contents of file INPUT TXT */ '|A: LOCATE /Hello/',/* find all lines containing "Hello" */ '|INSERT / World!/ AFTER',/* give those to INSERT to append " World!" */ '|B: FANINANY',/* pass to FANINANY,accepts multiple input streams */ '|> NEWFILE TXT A',/* write all contents to file NEWFILE TXT A */ '?A:',/* end this pipeline,2nd output of LOCATE goes here */ '|XLATE UPPER',/* translate text to uppercase */ '|B:' /* feed back into FANINANY stage above */ 连接了 A: 的第二个输出流（在本例中，输入文件中不匹配 LOCATE) 到 "Hello" 的输入流，它将数据转换为大写并将其传递回第一个 XLATE 标签 (B:)。 FANINANY 接受多个输入流，并将同时从所有连接的输入流中读取数据，保持数据的顺序。

在这个例子中问号 FANINANY 作为结束字符，它告诉命令处理器“这是第一个管道的结尾”，以便后面的任何内容都可以用来独立地将另一个管道连接到其他标记的管道阶段，允许您在一个命令中指定整个管道。

示例 ? 文件：

INPUT TXT

在此 foo Hello bar Hello baz Hello 之后，PIPE 文件将包含：

NEWFILE TXT A

问题

我的主要问题是：是否有可能在 Bash 中实现这样的功能？

我认为该框架具有命名管道（FOO Hello World! BAR Hello World! BAZ Hello World! 等）和进程替换（我对这两者都很熟悉）。

但是，这个难题的关键部分是：我假设 Linux/UNIX 命令是否会将其所有输出回显到不同的位置取决于单个命令以及它是否是为此编写的。如果没有，我怀疑必须修改代码，然后我可以想象使用 Bash 构造来实现这种事情。

解决方法

您可以使用 GNU sed 的否定匹配运算符在单个命令中轻松完成两种转换：

$ cd "$(mktemp --directory)"
$ cat > input.txt <<'EOF'
foo
Hello
bar
Hello
baz
Hello
EOF
$ sed '/Hello/! s/\(.*\)/\U\1/;s/\(Hello\)/\1 World!/;' input.txt
FOO
Hello World!
BAR
Hello World!
BAZ
Hello World!

我认为没有一种有效的方法可以将部分标准输入发送到一个命令，并将其一部分发送到另一个命令（相关问题 1,2），因为任何过滤标准输入的命令也必然会消耗所有这些。类似的东西

while IFS= read -r line
do
    if [[ "$line" == 'Hello' ]]
    then
        echo "${line} World!"
    else
        echo "${line^^}"
    fi
done < input.txt

不幸的是非常慢。

作为替代方案，您可以使用 COMMAND < input.txt 3< input.txt 将同一文件发送到两个不同的输入流。

Unix (/Linux) 程序通常不支持多个输出流，尽管使用 awk 和 perl 之类的程序，您当然可以编写将输出发送到多个位置的脚本。这是一个简单的 awk 脚本，它将匹配的行发送到 stdout，将不匹配的行发送到命名管道：

awk -v nomatch="/path/to/pipe" '{if ($0 ~ /Hello/) {print} else {print $0 > nomatch}}'

但听起来您想以连贯的方式重新组合流（即保持行序），并且没有好的方法可以做到这一点，因为数据独立地流过每个流（可能以不同的速度，具有独立的缓冲等）。

但听起来您真正想要的只是一个以不同方式转换不同行的程序，并且有许多 unix 程序可以做到这一点。按照功能和灵活性（和复杂性）的大致递增顺序，标准的有 sed、awk 和 perl，但您几乎可以使用任何东西（甚至 bash 本身！）。以下是 awk 中的示例：

awk '{if ($0 ~ /Hello/) {print $0 " World!"} else {print toupper($0)}}' input.txt >newfile.txt

这是 bash 本身的等价物：

while IFS= read -r line; do
    if [[ "$line" =~ Hello ]]; then
        printf '%s World!\n' "$line"
    else
        tr "[:lower:]" "[:upper:]" <<<"$line"
    fi
done <input.txt >newfile.txt

（使用较新版本的 bash，您可以仅用 tr 替换该 printf '%s\n' "${line^^}" 命令）

有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？ 背景问题

如何解决有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？ 背景问题

背景

问题

解决方法

相关推荐

有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？背景问题

如何解决有没有办法捕获不符合匹配标准的 Linux“选择”命令的输出？背景问题