RegEx从最后一次出现的字符串开始

如何解决RegEx从最后一次出现的字符串开始

我有一个文本文件，其中有一个数据集，我想从中删除一些记录。看起来像这样：

= separator =

数据

不需要的关键字

数据

= separator =

数据

wantedKeyword

数据

= separator =

数据

不需要的关键字

数据

= separator =

数据

wantedKeyword

数据

= separator =

我可以使用某个关键字来标识不需要（或不需要）的记录。我想使用RegEx，并利用此关键字和分隔符字符串删除所有这些表达式。删除记录的“底部”部分效果很好，但是当我尝试使用以下方法删除“顶部”部分时：

= separator =。*？unwantedKeyword

匹配的开始是第一个可用的= separator =（第5行），而不是end关键字（第11行）之前的最后一个（第9行）。

导致想要的记录被删除。

是否可以仅匹配该字符串的最后一个实例（模拟数据中的= separator =），所以仅匹配第1.至3.和9.至10行，而不是1.至3.和5.至11行会被替换？

编辑：

或者我想只是使其反向读取文件？ Notepad ++禁用了RegEx的该选项，因此不确定是否可行。

解决方法

如果您要删除第1至3行以及第9至11行，则可以使用前瞻性来防止匹配以=separator=开头或包含不想要的关键字的所有行。

^=separator=.*(?:\R(?!(?:=separator=|.*?\bunwantedKeyword\b)).*)*\R.*?\bunwantedKeyword\b.*\R*

Regex demo

我会用

(?s)=separator=(?:(?!=separator=).)*?unwantedKeyword

请参见proof。

说明

--------------------------------------------------------------------------------
  (?s)                     set flags for this block (with . matching \n) 
--------------------------------------------------------------------------------
  =separator=              '=separator='
--------------------------------------------------------------------------------
  (?:                      group,but do not capture (0 or more times
                           (matching the least amount possible)):
--------------------------------------------------------------------------------
    (?!                      look ahead to see if there is not:
--------------------------------------------------------------------------------
      =separator=              '=separator='
--------------------------------------------------------------------------------
    )                        end of look-ahead
--------------------------------------------------------------------------------
    .                        any character
--------------------------------------------------------------------------------
  )*?                      end of grouping
--------------------------------------------------------------------------------
  unwantedKeyword          'unwantedKeyword'

RegEx从最后一次出现的字符串开始

如何解决RegEx从最后一次出现的字符串开始

解决方法

相关推荐