微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何从字符串的开头开始使用正则表达式

这是我遇到的一个古怪的问题(可能以前见过但从未注意过).

这是代码的要点:

my $url = 'http://twitter.com/' . $handle;
my $page = get($url);

if($page =~ m/Web<\/span>\s*<a href=\"(.+?)\"/gi) {
    $website = $1;
}

if($page =~ m/follower_count\" class=\"stats_count numeric\">(.+?)\s*</g) {
    $num_followers = $1;
}

它获得了一个Twitter网址,并使用一些正则表达式来捕获关注者和用户的网站.这段代码实际上运行正常.但是当您在搜索关注者之后切换订单并搜索网站时,网站会显示空白.事实证明,当你正则表达一个字符串时,似乎有点保存最后一个匹配的位置.在html中,网站显示后会显示关注者数量.如果您首先执行跟随者计数正则表达式,就像它启动网站正则表达式,其中跟随者计数停止(如对字符串的索引引用).

令我感到困惑的是,我最后有“g”运算符,表示“全局”,如“从全局搜索字符串……”.

在这里错过了什么吗?我似乎无法弄清楚为什么它恢复字符串上的最后一个正则表达式位置(如果这是有道理的).

解决方法

标量上下文中的/ g修饰符不会按照您的想法执行.摆脱它.

正如perlretut所解释的那样,标量上下文中的/ g依次循环每个匹配.它设计用于循环,如下所示:

while ($str =~ /pattern/g) {
    # match on each occurence of 'pattern' in $str in turn
}

使用/ g的另一种方法是在列表上下文中:

my @results = $str =~ /pattern/g; # collect each occurence of 'pattern' within $str into @results

如果你在标量上下文中使用/ g并且你没有迭代它,你几乎肯定没有正确使用它.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐