微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何仅从字符串中提取数字

如何解决如何仅从字符串中提取数字

我尝试从这些页面提取价格作为美元文本 site

我使用了一个定位符//span[@data-originalprice]获取硒的文本 但仍然没有唯一的数字,尝试也对\\$进行了分割,但没有任何结果 尝试了一些正则表达式text.split("^-?\\d*(\\.\\d+)?$"),还是一无所获。 寻找任何想法?

解决方法

要提取并打印价格来修剪非ASCII 字符,可以使用 replaceAll("[^\\p{ASCII}]","") 并使用Java8的{{3 }}和stream(),您可以使用以下任一map()

  • cssSelector

    driver.get("https://www.wooloverslondon.com/new-styles?page=1&gender=161&style=77");
    System.out.println(new WebDriverWait(driver,20).until(ExpectedConditions.visibilityOfAllElementsLocatedBy(By.cssSelector("div.associated-product__price p>span"))).stream().map(element->element.getText().replaceAll("[^\\p{ASCII}]","")).collect(Collectors.toList()));
    
  • xpath

    driver.get("https://www.wooloverslondon.com/new-styles?page=1&gender=161&style=77");
    System.out.println(new WebDriverWait(driver,20).until(ExpectedConditions.visibilityOfAllElementsLocatedBy(By.xpath("//div[@class='associated-product__price']//p/span"))).stream().map(element->element.getText().replaceAll("[^\\p{ASCII}]","")).collect(Collectors.toList()));
    
  • 控制台输出:

    [7,035.00,6,015.00,5,607.00,4,996.00,7,646.00]
    

参考文献

您可以在以下位置找到一些相关的讨论

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。