微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

处理Camel Case字符串的切分——Desktop Search 开发笔记【经验积累】

所谓Camel Case指的是若干个单词连接成一个字符串,每个word通过大写首字母的方式来区分。标准的Camel Case字符串,如"CamelCase","SquashOurMethodNamesTogetherLikeThis"。
此外我们还经常与遇到一些非标准的Camel Case字符串,如:"UPPER2000UPPER","hasABREVIATIONEmbedded","Client2Server2012"

在进行文本分析的时候,我们通常希望能够将Camel Case字符串的单词切分出来。

这里我们提供两个regex表达式,能够实现Camel Case字符串的切分。

String[] words = word.split( "(?<!^)(?=[A-Z])" );
String[] words = word.split("(?<!(^|[A-Z0-9]))(?=[A-Z0-9])|(?<!(^|[^A-Z]))(?=[0-9])|(?<!(^|[^0-9]))(?=[A-Za-z])|(?<!^)(?=[A-Z][a-z])" );


一个正则表达式只能识别标准的Camel Case字符串
第二个正则表达式能识别标准的Camel Case和非标准的Camel Case

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐