所谓Camel Case指的是若干个单词连接成一个字符串,每个word通过大写首字母的方式来区分。标准的Camel Case字符串,如"CamelCase","SquashOurMethodNamesTogetherLikeThis"。
此外我们还经常与遇到一些非标准的Camel Case字符串,如:"UPPER2000UPPER","hasABREVIATIONEmbedded","Client2Server2012"
在进行文本分析的时候,我们通常希望能够将Camel Case字符串的单词切分出来。
这里我们提供两个regex表达式,能够实现Camel Case字符串的切分。
String[] words = word.split( "(?<!^)(?=[A-Z])" ); String[] words = word.split("(?<!(^|[A-Z0-9]))(?=[A-Z0-9])|(?<!(^|[^A-Z]))(?=[0-9])|(?<!(^|[^0-9]))(?=[A-Za-z])|(?<!^)(?=[A-Z][a-z])" );
第一个正则表达式只能识别标准的Camel Case字符串
第二个正则表达式能识别标准的Camel Case和非标准的Camel Case
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。