package org.jcommons.common; import java.io.UnsupportedEncodingException; import java.net.URLEncoder; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * some commonly used regex * @author Zhu * */ public class RegexList { public static final String property_single_regexp = "\\$\\{[-a-zA-Z0-9_\u4e00-\u9fa5\\.,;:\\|]+\\}"; public static final String property_regexp = "\\$\\{[-a-zA-Z0-9_\u4e00-\u9fa5]+\\.[-a-zA-Z0-9_\u4e00-\u9fa5]+\\}"; public static final String path_var_regexp= "\\{[-a-zA-Z0-9_\u4e00-\u9fa5\\.,;:\\|]+\\}"; public static final String string_regexp = "[-a-zA-Z0-9_\u4e00-\u9fa5\\.,;:\\|]+"; public static final String has_chinese_regexp = "[\u4e00-\u9fa5]+"; public static final String all_chinese_regexp = "^[\u4e00-\u9fa5]+$"; public static final String html_regexp = "<(\\S*?)[^>]*>.*?</\1>|<.*? />"; public static final String account_regexp = "^[a-zA-Z][a-zA-Z0-9_]{4,15}$"; public static final String qq_regexp = "[1-9][0-9]{4,}"; public static final String ip_regexp = "\\d+\\.\\d+\\.\\d+\\.\\d+"; public static final String filePath = "^(^\\.|^/|^[a-zA-Z])?:?/[^>^<^\\*^?^:^\\|^\"]+(/$)?"; public static void main(String[] args) throws UnsupportedEncodingException{ Pattern pattern = Pattern.compile(RegexList.number_hyphen_regexp); String str ="23412-41_234"; Matcher matcher = pattern.matcher(str); System.out.println(matcher.matches()); while(matcher.find()){ String g = matcher.group(); //str = str.replace(g, URLEncoder.encode(g, "utf-8")); System.out.println(matcher.groupCount()); } //System.out.println(str); //System.out.println("/users/{name}".matches("\\{[0-9a-zA-Z\\_\u4e00-\u9fa5]+\\}")); } /** * 匹配图象 * * * 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png) * * 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp * * * 不匹配: c:/admins4512.gif * */ public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$"; /** * 匹配email地址 * * * 格式: XXX@XXX.XXX.XX * * 匹配 : foo@bar.com 或 foobar@foobar.com.au * * * 不匹配: foo@bar 或 $$$@bar.com * */ public static final String email_regexp = "(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)"; /** * 匹配匹配并提取url * * 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX * * 匹配 : http://www.suncer.com 或news://www * * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)= * http://www.suncer.com:8080/index.html?login=true matchResult.group(1) = * http matchResult.group(2) = www.suncer.com matchResult.group(3) = :8080 * matchResult.group(4) = /index.html?login=true * * 不匹配: c:\window * */ public static final String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)"; /** * 匹配并提取http * * 格式: http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX 或 ftp://XXX.XXX.XXX 或 * https://XXX * * 匹配 : http://www.suncer.com:8080/index.html?login=true * * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)= * http://www.suncer.com:8080/index.html?login=true matchResult.group(1) = * http matchResult.group(2) = www.suncer.com matchResult.group(3) = :8080 * matchResult.group(4) = /index.html?login=true * * 不匹配: news://www * */ public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)"; /** * 匹配日期 * * 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X * * 范围:1900--2099 * * 匹配 : 2005-04-04 * * 不匹配: 01-01-01 * */ public static final String date_regexp = "^((((1[6-9]|[2-9]\\d)\\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\\d|3[01]))|(((1[6-9]|[2-9]\\d)\\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\\d|30))|(((1[6-9]|[2-9]\\d)\\d{2})-0?2-(0?[1-9]|1\\d|2[0-8]))|(((1[6-9]|[2-9]\\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$"; /** * 匹配电话 * * 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX XXXXXXX(10-13位首位必须为0) 或 * (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或 * XXXXXXXXXXX(11位首位不为0) * * 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或 010-123456 或 * 010-12345678 或 12345678912 * * 不匹配: 1111-134355 或 0123456789 * */ public static final String phone_regexp = "^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$"; /** * 匹配身份证 * * 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或 XXXXXXXXXXXXXXX(15位) 或 * XXXXXXXXXXXXXXXXXX(18位) * * 匹配 : 0123456789123 * * 不匹配: 0123456 * */ public static final String ID_card_regexp = "^\\d{10}|\\d{13}|\\d{15}|\\d{18}$"; /** * 匹配邮编代码 * * 格式为: XXXXXX(6位) * * 匹配 : 012345 * * 不匹配: 0123456 * */ public static final String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码 /** * 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ * 即空格,制表符,回车符等 ) * * 格式为: x 或 一个一上的字符 * * * 匹配 : 012345 * * * 不匹配: 0123456 * */ public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码 /** * 匹配非负整数(正整数 + 0) */ public static final String non_negative_integers_regexp = "^\\d+$"; /** * 匹配不包括零的非负整数(正整数 > 0) */ public static final String non_zero_negative_integers_regexp = "^[1-9]+\\d*$"; /** * * 匹配正整数 * */ public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$"; /** * * 匹配非正整数(负整数 + 0) * */ public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$"; /** * * 匹配负整数 * */ public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$"; /** * * 匹配整数 * */ public static final String integer_regexp = "^-?\\d+$"; /** * * 匹配非负浮点数(正浮点数 + 0) * */ public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$"; /** * * 匹配正浮点数 * */ public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"; /** * * 匹配非正浮点数(负浮点数 + 0) * */ public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$"; /** * * 匹配负浮点数 * */ public static final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"; /** * * 匹配浮点数 * */ public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$"; /** * * 匹配由26个英文字母组成的字符串 * */ public static final String letter_regexp = "^[A-Za-z]+$"; /** * * 匹配由26个英文字母的大写组成的字符串 * */ public static final String upward_letter_regexp = "^[A-Z]+$"; /** * * 匹配由26个英文字母的小写组成的字符串 * */ public static final String lower_letter_regexp = "^[a-z]+$"; /** * * 匹配由数字和26个英文字母组成的字符串 * */ public static final String letter_number_regexp = "^[A-Za-z0-9]+$"; /** * 圆括号 */ public static final String round_brackets_content_regexp = "(?<=\\()(.+?)(?=\\))"; /** * 方括号 */ public static final String square_brackets_content_regexp = "(?<=\\[)(.+?)(?=\\])"; /** * 花括号 */ public static final String braces_content_regexp = "(?<=\\{)(.+?)(?=\\})"; /** * 尖括号 */ public static final String angle_brackets_content_regexp = "(?<=\\<)(.+?)(?=\\>)"; /** * 数字和连字符下划线 */ public static final String number_hyphen_regexp = "^[0-9\\-_]+$"; public static final String double_square_brackets_content_regexp = "(?<=\\[\\[)(.+?)(?=\\]\\])"; }