java正则表达式获取指定两个字符串之间内容

xml解析利用正则表达式获取指定两个字符串之间内容

在遇到解析复杂xml的时候,想到大家所想到的都是利用dom4j作为首发工具,但是当遇到层次很多,较为复杂,我们难道还需要从根节点一层一层的解析下去吗?此时不仅代码繁琐,而且准确率还不是那么高,采用此种方式,可以获取指定两种字符串之间的任意xml文本。
java正则表达式获取指定两个字符串之间内容

[java] view plain copy

  1. package com.starit.analyse.util;
  2. import java.text.SimpleDateFormat;
  3. import java.util.ArrayList;
  4. import java.util.List;
  5. import java.util.regex.Matcher;
  6. import java.util.regex.Pattern;
  7. public class DealStrSub {
  8.     /**
  9.      * 正则表达式匹配两个指定字符串中间的内容
  10.      * @param soap
  11.      * @return
  12.      */
  13.     public static List<String> getSubUtil(String soap,String rgex){
  14.         List<String> list = new ArrayList<String>();
  15.         Pattern pattern = Pattern.compile(rgex);// 匹配的模式
  16.         Matcher m = pattern.matcher(soap);
  17.         while (m.find()) {
  18.             int i = 1;
  19.             list.add(m.group(i));
  20.             i++;
  21.         }
  22.         return list;
  23.     }
  24.     /**
  25.      * 返回单个字符串,若匹配到多个的话就返回第一个,方法与getSubUtil一样
  26.      * @param soap
  27.      * @param rgex
  28.      * @return
  29.      */
  30.     public static String getSubUtilSimple(String soap,String rgex){
  31.         Pattern pattern = Pattern.compile(rgex);// 匹配的模式
  32.         Matcher m = pattern.matcher(soap);
  33.         while(m.find()){
  34.             return m.group(1);
  35.         }
  36.         return "";
  37.     }
  38.     /**
  39.      * 测试
  40.      * @param args
  41.      */
  42.     public static void main(String[] args) {
  43.         String str = "abc3443abcfgjhgabcgfjabc";
  44.         String rgex = "abc(.*?)abc";
  45.         System.out.println(getSubUtil(str,rgex));
  46.         System.out.println(getSubUtilSimple(str, rgex));
  47.     }
  48. }

若给出的正则表达式rgex匹配不到的话,就会返回空,这两个方法运用得当,解析复杂的xml就迎刃而解了。

运行结果如下:
java正则表达式获取指定两个字符串之间内容

原文地址http://www.bieryun.com/614.html