Java提取中括号中的内容

曾经在工作中遇到一个问题,就是需要提取字符串中每一个中括号里的内容,在网上搜了一下,发现用正则表达式可以提取中括号中的内容,具体实现如下:

  1. import java.util.ArrayList;
  2. import java.util.List;
  3. import java.util.regex.Matcher;
  4. import java.util.regex.Pattern;
  5. public class ExtractMessage {
  6. public static void main(String[] args) {
  7. String msg = 'PerformanceManager[第1个中括号]Product[第2个中括号]<[第3个中括号]79~';
  8. List<String> list = extractMessageByRegular(msg);
  9. for (int i = 0; i < list.size(); i++) {
  10. System.out.println(i+'-->'+list.get(i));
  11. }
  12. }
  13. /**
  14. * 使用正则表达式提取中括号中的内容
  15. * @param msg
  16. * @return
  17. */
  18. public static List<String> extractMessageByRegular(String msg){
  19. List<String> list=new ArrayList<String>();
  20. Pattern p = Pattern.compile('(\\[[^\\]]*\\])');
  21. Matcher m = p.matcher(msg);
  22. while(m.find()){
  23. list.add(m.group().substring(1, m.group().length()-1));
  24. }
  25. return list;
  26. }
  27. }

输出结果如下:
0-->第1个中括号
1-->第2个中括号
2-->第3个中括号

这样很快就完成了代码的工作,但是后来发现如果中括号中还包含中括号,正则表达式就失去作用了,我不得不自己想办法解决,经过研究终于招到了解决方法,具体实现如下:

  1. package com.perry.test;
  2. import java.util.ArrayList;
  3. import java.util.List;
  4. import java.util.regex.Matcher;
  5. import java.util.regex.Pattern;
  6. public class ExtractMessage {
  7. public static void main(String[] args) {
  8. String msg = 'PerformanceManager[第1个中括号]Product[第2个中括号[中括号中包含中括号]]<[第3个中括号]79~';
  9. List<String> list = extractMessage(msg);
  10. for (int i = 0; i < list.size(); i++) {
  11. System.out.println(i+'-->'+list.get(i));
  12. }
  13. }
  14. /**
  15. * 提取中括号中内容,忽略中括号中的中括号
  16. * @param msg
  17. * @return
  18. */
  19. public static List<String> extractMessage(String msg) {
  20. List<String> list = new ArrayList<String>();
  21. int start = 0;
  22. int startFlag = 0;
  23. int endFlag = 0;
  24. for (int i = 0; i < msg.length(); i++) {
  25. if (msg.charAt(i) == '[') {
  26. startFlag++;
  27. if (startFlag == endFlag + 1) {
  28. start = i;
  29. }
  30. } else if (msg.charAt(i) == ']') {
  31. endFlag++;
  32. if (endFlag == startFlag) {
  33. list.add(msg.substring(start + 1, i));
  34. }
  35. }
  36. }
  37. return list;
  38. }
  39. }

输出结果如下:
0-->第1个中括号
1-->第2个中括号[中括号中包含中括号]
2-->第3个中括号

主要思路就是遍历字符串,在中括号的开始和结束位置做标记计数,如果是中括号开始位置对应的结束位置,那么开始位置和结束位置的计数是一致的,这样截取的就是一个完整的中括号的内容。
(0)

相关推荐