我在Java中有一些文本,我想使用模式和匹配器从中提取一些东西.这是我的计划:
public String getItemsByType(String text, String start, String end) {
String patternHolder;
StringBuffer itemLines = new StringBuffer();
patternHolder = start + ".*" + end;
Pattern pattern = Pattern.compile(patternHolder);
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
itemLines.append(text.substring(matcher.start(), matcher.end())
+ "\n");
}
return itemLines.toString();
}
当搜索到的文本在同一行时,此代码完全有效,例如:
String text = "My name is John and I am 18 years Old";
getItemsByType(text, "My", "John");
立即从文本中抓取“我的名字是约翰”的文字.但是,当我的文字看起来像这样:
String text = "My name\nis John\nand I'm\n18 years\nold";
getItemsByType(text, "My", "John");
它没有抓住任何东西,因为“我的”和“约翰”在不同的行上.我该如何解决这个问题?
解决方法:
请改用:
Pattern.compile(patternHolder, Pattern.DOTALL);
从javadoc开始,DOTALL标志表示:
Enables dotall mode.
In dotall mode, the expression . matches any character, including a line terminator. By default this expression does not match line terminators.