正则表达式匹配略微改变的两个字符串之间的所有文本

问题描述:

我目前正在处理AIR应用程序,并试图从网站获取某个文本块,其中该文本块始终位于包含两个特定字符串链接页面之间的变化。正则表达式匹配略微改变的两个字符串之间的所有文本

它看起来是这样的:

<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p> 
. 
. 
_desired content_ 
. 
. 
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p> 

*这两个字符串相同现在

,我已经尝试了几种正则表达式的表达式,但没有成功。我只是无法绕过正则表达式一般...

我试过的最后一个表达式是:/(?<=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)(.*)(?=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)/gsi
但那个甚至没有被识别为RegEx。

我真的很感谢任何有关这个问题的帮助。

提前致谢!

编辑:

由于Organis的帮助下,我设法解决这个问题,它的确是更容易,更好地不使用正则表达式。 这是我落得这样做:

text=text.split("Next Chapter<\/span><\/a><\/p>")[1].split("Previous Chapter<\/a>")[0]; 
text=text.substring(0,text.lastIndexOf("<p><a href")); 

不要使用正则表达式。阅读原因:https://blog.codinghorror.com/parsing-html-the-cthulhu-way/

提取两个固定的<span style="float: right">Next Chapter</span></a></p>之间的文本,然后关闭终止<p><a href="**changes**">Previous Chapter</a> <a href="**changes**">

+0

谢谢!它的工作完美:) – Onlugassy