Stax解析器解析CDATA值

问题描述:

我正在使用Stax实现SJSXP1.0。正因为如此,它一直在努力工作,但现在面临一个奇怪的问题。Stax解析器解析CDATA值

正在解析的XML包含一些错误的HTML片段作为某些标记的值。这些值被包含在CDATA部分,因为我们预计CDATA不会被解析器解析(就像我们有时使用DOM解析器那样)。但是当我们使用STax时,parser.next()方法失败,如下所示 javax.xml.stream.XMLStreamException:[row,col]处的ParseError:[1374,10] 消息:元素类型为“col”的结束标记必须以“>”结束符

有我告诉解析器完全忽略CDATA标签,只是读取它们作为值

我想有没有可能改变这种方式解析器的行为方式,导致XML格式本身嵌入在解析器中,您无法做任何事情。但是这并不妨碍你捕捉异常,并围绕它做出一些逻辑。