解决LALR解析器中的移位/减少冲突
问题描述:
我一直在使用PLY为我的语言构建解析器,但是我遇到了移位/减少冲突,这给我造成了一些麻烦。我的语言具有语法ala C++模板的泛型类型。所以现在我有这样的规则:解决LALR解析器中的移位/减少冲突
expression : expression LESS expression %prec COMPARISON
expression : template
template : NAME
| NAME LESS templates GREATER
templates : template
| templates COMMA template
然而,我发现,这是无法解析:
a < 2
(这是显而易见的原因有问题)。以下是调试输出:
PLY: PARSE DEBUG START
State : 0
Stack : . <Token: 'NAME' 'a'>
Action : Shift and goto state 42
State : 42
Stack : NAME . <Token: 'LESS' '<'>
Action : Shift and goto state 81
State : 81
Stack : NAME LESS . <Token: 'NUMBER' '2'>
ERROR: Error : NAME LESS . <Token: 'NUMBER' '2'>
如果我需要更多的解析器,我可以提供它。谢谢。
编辑:向我提出的一种解决方案是让类型自己的令牌。这需要一点工作,因为我的语言不使用像C/C++这样的预处理器包含系统,但是我认为它仍然是可能的,但是我更喜欢一个限于语法的解决方案。
答
Yacc解析器不是特别强大,尝试上下文无关的解析可能会要求太多。我建议使用某种技巧来使yacc像分析上下文敏感语法一样行事,或者,不要尝试使用解析器来强制执行每条语法规则。
-
添加上下文
当你解析类型识别,设置一个标志或调用一个方法来此传送给扫描仪,然后在这种情况下返回不同的终端符号<
和>
。 -
简化语法
或者,继续,只对模板生成的一部分使用统一的表达式/模板语法,并在代码中错误地输出除模板语法之外的任何内容。解析器是系统中能力最低的部分,因此尽可能将工作推送到代码中。 (对代码没有限制,对yacc有很多限制。)
我并不是说这些是你唯一的选择。如果你花费了几天时间,对国家表格感到困惑,并将语法调整到yacc满意的地步,我想你会“成功”,但这不值得。那时你可能刚写了一个递归下降解析器。 (RD是更多的代码行,并且你不会看到在BNFish yacc中整齐排列的语法,但至少你可以解析任何东西,并且你永远不会陷入“不工作”的谜题。)
Python与Ruby的Treetop有什么相同之处吗?这将解决问题。野牛的%glr-parser
功能也可以“解决”这样的问题,尽管采用BFI方式。
不幸的是,如果没有使用特定的模板规则,语法就会更加模糊,并且会导致更琐碎的情况失败。我认为你是对的,我需要添加上下文,这对于简单情况(内建类型或在该文件中定义的类型)很容易,但对于使用我的导入系统的事物很困难。好吧 :) – 2009-11-27 18:35:32