自定义代码浏览器使用Lucene/swish-e

问题描述:

我正在研究一个C++项目,它有一个庞大的代码库和多个组件。我想为它创建一个丰富的代码浏览器,它会给像经验一样的视觉工作室。我正在考虑使用Lucene或Swish-e作为后端文本索引器的Adobe AIR应用程序。我从来没有用过这两种。如果您已经使用了其中一种或两种,可以请告诉我Lucene/Swish-e是否适合这种应用?我可以将其配置为使C++,Flex等语言能够识别吗?有没有现有的开源解决方案可以解决这个问题?自定义代码浏览器使用Lucene/swish-e

Lucene in Action 2nd ed。包含一个名为krugle的产品章节,该产品使用Lucene搜索源代码。我从来没有用过swish-e,所以我无法比较它们,但是这本书谈论了使用Lucene的好处和不利之处。你也可以尝试他们的搜索here,这是值得的。

要总结自己的篇章:

  • 优点:Lucene的尺度非常大,而且速度非常快。从本质上讲,一旦你有了指数,这一切都是肉汁。
  • 缺点:标准分析仪会丢弃“if”和“for”等词以及像“{”这样的源代码搜索中重要的标点符号。此外,代码不容易标记(例如“GetDatabaseInstance”应该标记为三个单词,而不是一个)。所以他们不得不写很多自己的分析仪。
+0

谢谢。将研究它。 – 341008 2010-07-19 08:31:35