网络驱动器索引频率

问题描述:

我工作的公司拥有数百万个文件,这些文件在映射到用户驱动器(例如d:\ to \ server1 \等)的多个网络驱动器上存储和共享。

网络驱动器索引频率

我想实现的是抓取网络驱动器,并让用户使用全文索引快速找到文件。

我现在索引战略Lucene.net

但我不知道我应该怎么常常是索引网络驱动器,因为现在有成千上万的文件索引和更不用说了旅游网络数据包。

所以,问题是我应该如何实现索引频率
我一直在研究谷歌/ Windows桌面搜索索引的频率如何,但没有结果。

许多答案都包含在您与客户之间的任何服务级别协议中。如果您的SLA指出搜索结果在X分钟数内是最新的,那么您的问题将如何回答您的问题:应该如何实现索引频率

如果你像我一样没有具体的SLA来搜索和索引,那么你可以更灵活。例如,我为其业务管理了一个SharePoint搜索服务器。除了我们的网站,我们还索引lot非结构化文件空间中的内容。该服务器支持完整增量爬网。我们计算了几次增量爬网以估计完成增量爬网需要多长时间。然后,我们在比观察的经过时间舒适地大的间隔上安排我们的增量爬网。我们计划在非高峰时段全面爬网的频率较低。

的细节可能会因您使用的具体索引技术有所不同,但原理是一样的:

  • 观察了几个爬,最好在高峰和非高峰时段,并配置您的爬行时间表比最坏的情况要舒适得多。
  • 为非高峰时间(例如晚上)安排更多的资源密集型爬网。
  • 如果完整抓取需要几个小时才能完成,那么您可能会安排他们在周末。
  • 使用支持增量爬网的技术可以大幅降低高峰时段的带宽,同时保持索引的新鲜度。

祝你好运!

+0

我错了,如果我们要索引网络驱动器,意味着所有用户的PC都需要抓取驱动器,以便使索引工作? - >在Windows 7中 – 2016-08-02 12:15:19

+0

Hi @EricK。发布一个完整的问题而不是评论可能会更好地为您服务;但是,如果我正确理解您的问题,则只有执行索引的计算机需要访问网络驱动器才能执行索引任务。当然,访问该驱动器的任何用户也必须有权这样做;但是,这仍然是与建立索引分开的一项活动。 – kbrimington 2016-08-02 20:59:12