排除的.js和.css文件从蜘蛛

问题描述:

我有排斥regexs(推理 - 我不希望包含的.js和.css文件):排除的.js和.css文件从蜘蛛

.*\Q.css\E 
.*\Q.js\E 

那些正确设置为背景:

/JSON /上下文/视图/ excludeRegexs /?zapapiformat = JSON & CONTEXTNAME =自动上下文

{ "excludeRegexs":"[.*\\Q.css\\E, .*\\Q.js\\E]" } 

然而,一旦我跑了蜘蛛,并且查询结果蜘蛛

/JSON /蜘蛛/浏览/ fullResults /?zapapiformat = JSON & scanId = 0

我还是看到了很多的.js的和.css文件

{"fullResults":[{"urlsInScope":[ 
    {"statusReason":"OK","method":"GET","messageId":"259", 
    "url":"https://contosco.com/modernizr.min.js","statusCode":"200"} 
    ... lot of other .js references here ... 
]} ... ]} 

也有一种方法如何测试正则表达式某种方式没有实际运行扫描?

+0

也许你需要使用'{ “excludeRegexs”:” * \\。 。(css | js)$“}' –

正则表达式没有错。原来"context"是放错那些排除的地方(我想知道"exclusionRegexs""context"中是什么)。正确的地方,把那些正则表达式是蜘蛛排除 - 即

/UI /蜘蛛/动作/ excludeFromScan/

+0

他们要定义上下文。如果您只是浏览/扫描上下文,那么这些URL应该被忽略。 –