排除的.js和.css文件从蜘蛛

问题描述：

我有排斥regexs（推理 - 我不希望包含的.js和.css文件）：排除的.js和.css文件从蜘蛛

.*\Q.css\E 
.*\Q.js\E

那些正确设置为背景：

/JSON /上下文/视图/ excludeRegexs /？zapapiformat = JSON & CONTEXTNAME =自动上下文

{ "excludeRegexs":"[.*\\Q.css\\E, .*\\Q.js\\E]" }

然而，一旦我跑了蜘蛛，并且查询结果蜘蛛

/JSON /蜘蛛/浏览/ fullResults /？zapapiformat = JSON & scanId = 0

我还是看到了很多的.js的和.css文件

{"fullResults":[{"urlsInScope":[ 
    {"statusReason":"OK","method":"GET","messageId":"259", 
    "url":"https://contosco.com/modernizr.min.js","statusCode":"200"} 
    ... lot of other .js references here ... 
]} ... ]}

也有一种方法如何测试正则表达式某种方式没有实际运行扫描？

也许你需要使用'{ “excludeRegexs”：” * \\。。（css | js）$“}' –

答

正则表达式没有错。原来"context"是放错那些排除的地方（我想知道"exclusionRegexs"在"context"中是什么）。正确的地方，把那些正则表达式是蜘蛛排除 - 即

/UI /蜘蛛/动作/ excludeFromScan/

他们要定义上下文。如果您只是浏览/扫描上下文，那么这些URL应该被忽略。 –

排除的.js和.css文件从蜘蛛

相关推荐