高级搜索
这里可以设置一些高级参数,这里的参数不管是用搜索引擎搜索还是搜索网站都是起作用的,是全局性的参数,所以在设置之前请认真分析你要设置的参数,完成工作后即时删除这些参数,否则可能导致搜不到邮箱。
1、前置性参数
只有网址包含关键字这一个参数。这个参数除非你有十足的把握,否则尽量不要使用,这将导致搜索范围大大减小。比如设置“cn/”,这将使所有不含“cn/”的网页都不再分析。之所以称它为前置性的,是因为不符合条件就不访问网页,而其它参数都是过滤性质的,也就是先下载网页内容,再判断网页内容是否符合条件或取得的邮箱是否符合条件,过滤不合条件的邮箱。
2、过滤参数
网页包含这些关键字:只有网页包括指定的关键字时,搜集到的邮箱才保留下来。
页头包含这些关键字:只有网头关键字或标题中包括指定的关键字时,搜集到的邮箱才保留下来。
排除包含指定关键字的网页:当网页内容中含有指定的关键字时,邮箱不收集。
排除指定后缀名的网站:这类网站不搜索。
排除网址含有指定关键字的网页:含有指定关键字的网页中的邮箱不收集,但会分析里面的链接。
排除含有指定关键字的邮箱:当搜集到的邮箱含有指定关键字时直接删除。
3、全部包括
当一个参数中有多个关键字时它才起作用。例如,页头包含这些关键字中输入 "ABC;FRD",这是两个关键字,不选"全部包括"意味着页头只要包括一个"ABC"或一个"FRD"就行了。而选了"全部包括"则要求页头同时包括"ABC"和"FRD"。