一、功能简介
在采集数据时,可能存在网页没有正常打开(所需数据未能加载出来,多刷新下能正常加载),页面出现验证码、登录等等防采集的情况。 以上情况,大多可通过「重试」解决。二、「重试」设置说明
在八爪鱼采集流程中,【打开网页】、【点击元素】和【点击翻页】步骤后均会打开新页面。在流程图下方,会出现[基础设置]、[高级设置]、[重试],将鼠标移到【重试】上,点开「重试」,即可进行相应设置。
1、重试条件
如果网页没有正常打开,例如显示服务器错误(500),访问频率太快等,或者跳转到其他不应该出现的页面。可以根据网页实际情况,设置「重试」条件,当满足「重试」条件时,将自动重新打开网页。 每个步骤最多添加3个条件,条件之间是”或”的关系,即满足其中一个条件就会重新打开网页。 ① 当前网页的网址/文本/XPath,包含/不包含 当前页面的网址,包含/不包含,比较容易理解。 例:网页出现防采集时会跳到登录页,这时网址中通常会包含login等字样。此时,「重试」条件可以设置为



2、重试时同时切换代理IP
部分网页是由于封禁了特定IP,所以不能正常打开网页,可以尝试通过「重试时同时切换代理IP」解决。当满足某个「重试」条件,触发重试时,同时切换代理IP。
3、重试时同时切换浏览器版本
在不同的浏览器版本中,网页可能有不同的显示结果。如果用默认浏览器无法正常打开网页, 可尝试「重试时同时切换浏览器版本」。当满足某个「重试」条件,触发重试时,同时切换浏览器版本。
