网页上的数据情况十分复杂。以京东商品列表页为例,每个列表项的字段个数并非完全一致。

 

如下图所示:第1、4个商品列表有【自营】字段,第2、3、5个是没有【自营】字段的。

在采集第2、3、5个商品列表时,找不到【自营】字段,本条数据如何处理?下文将具体说明。

示例网址:https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=%E6%89%8B%E6%9C%BA&page=7&s=177&click=0

 

 

在找不到字段时,八爪鱼提供3种处理方式:

【使用默认值】:找不到当前字段时,自动填充一个默认值。

【该步骤留空】:找不到当前字段时,该步骤留空,一般默认留空。

【该步骤所有字段留空】:找不到到当前字段时,该步骤所有字段留空,相当于将本条数据删除。

 

 

在软件中的设置位置:

将鼠标移动到流程中的【提取数据】步骤上,点击  按钮,进入设置页面。选择要设置的目标字段,再点击  按钮,即可进行相应设置。

 

 

下面将结合具体场景,详细说明。

 

【使用默认值】

 

需求:采集京东的商品列表页信息,有的商品列表有【自营】字段,有的没有【自营】字段。当没有【自营】字段时,自动填充一个默认值【非自营】。

选中【是否自营】字段,点击  按钮,勾选【使用默认值】,输入固定值【非自营】,点击【应用】保存配置。

 

 

启动采集看一下,当找不到【自营】字段时,则填充固定值【非自营】。

这里只是一个示例,请大家根据自身需求,设置需要的固定值。

 

 

【该字段留空】

 

需求:采集京东的商品列表页信息,有的商品列表有【自营】字段,有的没有【自营】字段。当没有【自营】字段时,该字段留空。

选中【是否自营】字段,点击  按钮,勾选【该字段留空】,点击【应用】保存配置。(在找不到字段时,八爪鱼默认【该字段留空】,无需特意设置,在此是为了演示)

 

 

启动采集看一下,当找不到【自营】字段时,则该字段留空。

 

 

 【该步骤所有字段留空】

 

需求:采集京东的商品列表页信息,有的商品列表有【自营】字段,有的没有【自营】字段。当没有【自营】字段时,该步骤所有字段留空,相当于放弃本条数据。

选中【是否自营】字段,点击  按钮,勾选【该步骤所有字段为空】,点击【应用】保存配置。

 

 

启动采集看一下,当找不到【自营】字段时,则该步骤所有字段留空,相当于将本条数据删除。所以,最终只有【自营】的数据被采集下来了。