xpath案例
循环列表-过滤多余的项
通过实例讲解两种过滤循环列表中多余项的方法:修改 XPath 筛选和分支判断丢弃。
我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在初级采集课程中有详细讲过。
一般情况下,通过以上方法创建的【循环列表】不会出错,能够精准采集到全部数据。但有时候也会遇到一些问题:比如列表中有的部分不是我们想要的,需要进行丢弃。
这时候,可以手动修改XPath去定位列表丢弃不需要的部分。也可以用分支判断丢弃。
以下通过实例进行说明。
实例网址:https://www.ebidding.cecep.cn/jyxx/001006/001006001/7.html
