八爪鱼·云采集服务平台
八爪鱼如何通过xpath实现自定义定位元素
定位元素:八爪鱼通过Xpath来实现元素的定位。
适用情况:八爪鱼自动定位方式不能满足需求的情况。
下面演示如何通过自定义定位元素方式来修改元素匹配的Xpath,借此修改提取元素步骤
采集到的数据。
示例网址:/guide/demo/
步骤一:点击自定义采集下的立即使用→输入网址并保存
自定义定位元素方式-图1
八爪鱼·云采集服务平台
自定义定位元素方式-图2
步骤二:点击采集位置→循环采集元素→补充并修改提取元素步骤
自定义定位元素方式-图3
八爪鱼·云采集服务平台
自定义定位元素方式-图4
说明:循环采集元素会采集所有信息,我们在补充并修改提取元素步骤进行了删除第一个字
段操作,同时添加了我们需要的正确字段。
步骤三:修改自定义定位元素方式
选中要修改的字段→点击高级选项中自定义数据字段(如下图)→点击自定义定位元素方式
自定义定位元素方式-图5
进入自定义定位元素方式后,我们在下图红框处修改Xpath
八爪鱼·云采集服务平台
自定义定位元素方式-图6
其中元素匹配的Xpath是指可以通过这个Xpath路径在网页中直接找到所需数据的路径;
相对Xpath指相对于循环Xpath的路径,将循环中的Xpath接上相对Xpath路径就可以
生成一条直接匹配元素的路径。下面进行演示。
演示中使用了火狐浏览器的Firebug插件,详细使用情况请到Xpath使用教程中查看。
自定义定位元素方式-图7
八爪鱼·云采集服务平台
自定义定位元素方式-图8
自定义定位元素方式-图9
自定义定位元素方式-图10
如图,示例中将循环中的Xpath和字段对应的相对Xpath接在一起,在浏览器中可以查找
到所有的标题。
八爪鱼·云采集服务平台
假如我们想通过Xpath的修改采集其他的字段怎么采集呢?
下面演示如何通过自定义定位元素方式修改标题字段的Xpath使之采集的内容变成类型中
的内容
步骤1:找出类型所在的Xpath是怎样的
自定义定位元素方式-图11
自定义定位元素方式-图12
八爪鱼·云采集服务平台
自定义定位元素方式-图13
说明:我们知道循环中的内容为每个需要采集的内容所在的位置,我们将循环中的Xpath
复制进入浏览器也看到匹配到了所有电影的框。
随后我们查看类型所在的Xpath,可以看到如下图:
自定义定位元素方式-图14
查看到的Xpath为html/body/div/div/ul/li[1]/span[2]/span/span
八爪鱼·云采集服务平台
步骤2:修改Xpath使之定位到所有的电影类型。
因为我们知道LI元素定位三个电影整体的框,所以我们将循环中的//LI[@class='movie']
替换到类型所在的Xpath中,形成Xpath为://LI[@class='movie']/span[2]/span/span
元素前//表示不论LI在何处都匹配,所以可以省掉前面所有的元素。此时我们的得到的
Xpath就可以匹配所有的电影类型
自定义定位元素方式-图15
可以看到该Xpath可以定位到红色箭头位置所示的3个元素,红框中也标出了类型,我们
八爪鱼·云采集服务平台
一共在该页只有三个电影,所以我们就得到了所有电影类型的Xpath。
步骤3:将得到的Xpath放入自定义定位元素方式中
自定义定位元素方式-图16
自定义定位元素方式-图17
自定义定位元素方式-图18
八爪鱼·云采集服务平台
自定义定位元素方式-图19
说明:复制元素匹配Xpath后,因为我们知道循环Xpath为LI元素,所以我们复制LI元
素后的部分进入相对Xpath中。通过手动运行三个电影验证标题是否改为类型,确定改变,
会跟着变化,修改完成。
步骤四:保存并启动→数据导出
自定义定位元素方式-图20
八爪鱼·云采集服务平台
自定义定位元素方式-图21
相关采集教程:
京东商品信息采集
58同城信息采集
搜狗微信文章采集
八爪鱼——70万用户选择的网页数据采集器。
1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化
流程,点击鼠标完成操作,2分钟即可快速入门。
八爪鱼·云采集服务平台
2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布
流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。
3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大
云采集集群24*7不间断运行,不用担心IP被封,网络中断。
4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的
基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户
的需要。
本文发布于:2023-03-10 23:16:47,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678461408208638.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:怎么改定位.doc
本文 PDF 下载地址:怎么改定位.pdf
留言与评论(共有 0 条评论) |