八爪鱼,最好的网络爬虫工具

怎么复制网页上不能复制的文字

作者:keven 发布时间:2018/5/7 17:08:43 20392 人已阅读

摘要:我们在浏览网页的时候,时常会觉得有的内容不错,想复制下来,却发现有的网页内容不能复制,今天就教大家如何解决这个问题。

我们在浏览网页的时候,时常会觉得有的内容不错,想复制下来,却发现有的网页内容不能复制,今天就教大家如何解决这个问题。

 

虽然可以通过禁用脚本或是“查看源文件”,在源文件代码中复制需要的文章。不过复制文章的时候会有很多用不着的符号和代码。这样的操作方法其实都不如使用八爪鱼方便快捷。下面就给大家介绍一下如何利用八爪鱼采集网页上不能复制。

 

步骤一、下载八爪鱼软件并登陆

1、打开http://www.bazhuayu.com/download,即八爪鱼软件官方下载页面,点击图中的下载按钮。

 

 

2、软件下载好了之后,双击安装,安装完毕之后打开软件,输入八爪鱼用户名密码,然后点击登陆。

 

 

 

 

步骤二、创建采集任务

 

1)进入主界面,选择“自定义模式”

 

 

2)将要采集的不能复制文字的网站URL复制粘贴到网站输入框中,这里以360图书馆文章页举例说明,点击“保存网址”

 

 

3)然后进入360图书馆文章页,选中要复制的网页文章,在“操作提示”中选择“采集该元素的文本”

 

 

 

4)点击“保存并开始采集”

 

 

 

5)选择“启用本地采集”

 

 

6、点击导出数据,按自己需求选择导出文件类型,这里选择的是导出excel。

 

 

7、网页上的自己需要的文字复制下来了。

 

 

 

 

小提示:如果要让采集的文章保持原有的格式,可以参考这篇教程:

腾讯新闻采集:http://www.bazhuayu.com/tutorialdetail-1/txnewscj.html

 

 

 


企业试用