「保姆级实操」AI+RPA+八爪鱼采集器打造招聘资讯公众号,1天发布1000篇
1. 对标
下面这个账号只用每天花10分钟,搬运下各大招聘网站的招聘信息,就能吸引大量求职者,为他们提供求职相关的资料和服务,实现精准变现!月入过w。借助数据抓取、AI和RPA工具,你也可以轻松打造自己的资讯流量入口,搭建一个招聘资讯公众号。
对标账号:
2. 账号拆解
3. 方案设计
- 数据爬取:爬取招聘网站的数据
- 数据处理:清洗掉不符合要求的数据
- MD文档生成:将数据转换成md代码
- 内容排版:md及公众号文章头尾模板设计
- 公众号发布:将md文档发送到公众号
4. 方案实施
4.1 采集数据
八爪鱼采集器:https://affiliate.bazhuayu.com/gH3a95
为什么选择八爪鱼采集器?
1. 操作简单,无需编写代码,常规采集可自动识别采集项,一键完成
2. 相较于用RPA采集,八爪鱼采集时不占用电脑,可以进行其他操作
4.1.1 采集列表
以https://www.iguopin.com/job为数据源
4.1.2 采集详情
现在还缺招聘细则,需要到列表详情中抓取
- 点击列表卡片标题
- 选择【点击一次】
页面会马上进入岗位详情页
发现数据不是我们想要的,点击取消,不生成采集设置,手动抓取我们想要的数据。
如果在点击元素后左下角没有出现页面2,需要在【点击元素】节点上点击高级设置【在新标签中打开】,应用后刷新就会出现页面2了。
依次点击招聘人数、最低学历、专业要求、工作经验、报名截止、岗位描述等元素。点击页面元素后,选择提取文本内容。
获取了下方这一行数据
转化为纵向布局修改下字段名
4.1.3 开始采集
点击普通模式开始采集,发现后面的详情数据没出来,是因为详情还没加载出来的时候就执行了采集动作
所以我们需要把采集动作延迟一下,等待指定元素出现,否则等待5s
4.1.4 数据导出&Xpath进阶
数据采集后,发现有一些错乱的数据,如何解决呢?解决这个问题需要先了解什么是xPath
我们回到字段设置处
可以看到只有其中一个div的数值不同,元素的提取是通过div的顺序控制的,当信息的顺序发生了变化,数据就有可能错乱。所以我们不能通过顺序来获取元素,而是要根据具体的字段标题
例如,找到【招聘人数】相邻的文案内容作为招聘人数值,而不是找到列表项的第二项作为招聘人数值
将选择器替换为文本匹配选择即可,如果不清楚语法,可以直接问Kimi
6分钟采集了100条,选择去重导出
数据到手✌️
4.2 数据处理&md生成
chatGPT: https://chatgpt.com/
chatGPT具有出色的数据分析和处理能力,直接用chatGPT帮我们处理数据即可。
- 过滤掉已经过期的岗位,使用chatGPT发送文件和指令即可
2. 将数据整合为md代码,直接向chatGPT发送文件和指令即可,可以自定义模板
3. 再让它帮我们生成一列标题
4. 点击下载即可获取到80条已经格式化的md内容
4.3 内容排版
将代码粘贴到mdnice,预制合适的模板
至此,你已经可以手动的发布招聘咨询了,直接点击复制按钮,到公众号发布页面发布即可。
4.4 RPA内容自动化发布
由于影刀RPA无法分享机器人,所有此处也可以使用八爪鱼RPA https://rpa.bazhuayu.com/
上手也很容易用法和影刀类似,优势是对个人开发者比较友好,免费版可以分享
此处拆分为两个RPA:
1. 表格内容批量更新&合并到mdnice
我们可以考虑把相同公司的招聘内容合并生成文章并发布,比如每篇文章可发布3个招聘信息,超过3个的拆分多篇,可直接用RPA自动化执行
2. mdnice内容批量发布到公众号
利用RPA发布机器人定时从mdnice到公众号发布。
最终可实现1分钟分布一篇。
总结
资讯类的内容通常指的是提供最新信息、新闻、报道、行业动态等内容,通常需要具有时效性和准确性,对于自媒体从业者,资讯类的内容最大的优点是永不枯竭,车轮滚滚向前,永远会有新鲜的新闻和信息,当我们从优质的数据源头将内容灌输至自己的账号,打破信息差,就能吸引目标人群。
本文用到的核心工具是八爪鱼系列产品,八爪鱼采集器和八爪鱼RPA,爬取数据后可以无缝到八爪鱼RPA做自动化流程,非常方便。不仅可以支持强大的自定义采集配置流程规则,2个产品都有模版应用市场,小白可以直接用里面的模版。
八爪鱼采集器官网:https://affiliate.bazhuayu.com/gH3a95
八爪鱼RPA官网:https://rpa.bazhuayu.com/?link-qjxz
有疑惑的小伙伴,对RPA机器人设计有兴趣的小伙伴,欢迎留言,你们的反馈是我后续持续更新的动力~
作者:奇迹小甄
原文链接:https://zhuanlan.zhihu.com/p/709173155