SEO站长如何批量采集文章?火车头采集器操作教程

已经很久没有使用火车头采集器了。想起曾经做站群SEO那段时间,经常会登陆火车头采集器去采集各大相关网站的资讯内容。而且那个时候采集之风盛行,到处是各种采集站,尤其是小说站、文章站等,动不动就是采集数十万的文章,网站做到权重4那是轻而易举。虽然现在大部分网站很少采集了,但采集还是无处不在,因为一些所谓的原创站点,文章内容很有可能也是采集之后再进行加工制作而成的。所以掌握一种采集技巧对SEO站长而言还是很有帮助的。下面小编分享的便是火车头采集器使用教程,供新手SEO参考。

火车头采集器网址规则设置

不管几岁,少女心万岁!来soul,守护你的少女心!

广告

第一步、打开火车头采集器,点击【新建】创建一个新任务,填写一个任务名,设置采集网址规则,分别设置列表页采集规则和列表页所在的文章页规则,分为以下两个步骤。

步骤1:添加起始网址,点击【添加】,选择批量/多页,在地址格式设置需要采集的网页链接,点击【添加】和【完成】即可。此步骤目的是确立有多少个栏目分页链接。

展开剩余77%

采集网页链接技巧说明:首先确定要采集的网页栏目页,分别查看栏目分页1、分页2和分页3链接规律,对比后会发现分页2和分页3链接很像,只有2和3变化了(分页1其实也是如此,为了SEO格式一般做了隐藏,所以分页1和栏目首页链接一致)可以分析是按照等差数列排列,其实绝大多数的网站栏目页分页都是等差数列来排列的,包括尹华峰博客也是如此。因此,在填写规则是选择等差数列,在地址格式处填写分页2的链接,将变化的数字用(*)代替,根据栏目分页的多少设置项数即可。

步骤2:多级网址获取,点击【添加】,选择网址获取选项,添加提取网址的规则,使用熟练后建议使用结果网址过滤功能,将需要包含的网址和不必包含的网址写进去,可以测试一下规则是否填写正确,然后保存即可。此步骤目的是确立每个栏目下的文章页链接。

多级网址获取技巧说明:我们要获取的是该栏目下的文章页链接,去原网页查看栏目分页的源代码,在该源码页找到第一篇文章页链接的位置,然后在上面选取一小段通用代码,一定是每个栏目页都会出现的代码,通常的表现形式会带有list或者article的代码。

火车头采集器内容规则设置

第二步、设置采集内容规则,可以在典型页面处填写一篇文章页链接进行测试,分别设置标题采集规则和内容采集规则,也分为两个步骤。

步骤a:双击【标题】标签,一般网页的标题是<title>标签,所以这一步可以默认,如果有需要的话是可以设置内容过滤,以及内容替换的。

步骤b:双击【内容】标签,内容提取规则和第一步的步骤2多级网址获取方法是一样的。这里是获取内容,所以是查看内容页的源代码,在该页面找到正文内容,在正文首段上面截取一小段通用代码,该代码也是所有文章页都会出现的,通常的表现形式是article标签为起始,</article>为结束。同样也可以设置内容过滤、内容替换以及标签过滤等,将不需要的信息过滤掉。如不需要图片,可以勾选过滤掉img图片标签。

火车头采集器发布内容设置

第三步、发布内容设置,勾选需要启用的发布方式,保存即可,然后在任务列表处右键任务名,点击【开始任务】等待采集完成。

注,火车头采集器发布内容分为两个方式,方式一是web在线发布到网站,需要添加发布配置。新手不建议直接发布到网站,建议勾选第二个保存为本地。至于文件模板可以【查看默认模板】,然后选择TXT格式即可。

结语:火车头采集器功能十分强大,除了采集文章还可以采集视频等,火车头采集器使用规则并不难,根本不需要懂什么编程之类的语言,只需能看懂一些常用的简单代码即可,操作一两次基本可以完全掌握,是一款非常棒的SEO工具。作为网站优化人员,我们采集文章后可以对内容进行修改和调整,让内容更加完善,同时也可以大大提高SEO人员的工作效率。火车头采集器使用方法就介绍到这里了,不懂的朋友可以下方留言,尽我所知给予解答。

原文地址:http://www.0371songshui.com/xingyezixun/57.html,转载请注明出处

(0)

相关推荐

  • 新手必看的火车头采集器使用入门教程

    本文资料来源:火车头采集器官网,但是讲解说明远优于官网!总结到位,重点解说明确-明月SEO 上一篇我们讲到了:火车头采集器使用图文教程以及重点问题整理! 本文将以一个简单的实测案例来说明,从而对重点问 ...

  • 火车头按作者采集今日头条全部文章的方法

    ""前期9SiR在<>一文中谈到,自媒体文章一旦过了推荐期就不能持续为作者带来收益了,为了解决这一问题,可以自建网站(博客)来同步更新文章,通过经营网站来实现持续的盈利 ...

  • 手把手教你一刻钟零代码复现近5分单基因生信文章(附详细操作教程)

    解螺旋公众号·陪伴你科研的第2487天 文末有惊喜 从小白的角度,一刻钟复现生信套路.各位小伙伴大家好,我是解螺旋的雪球.今天雪球为大家带来一篇2020年10月份发表于Aging-US(影响因子:4. ...

  • 自动采集文章后SEO加工并自动发布到网站详细教程

    简数采集平台支持自动采集文章,采集完成后进行SEO处理,对提高文章的收录和网站权重有非常重要的作用,并自动或定时发布到相应的一个或多个网站,实现文章搜索采集.SEO内容优化.发布网站全流程的自动化,减 ...

  • 网站文章被采集?尝试使用这几种方法进行最大防护

    站长,在做网站的时候,时有发生网站内容被采集的情况,特别是现在这种采集成本极低的环境,只要稍微会一点代码,就可以制作采集模块.即便不会代码,也可以花费低廉的价格去找人代写. 新站上线,勤勤恳恳的做着原 ...

  • 织梦通过SQL命令批量删除文章内容里所有超链接

    我们在采集文章时有时过滤不严谨,导致采集的文章内容中有多个超链接,这时我们可以用SQL命令批量删除文章内容里的超链接. 注意:操作前请先备份一下数据库 后台-系统-SQL命令行工具 执行下列命令,如果 ...

  • 白帽SEO,如何批量排名,日均指数2000的词?

    在做网站的过程中,很长一段时间里,我们总是提到海量关键词词库,好像做任何一个网站,只有做上爱站权重5以上就代表很成功. 但有的时候,小而美的网站,高竞争度的指数词,如果你能在垂直行业排名到TOP1-2 ...

  • 百度平台批量抄袭文章,可有律师助维权?

    创作并非我的职业. 工作之余,跋山涉水,摄影创作,是我的业余爱好. 生活因为创作而充实丰富,长久以来乐在其中. 近几年自媒体盛行,我于2016年7月注册了微信公众号:颖之星语. 颖之星语公众号以发现宁 ...

  • SEO排名,如何少用SEO资源,批量养站?

    在做SEO的过程中,解决收录的问题,往往是一个更古不变的话题,其中,试图在短期内,快速解决这个问题的方法,并且行之有效的策略,往往是借助老域名. 但我们都非常清楚,从目前来看去做域名抢注,还是非常困难 ...

  • SEO排名,同一篇文章,在多个栏目,如何处理?

    在日常SEO工作中,我们经常会遇到一个问题,同一篇文章,在多个栏目出现,这看似非常简单的一个问题,却让很多SEO新人很纠结. https://www.batmanit.com/p/408.html 那 ...