SEO非流量网站数据(网站收录量)监测分析

SEO需要监控的数据可以分为非流量和流量两部分。本文章讨论非流量数据,下一篇介绍流量分析。

1、收录数据

收录是网站排名和流量的基础,尤其是大中型网站。优化不好的网站,经常收录不充分。SEO团队要解决的一个重大问题就是,使尽量多的页面被搜索引擎收录和索引。下面几个收录数据需要记录跟踪。

a.总收录数

传统基本做法使用site:指令查询搜索引擎对某个网站的总收录页面数,再加上SEO站长自身知道的网站实际页面数,可以计算出收录比例。优化好的网站收录率应该能达到百分之七八十以上。

不过site:指令往往并不准确,好在现在百度site:指令不仅显示指令本身结果,还会显示百度站长平台的收录数据(还有一些其他网站健康相关信息),这个数据更为可靠,site:指令和百度站长平台的收录数是不一样的,百度站长平台的数据更加准确。(这也是曾庆平SEO经常说的看网站真实收录不要看site,要看百度站长工具里面的索引量,才更加准确)

登录百度站长平台,还可以看到过去一年的历史收录数据及变化曲线。SEO工具会更加详细介绍百度站长平台。Google的site:指令同样不准。为了得到比较准确的收录数,可以尝试使用site:xxx.com加上网站每个页面都会出现的词或句子,比如:网站名称、出现在页面顶部的口号、电话号码、地址、备案号等。例如:site:yongfengseo.com seo培训

需要注意的是,出现在HTML底部的文字有可能并没有被搜索引擎索引。有的页面文件太大,搜索引擎虽然抓取整个页面HTML代码,但不一定把页面上所有文字进行索引,而只是索引前半部分。所以如果页面文件比较大,需要搜索页面上靠前的独特文字,才能得出较准确的收录数字,通常位于底部的备案号可能不适合。

Google站长工具中索引状态部分也显示了总收录数及随时间变化曲线。但这个数字经常偏大,可能因为Google蜘蛛爬行、抓取能力太强大,会抓取很多带乱七八糟参数的没有意义的URL。

Google收录数也可以参考Google网管工具中指向首页的内部链接数。通常网站所有页面都有首页链接,所以首页的所有内部链接数也就是收录的页面数。曾庆平SEO个人感觉这个数字比索引状态里的更靠谱。当然,这个方法只限于Google,也仅限于查询自己网站。

选定一个查询方法,就坚持使用这个方法和指令。在不同指令的收录数字间比较是没有意义的。

b、特征页面收录

除了网站首页外,再从分类页面中选一部分有特征的或典型的页面,以及产品或文章页面中的一部分典型页面,查看这些典型页面是否被收录。大中型网站可能需要记录上万个特征页面。在选择典型产品页面时,既要兼顾到尽量多的分类,也要兼顾到不同时间发布的产品,既要有最早发布的、因此已被推到离首页比较远的页面,也要有比较新的、离首页比较近的页面。

查询特征页面收录与否,只要在搜索引擎输入这个页面的完整URL,没有结果就是没有收录。检查特征页面收录情况,经常能快速、直观地判断出网站哪些部分获得的链接少、权重太低。

c、各分类收录数

每个分类下的产品页面收录数是多少?记录这个数据有助于了解哪些分类收录完整,哪些分类由于内部链接结构的问题收录不充分,并采取对应措施。

各分类下的页面标题标签和URL格式比较规则时,SEO人员可以灵活运用site:指令及intitle:、inurl:等组合,得到各分类的收录数。例如如果页面标题是一节推荐的标准格式:

产品名称/文章标题一子分类名称一分类名称一网站名称

使用指令:

site:www.yongfengseo.com intitle:分类名称

就可以得到这个分类的页面收录数。

如果页面URL比较规则,分类首页URL为:

http://www.yongfengseo.com/A/sub-cat-1/

产品页面URL为:

http://www.yongfengseo.com/A/sub-cat-1/page-1.html

产品页面都处于上级分类目录下,使用指令:

site:www.yongfengseo.com /A/sub-cat-1/ 或:site:www.yongfengseo.com inurl:/A/sub-cat-1/   就可以得到子分类1的页面收录数。

如果各分类下页面标题、URL等都不规则(某些情况下这可能说明一网站结构规划有问题,本应该尽量避免),可以采取抽样统计方法,选取每个分类下一定比例的页面,检查收录与否,进而计算出这个分类下页面的收录比例。这可以与统计特征页面结合起来做。

从前面几章的讨论可以看出,网站收录不充分,经常是下面几个原因:

域名权重不够高,很多内页权重降到收录最低要求线之下。

网站结构有问题,使搜索引擎无法顺利爬行。

内链分布不均匀,使某些分类权重不够高,这个分类下的大量页面不能被收录。

搜索引擎不友好的因素,如JS链接、框架结构、大量使用Flash等。

网站内容原创度不够,大量转载和抄袭内容搜索引擎认为没有必要收录。

跟踪、记录网站页面收录情况,使SEO人员能够知道网站结构调整后,是否达到提高收录率的目的,如果没有,应该仔细检查上述几方面。

d、有效收录数

收录数据的局限在于,收录数高并不一定意味着流量高(虽然大部分情况下是如此)。有的页面即使被收录,由于权重太低或页面优化不好,也没有任何排名,带不来流量。为了矫正这个偏差,SEO人员也可以记录网站有效收录页面数,也就是某一段时间,如过去3个月内,带来过至少一个搜索流量的页面数。

大部分情况下,有效收录数才是真正与自然搜索流量成正比的。跟踪有效收录变化情况,检查哪些分类的有效收录比例偏低并优化这些分类,经常能有很好的效果。

(0)

相关推荐

  • 近期,网站收录异常,SEO排名索引下降,怎么回事?

    今天是一个相对特殊的日子,百度搜索公司总裁向海龙,刚加入国美,百度搜索就短暂"停摆"片刻,这难免让人有诸多联想,难不成这是巧合? 基于百度搜索的现状,蝙蝠侠IT认为,这可能真就是一 ...

  • 15分钟,教你用Python爬网站数据,并用BI可视化分析!

    作为一名在数据行业打拼了两年多的数据分析师,虽然目前收入还算ok,但每每想起房价,男儿三十还未立,内心就不免彷徨不已~ 两年时间里曾经换过一份工作,一直都是从事大数据相关的行业.目前是一家企业的BI工 ...

  • SEO网站排名,搜索量高非转化的词,重要吗?

    在做SEO的时候,有的时候我们习惯性的追寻"精致"这个关键词. 当对方制定任何SEO策略的时候,都希望没有一点的冗余和杂质,比如: ①转化率较高的词库. ②高质量的内容与产品页面. ...

  • 新公司网站或企业新网站做SEO优化流量和询盘是很少的

    当我们的领导.客户在给我们一个新的网站做SEO优化时,他们总能希望在短时间内获取大批流量,得到一些询盘;但是身为SEOER的你也这么想,那我还是建议你去做1688或者到其他网站上发布一些产品信息来的更 ...

  • 赞,百度官方网站数据生产【SEO实力干货】

    这段时间是真的有点忙,其实每次百度搜索资源平台的公开课程我都想看,但无奈由于课程的时间节点问题,我总是会错过线上直播,而只能看回放,这就缺失了和官方搜索工程师对话的机会. 虽然,作为一名长期的SEO运 ...

  • SEO优化,直接访问流量,对于网站SEO有影响吗?

    每天在不同的SEO社群中,总是会产生各种问题,有的时候这确实是一个深入学习的好地方,特别是对于一个SEO从业者,我们每个人都会有自己的知识漏洞,今天我们要讨论的话题是我们最近一直在思考,并试图去验证的 ...

  • Excel :自动同步网站数据

    有时我们需要从网站获取一些数据,传统方法是通过复制粘贴,直接粘到 Excel 里.不过由于网页结构不同,并非所有的复制都能有效.有时即便成功了,得到的也是"死数据",一旦后期有更新 ...

  • Python爬虫入门教程(十四):爬取有声小说网站数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  • Excel竟然还有这种操作:自动同步网站数据

    有时我们需要从网站获取一些数据,传统方法是通过复制粘贴,直接粘到 Excel 里.不过由于网页结构不同,并非所有的复制都能有效.有时即便成功了,得到的也是"死数据",一旦后期有更新 ...

  • 天地图网站数据分享:浙江省杭州市数据

    数据来源:https://zhejiang.tianditu.gov.cn/hangzhou/ 图片来源:网站截图 前面文章分享过天地图POI数据系列包括天地图网站POI数据系列(1):湖南省POI分 ...