1. 首页
  2. SEO入门

搜索引擎蜘蛛的分类

按照现在网络上所存Spider的作用及表现出来的特征,可以将其分为三类:批最型Spider、 增燉型Spider和垂直型Spider。

1、批量型蜘蛛

一般具有明显的抓取范围和U标,设置抓取时间的限制、抓取数据量的限制,或抓取阇定 范围内页面的限制等。当Spider的作业达到预先设®的标就会停止。普通站长和SEO人员使 用的采集工具或程序,所派出的Spider大都属于批最型Spider,—般只抓取固定M站的固定内 容,或者设置对某一资源的固定目标数据M,当抓取的数据或者时间达到设置限制后就会自动 停止,这种Spider就是很典型的批量型Spider。

2、增量型蜘蛛

增量型Spider也可以称之为通用爬虫。一般可以称为搜索引莩的网站或程序,使用的都是 増M型Spider,但是站内搜索引笮除外,自有站内搜索引擎一般是不需要Spider的。増量型Spider 和批量型Spider不同,没有固定目标、范围和时间限制,一般会无休止地抓取下去,直到把全 W的数据抓完为止。增量型Spider不仅仅抓取尽可能全的页面,还要对已经抓取到的页面进行 相应的再次抓取和更新。因为整个互联网是在不断变化的,单个W页上的内容可能会随着时间 的变化不断更新,甚至在一定时间之后该页面会被删除,优秀的增量型Spider需要及时发现这 种变化,并反映给搜索引擎后续的处理系统,对该网页进行重新处理。当下百度、Google N页 搜索等全文搜索引擎的Spider,一般都是增量型Spider。

搜索引擎蜘蛛

3、垂直型蜘蛛

垂直型Spider也可以称之为聚焦爬虫,只对特定主题、特定内容或特定行业的网页进行抓 取,•般都会聚焦在某一个限制范围内进行增量型的抓取。此类型的Spider不像增量型Spider —样追求大而广的覆盖面,而是在增量型Spider上增加一个抓取网页的限制,根据需求抓取含 有目标内容的M页,不符合要求的M页会直接被放弃抓取。对于网页级别纯文本内容方面的识别,现在的搜索引擎Spider还不能百分之百地进行准确分类,并且垂H型Spider也不能像增鼠 型Spider那样进行全互联网爬取,因为那样太浪费资源。

所以现在的垂直搜索引擎如果有附属 的增量型Spider,那么就会利用增景型Spider以站点为甲•位进行内容分类,然后再派出垂直型 Spider抓取符合自己内容要求的站点;没有増景型Spider作为基础的垂直搜索引笮,一般会采 用人工添加抓取站点的方式来引导垂直型Spider作业。当然在同一个站点内也会存在不同的内容,此时垂直型Spider也需要进行内容判断,怛是工作相对来说已经缩减优化了很多。现在 —淘网、优酷下的搜库、百度和Google等大型搜索引擎下的垂直搜索使用的都是垂直型Spider。 虽然现在使用比较广泛的垂直型Spider对N页的识别度已经很高,但是总会有些不足,这也使 得垂直类搜索引笮上的SEO有了很大空间。

以上是对搜索引擎蜘蛛的分类的介绍,更多SEO基础知识,请关注SEO入门教程栏目,如果您有外包需求,请查看山西SEO外包栏目。

博主推荐:

1、百度蜘蛛(Baiduspider)是什么鬼?

2、搜索引擎的工作原理详解(配图片)

3、SEO算法

原创文章,作者:David,如若转载,请注明出处:http://www.seoshisha.com/rumen/zhizhu.html

发表评论

电子邮件地址不会被公开。 必填项已用*标注

联系我们

15317703291

在线咨询:点击这里给我发消息

邮件:2692003558@qq.com

 

QR code