文章正文
搜索引擎机器人的抓取规律
【SEO优化】2024-08-11
简介搜索引擎机器人的抓取规律
站长对于搜索引擎的蜘蛛一定不会陌生,蜘蛛是搜索引擎的一个自动程序。它的作用是访问互联网上的Html网页,建立索引数据库,使用户能在百度搜索引擎
中搜索到网站的网页。简单来讲,它就是网站与搜索引擎交流的工具,正是有了蜘蛛,搜索引擎才知道你的站点,进而才有收录排名。也正是因为蜘蛛只是一个自动程序,所以并不是非常智能化,只能依靠各项规则来行动,通过跟踪蜘蛛的动向和搜索引擎的反应,就总结出了一些关于蜘蛛的活动规律。
(1) 新站的初期收录
网站上线后,首先向搜索引擎提交页面。
Google: http://www.Google.com/intl/zh-CN/add—url.html
百度: http://www.baidu.com/search/url submit.html
搜索引擎会分析出其中含有的链接,然后进行爬行,由于是新站,所以在提交之后,蜘蛛的反应也不会很快,一次可能只抓取一两个页面就走,下次来再抓取几个页面。
在网站初期有一个需要注意的问题,不能有死链坏链,服务要稳定,也就是说一定要给蜘蛛营造一个好的爬行环境,因为蜘蛛一旦碰上死链就会直接走掉,如
果服务器不稳定,可能蜘蛛转一圈,一个页面还没有抓取就迫不及待要走了。新站的内部链接要有层次,而且四通八达,这样蜘蛛更好爬取,对于用户的浏览也方便的多。新站建立初期,一个友链的作用还是很大的,它可以大大增加蜘蛛在新站的爬取次数,可以一定程度上缩短收录时间。新站上线时,数据不能太少,要有足够的数据,同时内部链接要合理,这样就是一个成型的站点,蜘蛛爬取时对于这个站点的印象分也不会很低,就好比是现实交友一样,对千一个新朋友的第一印象不错,可能很快就见第二次,第三次,蜘蛛也同样。一个新站,百度的收录时间大概在半个月左右, Google蜘蛛在网络上爬行的比百度蜘蛛更加频繁,可能2天就收录了。熟悉地掌握蜘蛛对网站爬行的时间规律和蜘蛛比较喜爱爬行的栏目,都可以很好地帮助站长提高收录数量和收录速度,同时也可以从侧面对比出哪个频道的权重比较高。
(2) 站点的中期收录
在搜索引擎对网站的收录进入稳定阶段时,有一个小诀窍可以增加百度蜘蛛的爬行次数。每天的更新内容不要一次更新完,可以2个小时更新一部分或者上午一部分,下午一部分。因为在这个阶段,有一部分的百度蜘蛛是通过首页进入的,一旦发现首页没有变化就离开。这样定时定量更新的好处就显现出来了,蜘蛛进入首页一次发现首页变动一次,爬行的当然就更加频繁了。同时,多注意蜘蛛爬行的时间段,在这个时间段内进行更新,收录的速度是最快的。当然,这就需要一款可以随时查看蜘蛛动向的工具了,很多CMS都具备这样的功能,能够很清晰的记录各个大型搜索引擎的机器人痕迹,包括停留时间、爬行过的页面等都有详细数据,可以对每日爬行进行分析,或者对比几个栏目哪个爬行的次数最多。
打赏支持
感谢您的支持,加油!

打开微信扫码打赏,你说多少就多少
找书,联系客服快速查找!

在线客服8:30-23:00,若离线请留言!
获取教程,请联系在线客服!

在线客服8:30-23:00,若离线请留言!
热门阅读
-
被赋能的高效对话 杨兰译;(加拿大)玛丽莲·阿特金森,蕾·切尔斯 北京:华夏出版社 PDF 9787508097596 出版时间:2019.pdf
被赋能的高效对话 杨兰译;(加拿大)玛丽莲·阿特金森,蕾·切尔斯 北京:华夏出版社 PDF 9787508097596 出版时间:2019.pdf ...
-
尘几录 陶渊明与手抄本文化研究 田晓菲著 北京:中华书局 PDF 9787101054218 出版时间:2007.pdf
尘几录 陶渊明与手抄本文化研究 田晓菲著 北京:中华书局 PDF 9787101054218 出版时间:2007.pdf ...
-
回到当下的旅程 (美)李耳納·傑克伯森著 兰州:甘肃人民美术出版社 PDF 9787805889054 2011.pdf
回到当下的旅程 (美)李耳納·傑克伯森著 兰州:甘肃人民美术出版社 PDF 9787805889054 2011.pdf ...
-
津巴多普通心理学 第8版 菲利普·津巴多等 人民邮电出版社 PDF 9787115581495 出版时间:2022年08月.pdf
津巴多普通心理学 第8版 菲利普·津巴多等 人民邮电出版社 PDF 9787115581495 出版时间:2022年08月.pdf ...
-
VHDL语言与FPGA设计 基于Protel DXP开发平台 刘瑞新主编;胡健,高明远等编著 北京:机械工业出版社 PDF 7111141547 出版时间:2004.pdf
VHDL语言与FPGA设计 基于Protel DXP开发平台 刘瑞新主编;胡健,高明远等编著 北京:机械工业出版社 PDF 7111141547 出版时间:2004.pdf ...
-
六十四卦经解 (清)朱骏声著 北京:中华书局 PDF 7101003524 1958.pdf
六十四卦经解 (清)朱骏声著 北京:中华书局 PDF 7101003524 1958.pdf ...
-
卫生统计学 供预防医学类专业用 第7版 方积乾主编 北京:人民卫生出版社 PDF 9787117161961 2012.pdf
卫生统计学 供预防医学类专业用 第7版 方积乾主编 北京:人民卫生出版社 PDF 9787117161961 2012.pdf ...
-
高等数理统计 茆诗松等编著 北京:高等教育出版社;施普林格出版社 PDF 7040063972 1998.pdf
高等数理统计 茆诗松等编著 北京:高等教育出版社;施普林格出版社 PDF 7040063972 1998.pdf ...
-
Elasticsearch搜索引擎构建入门与实战 高印会 机械工业出版社 9787111694229 PDF 出版时间:2021年11月.pdf
Elasticsearch搜索引擎构建入门与实战 高印会 机械工业出版社 9787111694229 PDF 出版时间:2021年11月.pdf ...
-
线性代数入门 梁鑫田垠杨一龙 清华大学出版社 9787302609711 PDF 出版时间:2022年07月.pdf
线性代数入门 梁鑫田垠杨一龙 清华大学出版社 9787302609711 PDF 出版时间:2022年07月.pdf ...