0731-55587844
其他(360、58、霸屏、搜狗、小程序)等代理合作请发邮箱254596208@qq.com
站内公告:  如果您有其它业务联系,请发邮件至yaner@y1web.com邮箱,谢谢您的配合!
营销型网站建设第一品牌——优度网络
现在的位置:首页 > 发布营销型网站建设 > 新闻资讯 > 搜索引擎收录网站的原理
搜索引擎收录网站的原理
信息来源:优度网络  发布日期:2009/3/17 浏览数量:775
文章导读:

控录蜘蛛和控寻机器人

搜索引擎要知道网上的新生事物,就是派人出去搜集。但是靠人工是不可能完成这个任务的。所以,搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。

探测器有多种叫法,也叫crawler(爬行器)spider(蜘蛛)robot(机器人).这些形象的叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息。Google把它的控测器叫做googlebot,百度就叫Baiduspider,MSNMSNbot,Yahoo则称为Slurp.这个控测器实际上是人们编制的计算机程序,由它不分昼夜地进入访问各个网站,取回网站内容、标签、图片等,然后依照搜索引擎的算法给它们制定成索引。所以,这可不是“爬行”而是以光速来访问的。

一个搜索引擎会同时派出许多控测器。这些“机器人”或者从站主直接呈递的网站URL去访问,或者由一个网络用户所装的搜索引擎工具栏(比如GOOgle工具栏)得知用户去的网站,或者是从一个网站中指向另一个网站的链接过去。控测器不一定是从网站的首页进入访问,所以,如果你要探测器访问你其他的网页,那么这个进入页就需要和其他网页相连。达到这个目的最容易的办法就是在每一页都加入指向首页的链接。

但是,探测器对许多网站是不能完整取回信息的,这个大多是由于网站的设计没有按照搜索引擎控测器的思路来进行优化。比如,如果一个网页比较大,控测器也只能截取网页的首部,而且只能跟着少量的链接走。Google目前能够吸收100KB的文件,Yahoo会多一点。这个可以通过实验来检验。将一个搜索关键词放在一个很长的网页(约160KB)最后部分,然后看Google的缓存(cache)中显现网页的大小是多少。如果不出意料,Googlecache说这个网页只有101KB。很显然,一部分内容没被Google抓走。

这个现象告诉我们不要将网页设计得很长、很大。将大的网页拆成若干小的网页具有很多的好处:

1、  使得网页容易被探测器抓取。

2、  更容易建立合理的网站内部链接关系。

3、  每个网页可以更加集中在重要的关键词语。

4、  节省服务器的带宽。

5、  方便浏览者的阅读。

相关信息
  • 网络营销培训
  • 微网站
  • 扫二维码
  • 1
  • 2
  • 3
  • 最新上传
  • 精品案例
  • 自动流水线嘉
  • 湖南省湘江重
  • 湘潭家居\建
  • 湘潭学校微网
0731-55587844
传真:0731-55587844
邮箱:254596208@qq.com
地址:湖南省湘潭市岳塘区霞光东路58号(维也纳酒店6楼)
优度官方微信扫一扫关注官方微信

关注优度

官方微信
官方微博
官网首页