Google优化
当前位置:  首页>新闻 >> 网站推广 >> Google优化 > Google优化

谷歌SEO基础知识:搜索引擎的工作原理

文章来源:本站人气:2173发表时间:2017-05-24

  重庆时时彩购彩经验的小编认为,搜索引擎工作原理可分为细致的4步:
谷歌SEO基础知识:搜索引擎的工作原理

  第一步:网页抓取


  网页抓取的核心是爬行和抓取,用于收集数据,这是搜索引擎工作的第一步,很多时候,我们把爬行和访问网点的程序叫做蜘蛛,也可以称之为机器人。搜索引擎蜘蛛访问网站页面时类似于用户使用浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取速度,都使用多个蜘蛛并发分布爬行。


  蜘蛛访问任何一个网站时,都会先访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。和浏览器一样,搜索引擎蜘蛛也有标明自己身份的代理名称,站长可以在日志文件中看到搜索引擎的特定代理名称,从而辨识搜索引擎蜘蛛。上篇博文有说到扁平树状结构,就是为了有利于蜘蛛抓取到我们的网站。


  顺道给大家说说常见的蜘蛛:


  *Baiduspider+(+//www.baidu.com/search/spider.htm)百度蜘蛛


  *Mozilla/5.0(compatible;Yahoo!SlurpChina;//misc.yahoo.com.cn/help.html)雅虎中国蜘蛛


  *Mozilla/5.0(compatible;Yahoo!Slurp/3.0;//help.yahoo.com/help/us/ysearch/slurp)英文雅虎蜘蛛


  *Mozilla/5.0(compatible;Googlebot/2.1;+//www.google.com/bot.html)Google蜘蛛


  *msnbot/1.1(+//search.msn.com/msnbot.htm)微软Bing蜘蛛


  *Sogou+web+robot+(+//www.sogou.com/docs/help/webmasters.htm#07)搜狗蜘蛛


  *Sosospider+(+//help.soso.com/webspider.htm)搜搜蜘蛛


  *Mozilla/5.0(compatible;YodaoBot/1.0;//www.yodao.com/help/webmaster/spider/;)有道蜘蛛


  第二步:处理网页跟踪链接


  蜘蛛(搜索引擎)抓到网页后,还需要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引?;褂行┢渌氖孪睿喝コ馗赐?、分词(中文)、判断网页类型、分析超链接等


  简而言之就是:把抓取来的内容存储搜索引擎的原始数据库。


  解析:关于蜘蛛(搜索引擎),网页有很多,为了更迅速的搜寻到准确的信息,蜘蛛的搜寻也有一些策略,有两个优先:


  <1>”深度优先“:


  指的是蜘蛛(搜索引擎)沿着发现的链接一直向前爬行,直到前面再也没有其他链接,然后返回到第一个页面,沿着另一个链接再一直往前爬行。在深度优先策略中,蜘蛛一直爬到无法再向前,才返回爬另一条线。。

?深度优先剖析图
  ?深度优先剖析图
 


  <2>”广度优先“:


  指蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面上发现的链接爬向第三层页面。

?深度优先剖析图
  ?广度优先剖析图


  第三步:预处理(最重要的一步)


  在一些SEO材料中,“预处理”也被简称为“索引”,因为索引是预处理最主要的步骤。


  换而言之,就是对于原始数据库里面抓取来的内容进行加工整理。


  可以分以下几点:


  1.去停止词处理


  停止词指的是的地得啊吗之类的语气,搜索引擎在索引页面之前会去掉这些停止词,使索引数据主题更为突出,减少无谓的计算量。


  2.去重处理


  对比自己的数据库里面的内容,如果发现大量雷同内容,它会丢弃掉你的内容。要求我们以后在给网站创建内容的时候不能大量的抄写别人网站的内容。通常选取10个特征关键词就可以达到比较高的计算准确性,再选取更多词对去重准确性提高的贡献也就不大了。


  3.中文分词(切词)处理


  索引擎会根据自己的字典词库进行切词,把网站标题以及内容切分很多的关键词。因此在创建内容的时候一定要在标题和内容里面包含关键词。例如,“增高方法”将被分词为“增高”和“方法”两个词。中文分词方法基本上有两种,一种是基于词典匹配,另一种是基于统计。


  4.提取网站关键词


  提取网站的关键词对比你的页面内容,计算页面的关键词密度是否合理,如果密度比较稀疏,说明你的关键词和内容的匹配度不高,那么关键词一般没有好的排名,你也不能再页面里面刻意的去堆积页面的关键词,导致密度很高,那么搜索引擎会认为你在作弊,单纯想考堆积关键词的方法来做排名,这样的手段很容易遭到搜索引擎的惩罚。


  5.链接的计算方式


  链接分为导入链接和导出链接


  导入链接:顾名思义,就是从除自己站点外所有指向自己站点的链接,这样的链接称之为导入链接,一个页面的导入链接越多相对来说这个页面得分越高,越利于网站的页面的排名


  导出链接:指的是你网站上面挂了指向其他网站的链接叫做导出链接。导出链接越多,页面的得分越低,不利于页面的排名


  所谓的页面的链接关系指的是你网站的导出链接和导入链接的计算,页面和链接数量巨大,网上的链接关系又时时处在更新中,链接关系及PR的计算要耗费很长时间。


  第四步:消除噪音处理


  定义:对页面主题只能起到分散作用,比如弹窗广告,以及无关的网页链接


  这里说到噪音的处理,就简单说一下冰桶算法,主要是绿萝1.0和绿萝2.0,关于这个我会在我的官方网站中做一篇相关的报道.


  第五步:建立索引


  索引分为正向索引和倒排索引。


  搜索引擎根据上面的处理结果,把网站的页面放入到自己的索引库里面,索引库里面的内容其实就是百度排名好的结果。当我们使用site指令来查询网站的收录的时候百度释放出索引的内容出来。


  对于索引内容,我们可以用百度站长工具的ste:指令来查询。对很多新站,百度会有一个月左右的考核期,这个考核期之内,我们网站很多内容都是被关在索引库里面,没给你释放出来,所以我们新站在查询收录的时候site自己的网站的时候收录量会很小。


  第六步:排名


  经过搜索引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以,随时处理用户搜索了。排名展现、当用户在百度搜索相关关键词的时候百度就会直接调用索引库里面的内容展现是用户。用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程是与用户直接互动的。

以上内容由【卓云在线】编辑整理!更多有关重庆时时彩购彩经验、重庆时时彩购彩经验、重庆时时彩购彩经验、重庆时时彩购彩经验、重庆时时彩购彩经验、重庆时时彩购彩经验、重庆时时彩购彩经验、域名注册、国内虚拟空间、美国虚拟主机、香港虚拟主机、企业邮箱等互联网应用服务都可以联系我们!服务热线:15712129807
此文关键词:Google优化,Google排名优化,谷歌优化,深圳谷歌优化
提交需求告诉我们您的需求,我们会在24小时内与您联系,资料会严格保密!
Get In Touch
广东省深圳市龙岗区龙城街道龙岗大道4004号
草根创业园B栋402室
15712129807
15712129807 13510982313
Z+Cloud Online Sales Email Account:
[email protected]
Copyright ? 2015-2018 深圳市卓云在线网络科技有限公司 All Rights Reserved.
版权所有 ? 2015-2018 深圳市卓云在线网络科技有限公司  粤ICP备14000550号
深圳市场监管主体身份公示 不良信息举报中心 12321垃圾信息举报中心 公共信息安全网络监察 网络110报警服务 国家信息部备案信息 可信网站 中国信用企业 AAA信用网站
官方微信

重庆时时彩购彩经验 www.ohyc5.com.cn 官方微信
扫一扫轻松体验

  • 15712129807
  • 15712129807
  • 15712129807
  • 13510982313
  • 兰州新区构筑西北内陆开放高地 2018-12-11
  • 点评:世界杯八大热门亮相完毕 西班牙巴西最有冠军相 2018-12-10
  • 【理上网来·喜迎十九大】全面从严治党的核心是加强党的领导 2018-12-09
  • 央行有关负责人表示 当前金融市场流动性合理稳定 2018-12-09
  • 加“速”拥抱夏天 初夏音乐节的潮搭指南 2018-12-08
  • 沪伦通制度安排就绪 债务违约率整体较低 2018-12-07
  • 维生素火爆行情能持续多久? 2018-12-07
  • 美国国会议员邀请蔡英文到国会演讲? 国台办明确表态 2018-12-06
  • 一手就能握住的美味 好吃到没朋友!-美食资讯 2018-12-05
  • 一个普通阿拉伯青年的中国梦(习近平讲故事) 2018-12-05
  • 致敬幸福奋斗者:访全国三八红旗手标兵 2018-12-04
  • 回复@学童2015:你的智商达不到搞懂这个问题的基本需求! 2018-12-03
  • 证监会启动专项执法行动 打击五类行为 2018-12-03
  • (两会受权发布)最高人民法院院长简历 2018-12-02
  • 一镜到底绝密视频!10个故事,一个不一样的上合峰会 2018-12-02
  • 158| 143| 379| 612| 515| 122| 204| 19| 516| 534|