服务与支持   | 全国电话咨询热线: 0633-8368638

【免费SEO】搜索引擎的工作原理

来源:原创发布时间2017-11-03
第一步、爬行抓取
搜索引擎的蜘蛛程序根据网站的链接抓取链接所对应的页面
 
根据链接抓取页面,所以在优化的时候我们需要把自己的网址层级变短 ,越短的层级越容易被抓取到。
要求网址层级做成树状结构
 
树状结构  主页   http://www.xxx.com
栏目页    http://www.xxx.com/a
 
内容页    http://www.xxx.com/a/1.html
 
www.xxx.com/a/b/1.html
 
一般小型的企业站点网址层级建议做三个层级深度,大型站点建议做5个左右层级的深度。大型站点建议做成二级子域名的形式。
news.sina.com.cn  二级子域名
 
www.sina.com.cn/news  栏目域名
 
  
第二步、抓取存储
蜘蛛会把链接所对应的页面抓取存储到搜索引擎的原始数据库里面
 
页面存储到原始数据库并不代表就收录了你的页面
 
第三步、预处理
搜索引擎会把原始数据库里面的内容进行加工整理叫做预处理
 
预处理过程首先是提取页面的文字,页面文字提取以后,根据页面的标签来做中文分词处理,切词处理
 
 
新东方英语培训机构
 
新东方, 英语 ,培训,  机构
 
新东方英语  英语培训  培训机构
 
英语培训机构
 
切词功能,所以下次我们在布局页面标题的时候或者发布文章内容的时候一定要在标题里面包含关键词。这样搜索引擎把标题里面的词切分成很多的关键词
 
第三个去重处理
 
搜索引擎会对比自己数据库里面已经存在的内容,如果你的页面内容跟它数据库里面已经存在的内容完全一样,那么去除掉,收录机会就小了,所以我们以后更新内容的时候不能完全照搬照抄,最好写原创的内容。
现在至少需要把文章标题原创一下。
发布文章之前可以把标题拿到百度里面搜索一下,如果你发现搜索结果页面中,你的标题全部飘红,那么不建议使用这个标题。
 
标题自己原创,稍微写的长一点,其次需要在标题里面包含你网站的关键词。
 
去停止词处理
 
停止词指的是一些语气词或者助词
 
的  地  得 啊  吗  之类的词
 
美丽中国   美丽的中国
 
所以要求我们创建的内容的原创度要加大,不能简单的添加修改一个字一个词。
 
 
到这一步以后对于重复的页面基本上已经去掉了,剩下的页面基本上都能被收录了,计算页面的关键词密度以及页面的关键词与内容的匹配度是否相关。其次还需要计算页面的导出链接和导入链接之间的比例,一个页面导入链接越多,导出链接越少,那么页面的信任值越高,排名越好,如果页面的导出链接很多,没有相关的导入链接,那么页面一般排名不高。
 
导入链接:从别的页面指向到你网站的页面叫做导入链接。
 
导出链接: 网站的页面指向到其他页面的链接叫做导出链接。
 
网站里面的导出链接建议删掉。
 
大家看下自己的友情链接模块,如果你的友情链接都是单向的链接,那么建议删掉。
 
 【免费SEO】搜索引擎的工作原理 
 
建立索引,根据上面的这些计算关系,把收录的页面放到搜索引擎的索引数据库里面。我们使用site指令查询的收录结果就是索引库里面释放出来的结果。
 
最后一步:展现排名,搜索引擎根据用户搜索的关键词,把索引库里面匹配度最高的页面,点击次数最多的页面,页面停留时间比较长的页面,根据顺序展现给用户。
 

相关文章
  • 预约专家

    为您提供一对一解决方案
    立即预约
  • 售前咨询

    周一至周五9:00——17:30
    立即咨询
  • 联系方式

    0633-8368638>

    全国7×24小时热线服务
  • 免费报价

    专属专业顾问1对1报价
    免费报价
免费咨询
公司名称
手机号码
所在城市
联系人
先生 女士
邮箱地址
我们会尽快联系您,等待期间需要获取更多信息,请继续访问联系我们。感谢您对集客网产品及服务的支持。