一名合格的seo工程师,一定会要解搜索引擎的工作原理

一名合格的seo工程师,一定会了解搜索引擎的工作原理,对于百度和谷歌的原理几乎差不多,只是其中有些细节不同,比如分词技术等,因为国内搜索一般都是百度,所以我们以后的课程都会针对于百度,当然,基础类的只是同样适用于谷歌!

搜索引擎的工作原理其实很简单,首先搜索引擎大致分为4个部分,第一个部分就是蜘蛛爬虫,第二个部分就是数据分析系统,第三个部分是索引系统,第四个就是查询系统咯,当然这只是基本的4个部分!

下边我们来讲搜索引擎的工作流程:

什么是搜索引擎蜘蛛,什么是爬虫程序?

搜索引擎蜘蛛程序,其实就是搜索引擎的一个自动应用程序,它的作用是什么呢?其实很简单,就是在互联网中浏览信息,然后把这些信息都抓取到搜索引擎的服务器上,然后建立索引库等等,我们可以把搜索引擎蜘蛛当做一个用户,然后这个用户来访问我们的网站,然后在把我们网站的内容保存到自己的电脑上!比较好理解。

搜索引擎蜘蛛是怎样抓取网页的呢?阅读更多

2012年4月25日07:39

SEO中的几个概念:爬行,抓取,索引,收录

我一直以来认为,SEO更多地是门艺术。但比较悲催的是,这是门建立在技术基础上的艺术,所以得像搞技术一样精准掌握一些概念。今天写几个有密切关系经常被混淆但又不是一回事的几个概念,以及为什么要精准掌握这几个概念。

爬行,抓取,索引,收录

爬行是指蜘蛛在页面上沿着链接发现新页面,然后“爬”过去抓取新页面。抓取是指蜘蛛发现新页面后,像浏览器一样打开页面,把页面HTML代码存入数据库。两个概念在英文中通常都是用crawl或spider(这里是动词)表示,视上下文才能分出是指哪个。

显然,爬行和抓取是相互交织的。抓取是实际发生的我们能够观察到的过程,在原始日志中,蜘蛛的抓取是有完整记录的,比如:抓取确切时间、状态码、抓取的文件是哪个、抓取了多大文件等等。蜘蛛对页面的抓取就和浏览器读取文件是完全一样的。

而爬行只是一个形象的比喻,实际上并不存在蜘蛛抓取文件时发现链接然后立即跟踪过去这样一个过程。蜘蛛抓取文件后存入数据库,程序解析出文件中的链接......阅读更多

2012年3月8日22:56

dedecms转移空间后生成栏目提示数据库报错

本人由于购买了一个空间比较烂,三天两头打不开网站,所以准备转移网站数据岛另外一个空间上去,由于模板是经过2次开发的,所以转移过去的时候在生成栏目的时候报错,开始的时候我用的是最新版本,转移过后我用的是5.5的版本,可能是由于这个原因生成栏目的时候报错了,解决办法很简单,只需要下载最新版本找到include/目录下面的两个文件,分别是dedesql.class.php,dedesqli.class.php,然后传到空间include目录里面就行了。反正我就是这样解决的。阅读更多

2011年12月16日05:57

北漂的梦想

虽然身为北漂的一员,但“北漂”这个词,我却轻易不敢写,因为这个词的含义太复杂,可能不是我的语言能力所能驾驭的,这个词的背后,蕴藏了一大批人的生存状态,而这种生活状态到底是什么样的?外人可能无从知晓,因为单从外表上来看,北漂族活的非常光鲜,他们白天活动于各大写字楼中间,一大部分人,甚至被称为白领,他们精明,干炼,办事有效率,但其实,北漂族的身上,不只这些东西,只有身处其中的人,才能体会出甜苦辣。

  今年年初同学都在实习,而却我勇敢地加入了北漂的大军独自在北京工作,回首在北京这段漂着的日子,不能不说是感慨万千,像众多的北漂族一样,我有着一份看上去体面的工作,每天按朝九晚六的作息时间生活着,周末的时候会一个人去商业区购物,吃一些看似精致的“美食”,体会着都市带给我们的繁华,觉得我们的生活质量似乎在提高,但其实真的是这样吗?在北京生活了快1年了,我发现了一个问题,那就是我真的怕安静,怕停下来没有事情做,因为安静的时候我会想,我是在北京吗?我为什么在这里......阅读更多

2011年11月23日02:25

dedecms怎么修改文章内容页中文章内容的默认字体的大小和行间距

问题:如何调整文章内容页中文章内容的默认字体的大小和行间距?

解答:文章内容页中文章内容的默认字体的大小和行间距受整个网站后台风格的控制,如果只想修改文章内容这里的显示大小,请进行以下操作:
  进入后台,依次点击文章频道中的[模板管理]-[文章内容页面模板]-[修改],找到显示文章内容的{$ArticleContent}标签,在这个标签前后加上span定义:
其中,font-size:18px为字体大小定义,line-height:20px为文字行高的定义,letter-spacing:10px为文字间的间隔定义,您可以自己调整到合适值,也可以在style中加上对字体、行、间距等的定......阅读更多

2011年11月10日23:22