查看文章 |
随着元旦的临近,天气越来越冷,但是那颗求知的心依然火热。今天早晨就打开了点石,认真读了一篇枫林同志写的段子,对我触到挺大。 大致的内容如下: Google有两种网络爬虫,主爬虫和新爬虫。主爬虫主要负责发现新的网页。一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。 新索引的建立还需要考虑其他非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排名,猜测访客难以利用的新内容是什么。 尽管Google在作猜测,下列内容都是真实可信的: 1) 幽灵登陆页上的排名不能等同于索引页的排名。 如果您的索引中有这样登陆页,您的主要目标应该是让该页在Google新页上拥有排名。若您想做到这点,您需要定期、有规律、最好是每天,有一定间隔地更新网站内容。 为什么您想要在Google的新页上获取排名?因为在新页上有排名的网站更容易被抓取,索引更容易更新。但是在新页上的排名不是真正的排名,新页排名有很强的不稳定性。新页排名转化为真正排名需要经过一段时间。 当 Google搜索蜘蛛抓取一个新网页后,这个新网页会有什么反映? 一个新网页没有被Google主目录收取,直到: 只有以上两条全都满足,新网页被Google主目录确确实实抓取到,新网页上的排名才有可能转化成真正排名 。 Google有两种抓取形式 一个新的网页首先被“新抓取”蜘蛛抓取。但也有特例的时候。在Google月更新刚刚完成那一段时间之后,一个网页通常被“主抓取”蜘蛛抓取。每月更新一般在每个月的20号到28号之间,能够持续几天。 为了区分两种蜘蛛的差异,我们可以先来看一下一组IP 地址。 1. “主抓取”蜘蛛= 216.239.46.* 为了进一步解释明白新网页发生的Google幽灵现象,我们假设该网页首先被“新抓取”蜘蛛抓取。在Google两个月更新之间,“新抓取”蜘蛛来抓取新网页。在主抓取期间,通过链接新网页能够被抓取。新抓取期间,情况也是一样。 尽管这个网页没有经过此次更新,也没有收录在Google主目录里,但是抓取之后,搜索蜘蛛开始衡量该网页内容和质量,并把该网页收录在搜索结果里。这次衡量是十分不稳定的,易受外界影响,经常发生变化。 当每月定期更新来临时,这些网页会产生波动。每月定期更新就是Google波动。但是,您需要记住,“主抓取”蜘蛛没有阅读该网页,所以这个网页没有加入主索引中。所以,当每月更新结束后,这个新 网页仍被看作是新网页但是不久以后,“主抓取”蜘蛛将会阅读这个新网页,在下个月更新之后,该页面才能被收录进主索引。这需要经历一段时间。在此之前,Google不显示任何导入链接,这个网页的排名也因此多变、不稳定。 看完这段资料之后也许对你有所启发,从目前状况来看,不单单Google存在搜索幽灵现象了,百度也有幽灵出现喽,当然,踏踏实实做站,认认真真发展内容的站点是不用担心这点的,搜索引擎对于所有的站点都是公平的,为什么一些站点起步是相同的,经过半年的发展就有不同的搜索表现,不同的发展呢?Webmaster们是不是应该考虑考虑了?你们都做了些什么? 最近出了搜索幽灵,百度有一些新动作专门针对采集类站点,新站不收录,收录少,或者是收录波动较大等怪异现象大都针对采集站了,当然一些不法站点就更难收录了,搜索引擎这样做并没有错,搜索的宗旨是为用户提供最优质的搜索体验,大范围的采集,没有经过任何的筛选,难免有很多垃圾信息,重复信息,不亚于复制站点的做法,所以前面有朋友向枫林索要整站下载器,觉得很勉强,不过我会告诉朋友,你参考别人的站点时可以的,但是不要直接拿别人的内容上传上去就完事了,做站没有那么简单。 最近也出现很多站点群建的软件?号称几分钟复制几十个站点,真不知道这些软件有什么值得拿出来炫耀的,当然,有什么效果,很多SEOer也许都试过了,自己也清楚,最起码我在点石看到有好多人说用了某某软件群建了一些站点都没有收录,或者集体降权了。任何时候我们SEO都要明白,我们是在改善站点的内容,改善站点的结构,目的在于给搜索引擎提供更优质的内容,更易于抓取的站点,给用带来更好的搜索体验,我们不能跟搜索对着干,这样站点被K,你也就没有什么怨言了,可以坦白的说,我没有这么做过,我的站点也没有被K过,唯一一次也是有惊无险,其中一个博客封了一个月,又恢复了,现在还白白胖胖的,营养良好。 特别什么:作者: 枫林 |