汽修软件-汽配软件-汽修厂用首佳汽修汽配管理软件系统管理汽修厂

2007年06月20日

百度与谷歌的收录策略——本末倒置的调整!

类归于: 关于百度那些破事, 谷歌搜索引擎研究 — 标签:, , , — 汽修汽配管理软件 @ 8:43 上午

一直以来大家都认为百度是大容量的收录策略,就是你有多少网页,百度就收录多少。无论芝麻,还是西瓜,百度会统统装进麻袋搬回家。回家再慢慢挑出西瓜,别人吃剩的西瓜皮、西瓜子这些会把它判垃圾,然后统统丢掉。如果从你家搬来的东西全部是西瓜皮、西瓜子这些垃圾,对不起,你家挂上垃圾标签,只有被扫地出门。而百度大容量的收录策略,确实也为搜索引擎带来更多的搜索结果,于是普通网民更容易找到想要的东西。但是也因为大容量的收录策略难免也有大量的未能被清除的垃圾,而带来负面的用户体验效果,于是乎很多人口诛笔伐百度是垃圾。

谷歌,大家都认为他的口味挑剔,精确又专业的收录策略,只挑西瓜不捡芝麻。因此获得大众的好评,搜索结果准确的口卑从人们口中传开。但也有他的缺点,挑剔的收录策略难免会漏掉的一些用户需要的信息,所以很多人也会认为百度比谷歌好,百度才能找到想要的东西。

在我所看到的信息中,对百度的批评不绝于耳,尤其是占据着话语权的站长们和一些在业界内有一定权威的个人。百度得罪了很多站长,但是百度不是不在乎他们。因为这些批评,或者说为了取得更多的进步,给客户更好的搜索体验,百度开始作出调整。百度不再把芝麻和西瓜统统搬回家,开始采取更为严格的收录要求。尤其是针对百度空间,近乎到了苛刻的要求,独一无二的内容也不一定会收录,即使收录了过几天可能又给清除掉了,如果原文复制到其它网站却能收录并保留。对百度空间如此苛刻,只能说无耐。这种状况,让我萌生离开百度空间的想法。因为每个人都一样,自己辛苦的心血希望得到认可,而不是否认。针对动态网站,网站权威度不高、历史不久的,带两个以上参数的内容生成的网页不予收录,无论内容质量有多高。这个看起来也不是技术问题,因为我也见过某些页面被收录。

而谷歌则相反,没有严重的质量低下的问题一般都给予收录,包括百度空间,没有不同的尺度来对待不同的网站。针对动态网站也没有百度对新站的问题。在以前跟一些站长接触过程中,百度比谷歌收录多,也是一直是这个说法。而现在相反了(除了中国的三大门户网站,其它所见过的都是这个情况),谷歌开始玩大量容量的收录策略,百度与谷歌的收录策略作了本末倒置的调整。能看出百度的用意,一切为了高质量的搜索结果。

说到谷歌开始玩大量容量的收录策略,离不开谷歌的一个特色,就是谷歌的沙盒效应(Google Sandbox)。大量容量的收录策略的背后,却出现大量的网页被列为补充材料。除了网站结构问题,还有域名权重低、复制的文章,会被列为补充材料。现在的Google Sandbox不幸有两个级别,你只有获得了Google的信任,才会得到网页排名。实际上,这时考虑网页排名为时尚早,因为网页首先必须被编入索引才有排名这个问题。因为,如果当你的页面大多数被归类于补充材料时,你其实并没有真正被索引!(详见:逃离谷歌补充材料的五个技巧)

题后记:原文标题是“百度与谷歌的收录策略——倒转乾坤的调整”,似乎太夸张了点。倒转乾坤改为本末倒置。哈哈,玩了一把文字游戏。

来自:管理软件与搜索引擎研究
转载请注明!

2007年06月17日

百度空间在sogou和yahoo中的表现惨不忍睹!

类归于: 其它搜索引擎相关 — 标签:, , , , — 汽修汽配管理软件 @ 12:00 上午

一直存有疑问,本空间日均访问人次一千左右为何鲜有来自sogouyahoo的访客?

收录数据表现:

今日特意去测试这个问题,各大搜索引擎对百度空间的收录数据如下:

搜索引擎       收录数             用时
baidu            4,930,000        0.001秒
google          8,010,000         0.17
yahoo         5,120,000       未知
sogou           1,964,368        0.002 秒

显然从收录数据上看,baidu和google对百度空间的偏爱调了个个。这与百度最近的收录策略的改变也有关系。而sogou对百度空间的收录狂减,记得在去年Sogou对百度空间的收录200多万,前段时间好像与yahoo持平。

关键字的表现:
汽车修理厂管理”这个关键字在百度和谷歌中的排名没掉出过前10,在yahoo是第一,sogou中没有本博客主页的排名(有一个内页排第六)。其它关键字也差不多的表现。
“百度空间”这个关键字,百度空间的官方博客:hi.baidu.com/百度空间。论人气、反向链接、文章质量、权威性等无人可匹敌!Sogou中搜索”百度空间”这个关键字竟然不见踪影!应该是掂底了。

对本空间的文章按文章标题搜索,只有某一日的主页快照中包含文章标题的字样,原文网页呢?也不见了,偶尔一两篇也是被转载或聚合了的。原文网页也应该是掂底了。因为按原文网页的网址来搜索有结果的,说明这些网页都已经收录了。hi.baidu.com/百度空间的文章按文章标题搜索都是别的网站大量转载,原网页都不见了。这一个问题在yahoo中同样如此。yahoo对大部分原创文章干脆不收录,因为按网址都搜不到,不是掂底的问题了,最多也就收录一个主页而已。yahoo对百度空间内独一无二的内容视而不见,那是yahoo的损失!

百度空间在Sogou中如此表现,怎么可能有好的排名带来流量?这难道是Sogou对百度空间的集体惩罚,把所有百度空间的权重降到最低,即使搜索不到相关的内容也不从你百度空间抓取用户需要信息。这对现行强调搜索引擎用户体验来说也是Sogou的重大损失。

Sogou和yahoo如此看薄百度空间总有问题的根源,很多百度空间用户把百度空间当成收藏夹,复制成风,百度空间整体质量低下,我想这是主要问题。其次,百度空间大量的镜相站点;镜相站点对每一个搜索引擎来说都是很烦感的一件事情。问题是很严重,但是Sogou和yahoo一棍子把所有百度空间打死了,俺就觉得有点冤枉了!

来自:汽修汽配管理软件与搜索引擎研究
转载请注明

2007年05月26日

百度如何判断原创与收录的问题——愚蠢的算法!

类归于: 关于百度那些破事, 百度搜索引擎, 谷歌搜索引擎研究 — 标签:, , , , — 汽修汽配管理软件 @ 7:02 下午

百度搜索引擎对于如何判断文章是否原创的诟病,批判之声早有耳闻,今日再作测试,果然如此。近日努力写博N篇,收录在本博客名下的文章比例太少了,尽管全部文章全部给百度拿回家了,但却挂在其它博客名下,郁闷之极!

近日一直在关注百度对百度空间的收录的问题,相关文章:百度,是什么让你开始否定百度空间?写在博客即将升级到6位之际和贴吧的贴子http://post.baidu.com/f?kz=204235416。所以,着重的测试了一下本博客文章的收录问题。我每天都测试,文章是增加了,收录却不按文章数目来增长,收了今天的,可能有某一篇又被清除出去了。都是原创啊,怎么也要被清除出索引?因为我自己也把自己的文章转载到其它地方,所以我按文章标题来搜索测试,这问题就出来了。注:这里所讲测试对象均为百度。

愚蠢的算法一:为什么不比较时间?
因为百度对这几篇不是很痛快的收录,我按文章标题搜百度空间的友情链接竟然全是无效的反向链接!?被百度K的百度空间和网站的案例一则解决百度空间友情链接为无效的反向链接的一招百度,是什么让你开始否定百度空间?。收录结果:第一篇前两名为美文空间和贴吧转文(我的博客没有被收录),第二篇收录在本博客下(因为没有被转载),第三篇原来收录了没了,第四篇收录的是一个网友的转载我的被清除了。第一篇收录时间是5-25日,原文创作时间是5-19日,其它文章也一样。如果从创作时间上来讲,判断文章是否原创应该按时间先后作为一个重要的因素,百度为什么不比较时间?

愚蠢的算法二:找原创什么不能顺藤摸瓜
转载出去的,都注明了转载来源。转载文章时注明来源可提高文章的相关度,同时也提示了搜索引擎可顺藤摸瓜找到原创文章。被转载同时注明来源,这里有一个好处,A转载B网站的文章,如A的更新频率高,搜索蜘蛛爬行A网站时是能顺藤摸瓜爬行B网站的。这对于摆脱搜索引擎长时间未更新快照来说,是个很好的方法。但是我的博客的主页快照却还是2-26的,郁闷!

如果按此道理,全部文章被转载,结果是我的收录全部被清除,那不要抓狂吗??

可疑算法三:找原创是以网站权重为重要因素?网站权重可靠吗?
转载的文章被百度收录在美文空间、贴吧、网友的百度空间名下。前文推测过一句话:“百度对权重的分配还是以域名为基础对象的,刚好每个百度空间用户是hi.baidu.com下的一个目录,那就是说所有百度空间用户的权重都是一样的了。”现在矛盾就出来了,如果权重一样为什么收录他的清除我的?美文空间最近网站改版,大量增加了新文章。而且是一级域名,所以权重高,才收录这个网址下的转载文章。但是网站权重不能代表一切!小站、小博的却有更多的原创文章。

可疑算法四:为什么不以反向链接为判断原创的重要因素?
首先,转载的都注明了来源,所以反向链接肯定比被转载的反向链接要多。那为什么不以哪个反向链接多作为重要因素呢?

可疑算法五:判断文章原创难道也以文章的新旧作为因素?
如果新文章就能收录,先收录的就要被清除,那不是等于提倡转载和复制吗?对于目前百度打击采集类、复制类网站的努力背道而驰!

相对于百度,我在谷歌也测试了相同的问题,Google的表现比较好。除了这篇:百度,是什么让你开始否定百度空间?把我的排网友的下面作为补充内容。

总结,目前百度判断原创的算法是非常愚蠢的!

来自:管理软件资讯博客
转载请注明!

首佳软件是专业从事汽修软件、汽配软件、汽车美容软件及4S店管理软件研发和销售的公司,是知名的汽修汽配管理软件供应商.因首佳软件的简单易学易用、性价比高的特性,而广泛应用于全国各地的汽修厂,汽配店,汽车4S店,汽车维修站,汽车美容连锁店等企业. 本博客由 WordPress 所驱动