BUG是这样产生的:在yo2后台的设置/阅读里面,只显示文章摘要,如果设置成仅显示多少个字,比如1000个字那么任意一篇文章,只要在第1000个字处是包含超链接的,那么在输出文章摘要时,源码里面就会产生一个错误的链接。这种错误链接很少人能发现,我也是经常看google的网站管理员工具发现的错误链接结果。
实际上,如果yo2没有这个BUG的话,我还是很喜欢输出文章摘要这个功能的。因为这样截断文字后,这样博客的版面会更整齐,看起来舒服点。
解决办法也还很简单,只要取消显示文章摘要的功能就行了。哈哈,说了跟没有说一样。
取消显示文章摘要也有一个好处,搜索引擎来抓取时,索引进去的内容会更多,这样会增加关键字长尾的组合,还有可能获得更多的流量。另外,如果主页的关键字密度过高的话,显示全文自然能降低关键字密度了,更容易让搜索引擎收录。
搜狗的搜索服务竟然会玩完!今早用http://indexed.webmasterhome.cn查询网站收录,搜狗返回的收录结果和链接结果是0。
都不敢相信这个结果,除非网站被K掉。实地考察一下,确实是查不到数据了,site和link任何一个网站都是没有结果返回,原来不是K我的网站,只是搜狗可能关闭了搜索API的支持。内容的搜索还可以用吧。
不知道搜狗此举是何为?服务器问题吗?还是不再提供这类服务了,如果是那真快要玩完了。
来自:搜索引擎研究
相对于Google的page rank,Sogou有自己的Sogou Rank。
搜狗官方的解释:网页评级(Sogou Rank)是搜狗衡量网页重要性的指标,不仅考察了网页之间链接关系,同时考察了链接质量、链接之间的相关性等特性,是机器根据Sogou Rank算
法自动计算出来的,值从0至100不等。网页评级越高,该网页在搜索中越容易被检索到。
按照搜狗官方的解释,Sogou Rank在搜狗中的搜索排名起到非常重要的作用。通常Sogou Rank每周或每月更新一次,但这次看来好像也不是,因为相比上次搜索link:www.whsjsoft.com
多 了1200个反向链接。在谷歌看来,短时间内增加大量的反向链接肯定是作弊行为,肯定会被K掉。所以只能用Sogou大更新来解释了。 www.whsjsoft.com目前的Sogou Rank值是40,链接数量1626,7-26查的结果是Sogou Rank值31,链接数量407。郁闷的是谷歌的link结果越来越少了。几个月时间内有效链接增加了200多个。
另一个博客,hi.baidu.com/whsjsoft,目前的Sogou Rank值是34,链接数量788,7-26查的结果是Sogou Rank值31,链接数量452。
相比较,除了外部链接数量,www.whsjsoft.com的外链质量远比hi.baidu.com/whsjsoft的高,其rank值能升到40也源于此吧。
来自:搜索引擎引擎研究
原文:http://www.whsjsoft.com/blog/u/whsjsoft/archives/2007/95.html
一直存有疑问,本空间日均访问人次一千左右为何鲜有来自sogou和yahoo的访客?
收录数据表现:
今日特意去测试这个问题,各大搜索引擎对百度空间的收录数据如下:
搜索引擎 收录数 用时
baidu 4,930,000 0.001秒
google 8,010,000 0.17 秒
yahoo 5,120,000 未知
sogou 1,964,368 0.002 秒
显然从收录数据上看,baidu和google对百度空间的偏爱调了个个。这与百度最近的收录策略的改变也有关系。而sogou对百度空间的收录狂减,记得在去年Sogou对百度空间的收录200多万,前段时间好像与yahoo持平。
关键字的表现:
“汽车修理厂管理”这个关键字在百度和谷歌中的排名没掉出过前10,在yahoo是第一,sogou中没有本博客主页的排名(有一个内页排第六)。其它关键字也差不多的表现。
“百度空间”这个关键字,百度空间的官方博客:hi.baidu.com/百度空间。论人气、反向链接、文章质量、权威性等无人可匹敌!Sogou中搜索”百度空间”这个关键字竟然不见踪影!应该是掂底了。
对本空间的文章按文章标题搜索,只有某一日的主页快照中包含文章标题的字样,原文网页呢?也不见了,偶尔一两篇也是被转载或聚合了的。原文网页也应该是掂底了。因为按原文网页的网址来搜索有结果的,说明这些网页都已经收录了。hi.baidu.com/百度空间的文章按文章标题搜索都是别的网站大量转载,原网页都不见了。这一个问题在yahoo中同样如此。yahoo对大部分原创文章干脆不收录,因为按网址都搜不到,不是掂底的问题了,最多也就收录一个主页而已。yahoo对百度空间内独一无二的内容视而不见,那是yahoo的损失!
百度空间在Sogou中如此表现,怎么可能有好的排名带来流量?这难道是Sogou对百度空间的集体惩罚,把所有百度空间的权重降到最低,即使搜索不到相关的内容也不从你百度空间抓取用户需要信息。这对现行强调搜索引擎用户体验来说也是Sogou的重大损失。
Sogou和yahoo如此看薄百度空间总有问题的根源,很多百度空间用户把百度空间当成收藏夹,复制成风,百度空间整体质量低下,我想这是主要问题。其次,百度空间大量的镜相站点;镜相站点对每一个搜索引擎来说都是很烦感的一件事情。问题是很严重,但是Sogou和yahoo一棍子把所有百度空间打死了,俺就觉得有点冤枉了!
来自:汽修汽配管理软件与搜索引擎研究
转载请注明
今天逛一个网友的博客时看到一篇好玩的文章
搜狗 >> 网页搜索 >> 搜狗实验室 >> 文品指数
网址:http://www.sogou.com/labs/wenpin/
评测的文章内容是:
来自:http://hi.baidu.com/whsjsoft
Google的PR值更新—望穿秋水终等来,Google的PR值计算的因素是什么?
我从去年9月份开始盼着google给我们首佳汽修软件网站分配一个PR值吧,也从那时起关注着这个东西。Google的PR值的上一次更新周期刚好是在9月份,那时候网站还没有怎么推广,所以只能是0了。外链也非常少,倒时经过几个月的努力,实质上增加了一两百个外链,但是这次更新竟然没算上,郁闷啊!还好有三个页面开始分配了PR值,虽然不多,也算是一点安慰吧,这么一段时间的关注算是没白废。更郁闷的事情是主页没有分配PR值,GOOGLE也给我开了个玩笑,太阳竟然从西边出来了!按常理整个网站的PR值分配是以树形结构分布的,根的PR最高,也就是最重要的主页PR最高,越往下面的树枝分配到的PR越小。这个问题可能是网站结构设计的问题,正在研究中。
Google的PR值的计算,最基本的因素是外链和收录数,还有网站的历史。外部链接,不光要看数量还要看质量。数量,当然是多多益善;多,只会有益不会有害。我看过一个网站收录只有十几页(网站本身也没有什么内容,确实只有十几页),但是它的外链有一万多,PR值是4。PR能达到4以上的,都是有一定质量的网站,也是非常受欢迎的网站,但这个网站就不见得受欢迎,因为它的ALEXA排名太低了,访问量肯定不高。从这一点来说,外部链接的数量还是一个重要的因素。但是并非说PR在4以上的网站,外链就一定要达到1万。外部链接还要看质量,高质量的外部链接,一少部分就够了,肯定能给不错的PR。什么样的外部链接才算高质量呢?一是对方网站所在页面对外链接少;二是对方网站所在页面的PR值高。如果对方网站所在页面的PR是10,对外链接是1,那么这个10 的PR对你的网站来说比金子还重要,基本上你就可以分到这么多。相反,如果对方网站的对外链接是500个,那就分不到多少了。如果对方网站的PR是0,那你能分到的PR也只能是0了。
提高你网站的收录数,也是提高网站PR值的最重要的方法。比如我们网站的一个二手车频道在Google中收录近6000,但是被GOOGLE收录到的外链也只有一个,PR值也给了1。
一个新的站点开始很难给到PR值,更新周期也会很长,大的站点,历史长的站点,几乎是每个月一个更新周期。但是新站就不同了,通常都需要好几个月,半年,甚至更长。一个网站的质量如何,当然要靠时间来验证;所以GOOGLE在计算PR值时,网站的历史也是一个因素。
本文原创,转摘请注明。
文品结果:
****,您的总体评价:
技术性极强的文字风格,缜密的思维体现在字里行间;富含科技信息量的内容,充实易懂。架构清晰,逻辑性强,情节缜密,可读性强;文章内容丰富,观点翔实可 圈可点;在用词范围方面可以着重下功夫改进。情节缜密题材的小说值得尝试,将推理、悬念、历史的因素掺杂其中;同时也可以尝试杂文、评论等文体。行文时留 心描写与情节结构的紧密配合,必然会诞生令人耳目一新的作品。
****,您的评测结果:
通过评测,您的文章与知名作家的相似度比较结果见下:
- 洪波

- 87%
- 风格和这位作家很接近呢,同时不失自己的个性,加油!
- 张朝阳

- 15%
- 如果不是我们科学的分析结果,你没有发觉自己还有些许这位作家的风格吧^_^
- 木子美

- 9%
- 放心吧,你和他/她的相似度基本可以忽略不计。
有意思,我也要去
2007年1月1日0时0分搜狗发布搜狗网页搜索3.0
![]()
![]()
搜狗网页搜索3.0是全球首个百亿规模中文搜索引擎,收录100亿网页,再创全球中文网页收录量新高。
一直致力于后台技术研发和数据积累的搜狗,只用了两年时间,网页收录量就飙升至100亿!2007年1月1日震撼上线的搜狗网页搜索3.0将能够成功支持100亿网页的查询,成为全球首个网页收录量达到100亿的中文搜索引擎。
搜索引擎收录网页数据量的大小,一定程度上反映了研发团队的技术实力,搜狗网页搜索3.0凭借领先的技术实力,向中文互联网用户提供最全面的互联网信息服务。
每日网页更新达5亿,用户可直接通过网页搜索而非新闻搜索,获得最新新闻资讯
在抓取速度上,搜狗通过智能分析技术,对于不同网站、网页采取了差异化的抓取策略,充分地利用了带宽资源来抓取高时效性信息,确保互联网上的最新资讯能够在第一时间被用户检索到。
在网页搜索3.0平台上,每天搜狗的服务器集群并行更新超过五亿的网页。在强大的更新能力下,用户不必再通过新闻搜索,就能获得最新的资讯。此外,搜狗网页搜索3.0提供“按时间排序”功能,能够帮助用户更快地找到想要的信息。
在导航型和信息型的两种查询结果中,分别以94%和67%的准确度领先业界
搜狗网页搜索3.0搜索结果排名采用业界广泛认可的首个中文网页评级体系——搜狗网页评级体系(Sogou Rank),该评级体系依托搜狗百亿中文网页的储备,分析最全的中文互联网链接库,确保评级的客观公正。搜狗网页搜索3.0由于有了这个网页评级体系的保 证,搜狗的搜索结果能够做到更加精准。
经过人工对于随机选取的上千个查询词进行测试,搜狗在导航型和信息事务型查询的表现,分别达到了94%和67%的准确度,处于业内领先水平。
今天看后台的访问统计,又有了新发现,出了个新的搜索引擎:中华搜索
入口网址:http://sou.china.com/
但它不是一个独立的搜索引擎,其数据来自SOGOU的数据库。
根据:我查我们网站的收录数据,site:whsjsoft.com,SOGOU和中华搜索都是返80726页。只是中华搜索可能有自己的网页排序算法,site:whsjsoft.com页数是一样,但每页的排序不一样。
中华搜索是中华网旗下的网站,中华网:http://www.china.com/