汽修软件-汽配软件-汽修厂用首佳汽修汽配管理软件系统管理汽修厂

2007年07月31日

google搜索引擎蜘蛛抓取原则造成404错误的问题

类归于: 谷歌搜索引擎研究 — 标签:, , — 汽修汽配管理软件 @ 7:03 上午

首佳汽车维修管理博客开通后,我就比较关注搜索引擎的收录情况,一直都出现大量的404错误(无法访问的网址),原因一方面有博客程序的问题,比如配置的问题和程序BUG的问题产生大量的无效链接。

第二方面,应该归就于google蜘蛛抓取的原则,比如谷歌开始抓取本应在客户端生成的网页内容,比如用javascript写的链接代码也给抓取了,按道理,搜索引擎蜘蛛人应该先过滤所有的HTML标签、CSS样式表、JS代码,再把余下的内容抓取。例子:百度空间的友情链接就是由javascript写的,并在客户端生成的网页内容,现在好像开始计算在有效的友情链接内了。

第三方面,有些网页码也应该过滤掉的,或者跳过不计算链接。比如很多网站在留下邮箱时,都在网页有mailto:这样的代码。但是在抓取时被算作无 效链接的内容是:域名加/mailto:abc@163.com。类似这样的例子很多,按正常的网页设计方法,网页在浏览时完全是正常的,但在搜索引擎眼 里却是404错误。还比如很多网站有调查的栏目,一般用JS代码来写,链接到调查操作的代码这样写的:href=\’javascript:VoteForm.submit();\’这个也被谷歌抓取成域名加/javascript:VoteForm.submit()了,这自然会成为无效链接,网站增加了很多404错误了。

来自:搜索引擎研究

首发地址:http://www.whsjsoft.com/blog/u/whsjsoft/archives/2007/28.html

转载请注明作者和链接。

2007年07月13日

百度空间你还存在否?

类归于: 关于百度那些破事 — 标签:, — 汽修汽配管理软件 @ 7:05 下午

正在浏览百度空间,突然出现在百度的404错误,告诉我访问的地址不存在了,我以为这个好友的空间被百度删除了。没理由的,她的空间又不做广告、内容不违法。多点了几个都不行了,再点hi.baidu.com也是404错误。

原来是暂时的服务器不正常,ping hi.baidu.com 开始还丢失了三包,只有一个数据包是成功的。ping多了几次才正常了。意外的发现,域名hi.baidu.com还做了二次解析,被解析到hi.a.shifen.com,IP是220.181.18.117。过了几分钟,百度的服务常又出现异常了。这次再ping,IP都变了,解析到:202.108.23.231。汗!百度竟然在这个时候更换服务器。

来自:搜索引擎研究

2007年03月8日

301重定向可能带来的404错误

类归于: 网站建设及推广, 谷歌搜索引擎研究 — 标签:, , — 汽修汽配管理软件 @ 7:04 上午

先来解释一下什么叫“301重定向”?什么是404错误?

301重定向:
重定向,即自动跳转或叫自动转向,指当访问用户登陆到某网站时,自动将用户转向其它网页地址的一种技术。转向的网页地址可以是网站内的其它网页,也可以是其它网站。重定向有很多种方式,其中301重定向是页面永久性移走,是一种很重要的自动转向技术。从搜索引擎优化角度出发,301重定向是网址重定向最为可行的一种办法。当网站的域名发生变更后,搜索引擎只对新网址进行索引,同时又会把旧地址下原有的 外部链接如数转移到新地址下,从而不会让网站的排名因为网址变更而收到丝毫影响。同样,在使用301永久性重定向命令让多个域名指向网站主域时,亦不会对 网站的排名产生任何负面影响。

404错误:
即在访问时无法找到该页,可能不存在该页面文件,或者无法访问的域名。

我有一个站因为当初设计的原因需要做重定向,比如访问域名www.abc.com要重定向到www.abc.com/123/目录下面。网站是ASP设计的,ASP的重定向代码如下:
Response.Status=”301 Moved Permanently”
Response.AddHeader “Location”,”abc/”
Response.End

在使用Google的网站管理员工具时,发现有时候的统计报告中的网络抓取错误有“未找到”的网址,比如:http://www.abc.com/1234.asp
其实网站上只有http://www.abc.com/abc/1234.asp的地址才是正确的
但是检查网页,真找不到有这种死链接的错误,百思不得其解。经过跳转了,应该是没有这种错误才对,但是也有可能搜索引擎蜘蛛人有时未能正确处理301重定向造成404的错误。所以我重新开始检查网页代码,发现有些代码是按相对路径来写的,所以就有可能出现http://www.abc.com/1234.asp这样的地址让搜索引擎蜘蛛人去抓了,出现了404错误。于是我把有相对路径的代码都改成绝对路径。但是搜索引擎蜘蛛人每一次的抓取是不会全站重新抓取的,所以结果还有待观察。

404错误会影响网站的信誉度,Google对网站信誉度要求极高,所以整个应当尽量保持没有或很少有死链接404错误等。

来自:
管理软件资讯博客
转摘请注明

首佳软件是专业从事汽修软件、汽配软件、汽车美容软件及4S店管理软件研发和销售的公司,是知名的汽修汽配管理软件供应商.因首佳软件的简单易学易用、性价比高的特性,而广泛应用于全国各地的汽修厂,汽配店,汽车4S店,汽车维修站,汽车美容连锁店等企业. 本博客由 WordPress 所驱动