Alexa部分中文门户网站数据遭涂改调查

Filed Under 网络杂谈 By 旅行者
Posted on 本文最后更新于2005-06-07 23:51:09
From links http://www.mjjq.com/blog/archives/16.html

alexa中关于一些网站的介绍文字被涂改了。我们可以看到,被涂改的网站有如下几个:

http://www.alexa.com/site/ds/top_sites?ts_mode=lang&lang=zh_gb2312

图片

原文如下:

Alexa部分中文门户网站数据遭涂改调查

这几天比较忙,相继看到一些关注alexa但热衷于批评alexa公正性的朋友提到alexa数据中文网站出现问题的帖子(有人甚至说alexa被黑,这样的网站公正性何在)。当时还在想,是不是alexa真的如他们所说不堪一击,是不是alexa真的啥也不是。今天是周六,早上再有一个朋友发来一个链接,问我到底什么原因。毕竟博客中国还是认同alexa对大家认识网站排名有好处的,他相信我能知道一二。

其实我对alexa真不知道得太多,但我去那个页面看了一下,所谓的alexa出错,其实就是alexa中关于一些网站的介绍文字被涂改了。我们可以看到,被涂改的网站有如下几个:

图片

http://www.alexa.com/site/ds/top_sites?ts_mode=lang&lang=zh_gb2312

图片


这些网站的一个共同特点,就是他们都提供了免费的电子邮件。比如sohu提供的是“×××@sohu.com”这样的格式。163提供的是**@163.com

我们再来看alexa对网站信息更新的一个方法,如果不出意料的话,这个方法存在一个大的bug。它在更新一条信息之前,有一个链接。我以新浪网作为例子。链接如下:

http://www.alexa.com/data/details/contact_info?url=http://www.sina.com.cn


当你修改表单中的信息并点提交按钮后,出现如下界面。

http://www.alexa.com/data/details/contact_info?page=2&url=http://www.sina.com.cn


问题就出在最后一条。你可用2种方法更新网站。一种是提供一个sina.com.cn后缀的邮件,一个是把alexa自动生成的一个txt文件放在自己服务器的根目录下。后一种方法不可行,前一种方法应该可行。所以上面这些网站,被一个懂得alexa这个bug的用户给修改得不成样子也就很简单了。



这是一个规则被利用了,不能成为给alexa不可信罪加一等的理由。当然,sina网可能不一定被我这么轻易地就修改了,因为sina给很多免费用户的地址是@sina.com。但我感觉bug就应在此。而且这个问题修改后,有网站很快就重新去修改回来了(比如163.com),也有人利用这个bug,可以继续把别人的网站信息改成自己的网站信息,而QQ.com,好像还是一个什么商务直通车,真的比较无聊,也说明腾讯的人从来不认真去考虑自己网站的事情,似乎只知道赚钱。当然,如果网站的管理员愿意,把正确的信息按照alexa的要求保存为info.txt,放在www.***.com的服务器的根目录下,可能可以放置一些人恶意修改这样的数据。

虽然alexa这些数据被中国人恶意修改了,但这根本不够成alexa不可信的理由,而且可以肯定的是,这不是什么alexa被黑。虽然本文作者也对alexa没有什么特别的好感,但alexa对于对比两家同类别网站的相对访问数还是很有用的。

同时,本文作者也奉劝那些对alexa动不动就讥讽的所谓的懂点技术的评论家们,有时候稍微动动脑筋想想,比什么都好。还有那些无聊地用这种方法宣传自己网站的人,也让人哭笑不得。


原文转载自:博客中国 作者:康国平 5/14/2005 11:24 AM

固定链接  |  归类:网络杂谈  |   发布于:2005-05-14 12:50:01

上一页:世界首辆载人高温超导磁悬浮实验车亮相红星路

下一页:导游拿了多少回扣

Comment


Post a Comment

(必填)

(必填) (不会被公开)

验证码