T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

统计系统的五维理论

【 网络作者:David 更新时间:2007-06-20 | 字体:
[导读]最近一直在思考统计系统的统计规则怎样实现。昨天终于有了一点灵感,可以用数学模型来描述统计系统。(这里所说的统计系统是指网站统计系统web analytics) 统计系统统计的是访问者在对网站的访问情况,或者说是访问...

最近一直在思考统计系统的统计规则怎样实现。昨天终于有了一点灵感,可以用数学模型来描述统计系统。(这里所说的统计系统是指网站统计系统web analytics)

统计系统统计的是访问者在对网站的访问情况,或者说是访问者的访问行为。这里面包含三个基本要素:
1.访问者
访问者对应ip,但有共享上网的情况,所以更准确点,需要对应cookie。
2.网站
说是网站,其实更准确的说应该是url,传统的网站都是一个url对应一个叶面,统计系统的统计也都是基于url的。但随着动态技术、ajax、flash等在服务端存储状态以及异步应用的出现,很多url指代的内容也不再固定(这个暂不考虑)。
url又包括两种,来源url(referrer)和目标url(当前网页)
3.时间
这个不用说了,一切以时间为基础。

上面三个就形成了用户访问网站的最基本三维,目前大多数统计系统还是基于这三维的,而且大部分是不是完整的建立在这个三维坐标系内,很多只是分别实现了2和3的二维,1和3的二维;1和2的联系没有完整建立起来。比如51.la、google analytics等。

完整建立起三维空间的统计系统很少,目前我知道的只有getclicky.com,还有我自己的统计系统(www.referer.cn):P
getclicky的三维并不完整,我简单看了一下它的演示,时间轴是有区间的,只在一天(day)的范围上有效,跨日的统计没有建立。
referer比较完整,但目前实现的统计规则比较少。

上面说了三维,另外的两维从何而来呢?

三维的统计系统只是实现了用户访问的统计,并没有实现用户在网站上行为的统计。什么是用户行为呢?也就是用户在网页上干什么,是在读还是在写?用户要在网页上产生行为,必须通过电脑,通过鼠标键盘,所以对用户行为的统计转化为对鼠标键盘操作的统计。通过简单的触发,我们可以统计到用户在页面的什么位置点了鼠标,用户通过键盘输入了什么内容。

对键盘行为的捕获意义不是很大,但实现难度和成本却很高,所以暂且放弃对键盘事件的统计。

剩下的就是对鼠标行为的统计了,鼠标的运作原理就是在屏幕的二位坐标系内确定坐标。我们要做的就是捕获鼠标的坐标以及点击行为。通过对鼠标行为的捕捉和深入分析,可以获得很多有价值的数据。

因而产生了统计系统另外的两个纬度:屏幕的坐标。

目前能够实现鼠标行为统计的还很少,我知道的有http://www.tapefailure.comhttp://www.clicktale.com/www.crazyegg.comhttp://www.mybloglog.com/
然后就是我的referer了.
这种行为统计系统数据量要大很多,大部分系统只是实现了部分的统计,比如只统计点击时的坐标,clicktale和tapefailure完整统计了鼠标移动轨迹,估计是由于数据量的原因,clicktale到现在只是小范围测试,没有进展。tapefailure似乎是模仿着clicktale来的,回放界面都差不多。

referer是目前是实现点击统计,但只是开放了链接上点击的统计,效果可以在我的blog上看到,点击过的链接上会有一个浮动的统计标签。

随着互联网应用的发展,仅仅做到这五维的统计是不够的,就像前面提到,flash和ajax应用,已经使内容和url不再一一对应。这就使得统计精确度和难度更大,如果要做到这方面的统计,那就不是三维或者五维能够完成的了。

其实这是一种垂直趋势,任何行业都如此,不断的深入,不断的完善。统计系统将朝着这个方向发展,并且是飞快的发展。

Author:David | English Version 【转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
URL:

  • 转载请注明来源:IT学习网 网址:http://www.t086.com/ 向您的朋友推荐此文章
  • 特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系我们,我们会尽快予以更正。
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:17.41ms QueryTime:7