如何查看 服务器日志 进行网站分析

对于服务器日志的分析并不容易进行,初学者,以及在大多数情况下,进行以用户行为分析为核心的网站分析,都是用不到服务器日志的,而是通过流量统计工具,不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一学的。

是用来记录网站服务器的运行信息的,或者简单说,是用来记录服务器中的什么页面在什么时候被谁访问了。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录,通过网站日志可以清楚的得知用户在什么IP?什么时间?用什么操作系统?什么浏览器?什么分辨率显示器的情况下访问了你网站的哪个页面?是否访问成功?

log file实际上并不简单,为了让其具有可读性,并不可以按照各个网站所有者的喜好随意记录的,而是有自己的规范,W3C组织定义了通用格式,而其他一些组织或者个人又根据自己的需要额外扩展了这个格式。看起来,网站服务器日志所记录的内容是很有限的,但是,千万别认为网站服务器日志文件会很小,对于一些大网站,每分每秒都有很多访问者对网站服务器进行请求,所以日志文件会积少成多,成为巨型的数据文件。有时候,一个小时的记录就能超过数G的容量,如果你网站的服务器日志一个月才1M,那你就要加油了。

任何服务器响应的请求都会被记录下来,这些响应可能是应答用户发出的请求,也完全可能是应答一些互联网上自动程序发出的请求。最常见的一种互联网上的自动程序是搜索引擎,这意味着网站服务器日志能够用来分析搜索引擎的访问,并帮助我们优化搜索引擎对网站的访问。

无论是何种终端访问服务器,都能把相关数据记录下来。现在,能够访问网站的终端越来越多了,我无聊的时候也试着用Sony的PSP上网,用手机的GPRS也能轻松的浏览网页,这些形形色色的终端的访问,服务器日志都会忠实的记录,但页面加入标签的方法就可能行不通。日志方法的另一个好处是能够记录文件下载的情况,如果你在网上下载一个MP3音乐,你在发出这个响应的时候,日志会记录一个状态;你在下载完全的时候,日志照样会记录一个状态;如果你没有下载完全,日志还是会记录下来,这个,我想对那些提供下载服务的网站很有用。

通过日志获取数据本身不需要额外的第三方的帮助,只要你的服务器在运转,日志就会源源不断的被创建、保存。不过,请注意,这里我所指的是数据的获取不需要额外的支持,但是数据的分析一般而言,还是需要第三方的帮助的,直接去用读日志文件中的数据进行分析是不可想象的。现在,我们大部分人的浏览器都设置了缓存,所以,有时候,你会发现,即使网络没有接通,你访问的网站似乎也能正常打开,只不过浏览器会显示脱机状态,告诉你,这些内容不是真正从服务器传输过来的。可是,对于通过服务器日志来获取网站访问数据的方法而言,这可不是一个好事情,由于缓存的存在,本来应该请求服务器的结果不需要请求了,服务器的日志什么也不会记录下来,可是对页面的访问却又实实在在的发生了,所以,缓存的存在会使日志方法低估网站的实际访问量。

随机展示

猜你喜欢