网站日志在哪里 怎样分析网站日志文件
发表日期:2015-11-02 21:18 文章编辑:admin 浏览次数:
网站日志在哪里,怎样分析网站日志文件,前面的内容中,我们知道对网站进行监测分为非流量数据监测和流量数据监测,非流量数据监测包括网站收录数据,网站排名,外部链接数据,转化和销售,今天狄吉堂就来和大家接着了解一下网站流量数据的监测,首先来了解网站日志在哪里?怎样分析网站日志文件。
网站日志在哪里?
网站日志在哪里?所有运行在互联网之上的web服务器,不论你使用的是哪个平台,多数都会将所有服务器活动记录在一个日志文件中,该文件以文本格式点log结尾保存,这个就是网站日志。我们先登录购买主机的平台然后登录主机的控制面板中,可以发现有“文件管理”或者“管理我的网站”等字样,点击进去就会发现有个选项叫“网站日志下载”,有的还会附有说明:日志下载是将您想看的日志文件先下载到您的站点logfiles文件夹下,在通过FTP将日志文件下载到您本地进行查看,日志文件会占用到您网站的空间请定期清理日志文件。
我们可以使用FTP工具将网站日志下载下来,当点击“下载”按钮之后,可能有的主机控制面板不会有提示“下载成功”的字样,但是网站日志已经下载下来了,通过FTP工具找到文件夹logfiles,打开下载到本地即可。
怎样分析网站日志文件?这是我们今天分享的重点
原始的网站日志是一个纯文本文件,我们用记事本打开即可,下面的这段文字是我昨天下载的网站日志中随机截选的一段,狄吉堂和大家一起来看看其中包含哪些信息。
原始代码:2015-10-24 12:58:28 GET /tuiguang/432.html - - 210.14.128.133 HTTP/1.1 Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.9;+rv:30.0)+Gecko/20100101+Firefox/30.0 - 200 11177 98
2015-10-24 12:58:28 表示文件被访问的准确时间。
GET 表示服务器的动作,通常服务器的动作有两种,一种是GET,一种是POST,GET表示我们访问一个网页的动作,POST表示提交表单的动作。
关于服务器动作的知识扩展——HTTP/1.1请求方法种类:
GET: 请求指定的页面信息,并返回实体主体。
HEAD: 只请求页面的首部。
POST: 请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。
PUT: 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE: 请求服务器删除指定的页面。
OPTIONS: 允许客户端查看服务器的性能。
TRACE: 请求服务器在响应中的实体主体部分返回所得到的内容。
PATCH: 实体中包含一个表,表中说明与该URI所表示的原内容的区别。
MOVE: 请求服务器将指定的页面移至另一个网络地址。
COPY: 请求服务器将指定的页面拷贝至另一个网络地址。
LINK: 请求服务器建立链接关系。
UNLINK: 断开链接关系。
WRAPPED: 允许客户端发送经过封装的请求。
Extension-mothed:在不改动协议的前提下,可增加另外的方法。
/tuiguang/432.html 表示访问的文件,这里的URL地址是相对地址,已经省去了域名部分,全部显示的话就是http://域名/tuiguang/432.html。
我们看到上边的这段日志中有“- -”两个符号,第一个“-”是指访问地址的附带参数,比如act=batch&view=&inculde=mod_bftags%3Dbftags%2C&count=spn148%3D148%2C等等,如果没有参数则用“-”表示,第二个“-”则表示访问者的名称,匿名用户用“-”来表示。
210.14.128.133 表示用户的IP地址,通过IP查询,我们知道这位用户来自北京。
HTTP/1.1 表示HTTP/1.1协议,HTTP的版本为1.1。
Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.9;+rv:30.0)+Gecko/20100101+Firefox/30.0 这一坨代码对于我们网站seo优化人员来说,个人感觉对分析网站数据作用不大,它表示浏览器的类型,显示的是浏览器和用户计算机的一些信息,比如上述代码表示用户使用的是一套运行于苹果Macintosh系列电脑上的操作系统,系统版本为rv:30.0,使用的浏览器时火狐浏览器,浏览器的软件版本为Gecko/20100101。如果用户使用的是其他类型的计算机或者浏览器,Firefox表示火狐浏览器,Maxthon表示遨游浏览器,Chrome表示Google的Chrome浏览器,MSIE 8.0则表示微软的IE8浏览器。
而当搜索引擎蜘蛛访问网站的时候,蜘蛛就相当于一个浏览器,以下这些代码用来表明它们的身份:
百度蜘蛛:compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html
360蜘蛛:360Spider(compatible;+HaosouSpider;+http://www.haosou.com/help/help_3_2.html)
谷歌蜘蛛:compatible;+Googlebot/2.1;++http://www.google.com/bot.html
雅虎蜘蛛:compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp
搜狗蜘蛛:Sogou web spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07″)
接下来代码中的"-" 表示引用站点,即访问来源。
200 表示协议状态,记录HTTP状态代码。
其他HTTP状态码:
201 : 提示知道新文件的URL
202 : 接受和处理、但处理未完成
203 : 返回信息不确定或不完整
204 : 请求收到,但返回信息为空
205 : 服务器完成了请求,用户代理必须复位当前已经浏览过的文件
206 : 服务器已经完成了部分用户的GET请求
300 : 请求的资源可在多处得到
303 : 建议客户访问其他URL或访问方式
305 : 请求的资源必须从服务器指定的地址得到
306:前一版本HTTP中使用的代码,现行版本中不再使用
307 : 申明请求的资源临时性删除
400 : 错误请求,如语法错误
401 : 请求授权失败
402 : 保留有效ChargeTo头响应
403 : 请求不答应
404 : 没有发现文件、查询或URl
405 : 用户在Request-Line字段定义的方法不答应
406 : 根据用户发送的Accept拖,请求资源不可访问
407 : 类似401,用户必须首先在代理服务器上得到授权
408 : 客户端没有在用户指定的饿时间内完成请求
409 : 对当前资源状态,请求不能完成
410 : 服务器上不再有此资源且无进一步的参考地址
411 : 服务器拒绝用户定义的Content-Length属性请求
412 : 一个或多个请求头字段在当前请求中错误
413 : 请求的资源大于服务器答应的大小
414 : 请求的资源URL长于服务器答应的长度
415 : 请求资源不支持请求项目格式
416 : 请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段
417 : 服务器不满足请求Expect头字段指定的期望值,假如是代理服务器
501 : 服务器不支持请求的函数
502 : 服务器暂时不可用,有时是为了防止发生系统过载
503 : 服务器过载或暂停维修
504 : 关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长
505 : 服务器不支持或拒绝支请求头中指定的HTTP版本
可能这么多返回状态大家很难能把每个状态码的表达内容记在心里,这里狄吉堂网站seo优化给大家提供一个比较粗略的方式方便大家记忆:
1**:请求收到,继续处理
2**:操作成功收到,分析、接受
3**:完成此请求必须进一步处理
4**:请求包含一个错误语法或不能完成
5**:服务器执行一个完全有效请求失败
代码中的“11177”表示加载文件的大小,此处的单位是字节,换算下来也就是10.92KB。
代码中的“98”表示操作所花费的时间,单位是毫秒。
一条网站日志分析完了,综合以上信息,就可以得出一个结论,我们用通俗的白话来说就是在2015年10月24日中午12点58分28秒的时候,有一位来自北京的用户使用火狐浏览器成功的访问了网站中的http://域名/tuiguang/432.html这个页面,服务器加载这个页面的大小为10.92KB,用时98毫秒。
网站日志是网站被访问最真实的记录,如果是平时查看网站日志完全可以通过现在的一些seo工具来查看或者使用Excel工具进行简化,但是当网站出现某些问题,比如访问错误,蜘蛛爬行情况等,就必须得依靠原始的网站日志了,分析网站日志也是网站seo优化工作者必修的一门功课之一。
标签:网站日志,流量数据监测,URL地址
如无特殊注明,文章均为优搜网原创,转载请注明来自优搜网(www.uso520.com)。