网站日志在哪里怎样分析网站日志文件

发表日期：2015-11-02 21:18 文章编辑：admin 浏览次数：

网站日志在哪里，怎样分析网站日志文件，前面的内容中，我们知道对网站进行监测分为非流量数据监测和流量数据监测，非流量数据监测包括网站收录数据，网站排名，外部链接数据，转化和销售，今天狄吉堂就来和大家接着了解一下网站流量数据的监测，首先来了解网站日志在哪里？怎样分析网站日志文件。

网站日志在哪里？

网站日志在哪里？所有运行在互联网之上的web服务器，不论你使用的是哪个平台，多数都会将所有服务器活动记录在一个日志文件中，该文件以文本格式点log结尾保存，这个就是网站日志。我们先登录购买主机的平台然后登录主机的控制面板中，可以发现有“文件管理”或者“管理我的网站”等字样，点击进去就会发现有个选项叫“网站日志下载”，有的还会附有说明：日志下载是将您想看的日志文件先下载到您的站点logfiles文件夹下，在通过FTP将日志文件下载到您本地进行查看，日志文件会占用到您网站的空间请定期清理日志文件。

我们可以使用FTP工具将网站日志下载下来，当点击“下载”按钮之后，可能有的主机控制面板不会有提示“下载成功”的字样，但是网站日志已经下载下来了，通过FTP工具找到文件夹logfiles，打开下载到本地即可。

怎样分析网站日志文件？这是我们今天分享的重点

原始的网站日志是一个纯文本文件，我们用记事本打开即可，下面的这段文字是我昨天下载的网站日志中随机截选的一段，狄吉堂和大家一起来看看其中包含哪些信息。

原始代码：2015-10-24 12:58:28 GET /tuiguang/432.html - - 210.14.128.133 HTTP/1.1 Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.9;+rv:30.0)+Gecko/20100101+Firefox/30.0 - 200 11177 98

2015-10-24 12:58:28 表示文件被访问的准确时间。

GET 表示服务器的动作，通常服务器的动作有两种，一种是GET，一种是POST，GET表示我们访问一个网页的动作，POST表示提交表单的动作。

关于服务器动作的知识扩展——HTTP/1.1请求方法种类：

GET：请求指定的页面信息，并返回实体主体。

HEAD：只请求页面的首部。

POST：请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。

PUT：从客户端向服务器传送的数据取代指定的文档的内容。

DELETE：请求服务器删除指定的页面。

OPTIONS：允许客户端查看服务器的性能。

TRACE：请求服务器在响应中的实体主体部分返回所得到的内容。

PATCH：实体中包含一个表，表中说明与该URI所表示的原内容的区别。

MOVE：请求服务器将指定的页面移至另一个网络地址。

COPY：请求服务器将指定的页面拷贝至另一个网络地址。

LINK：请求服务器建立链接关系。

UNLINK：断开链接关系。

WRAPPED：允许客户端发送经过封装的请求。

Extension-mothed：在不改动协议的前提下，可增加另外的方法。

/tuiguang/432.html 表示访问的文件，这里的URL地址是相对地址，已经省去了域名部分，全部显示的话就是http://域名/tuiguang/432.html。

我们看到上边的这段日志中有“- -”两个符号，第一个“-”是指访问地址的附带参数，比如act=batch&view=&inculde=mod_bftags%3Dbftags%2C&count=spn148%3D148%2C等等，如果没有参数则用“-”表示，第二个“-”则表示访问者的名称，匿名用户用“-”来表示。

210.14.128.133 表示用户的IP地址，通过IP查询，我们知道这位用户来自北京。

HTTP/1.1 表示HTTP/1.1协议，HTTP的版本为1.1。

Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.9;+rv:30.0)+Gecko/20100101+Firefox/30.0 这一坨代码对于我们网站seo优化人员来说，个人感觉对分析网站数据作用不大，它表示浏览器的类型，显示的是浏览器和用户计算机的一些信息，比如上述代码表示用户使用的是一套运行于苹果Macintosh系列电脑上的操作系统，系统版本为rv:30.0，使用的浏览器时火狐浏览器，浏览器的软件版本为Gecko/20100101。如果用户使用的是其他类型的计算机或者浏览器，Firefox表示火狐浏览器，Maxthon表示遨游浏览器，Chrome表示Google的Chrome浏览器，MSIE 8.0则表示微软的IE8浏览器。

而当搜索引擎蜘蛛访问网站的时候，蜘蛛就相当于一个浏览器，以下这些代码用来表明它们的身份：

百度蜘蛛：compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html

360蜘蛛：360Spider(compatible;+HaosouSpider;+http://www.haosou.com/help/help_3_2.html)

谷歌蜘蛛：compatible;+Googlebot/2.1;++http://www.google.com/bot.html

雅虎蜘蛛：compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp

搜狗蜘蛛：Sogou web spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07″)

接下来代码中的"-" 表示引用站点，即访问来源。

200 表示协议状态，记录HTTP状态代码。

其他HTTP状态码：

201 : 提示知道新文件的URL

202 : 接受和处理、但处理未完成

203 : 返回信息不确定或不完整

204 : 请求收到，但返回信息为空

205 : 服务器完成了请求，用户代理必须复位当前已经浏览过的文件

206 : 服务器已经完成了部分用户的GET请求

300 : 请求的资源可在多处得到

303 : 建议客户访问其他URL或访问方式

305 : 请求的资源必须从服务器指定的地址得到

306：前一版本HTTP中使用的代码，现行版本中不再使用

307 : 申明请求的资源临时性删除

400 : 错误请求，如语法错误

401 : 请求授权失败

402 : 保留有效ChargeTo头响应

403 : 请求不答应

404 : 没有发现文件、查询或URl

405 : 用户在Request-Line字段定义的方法不答应

406 : 根据用户发送的Accept拖，请求资源不可访问

407 : 类似401，用户必须首先在代理服务器上得到授权

408 : 客户端没有在用户指定的饿时间内完成请求

409 : 对当前资源状态，请求不能完成

410 : 服务器上不再有此资源且无进一步的参考地址

411 : 服务器拒绝用户定义的Content-Length属性请求

412 : 一个或多个请求头字段在当前请求中错误

413 : 请求的资源大于服务器答应的大小

414 : 请求的资源URL长于服务器答应的长度

415 : 请求资源不支持请求项目格式

416 : 请求中包含Range请求头字段，在当前请求资源范围内没有range指示值，请求也不包含If-Range请求头字段

417 : 服务器不满足请求Expect头字段指定的期望值，假如是代理服务器

501 : 服务器不支持请求的函数

502 : 服务器暂时不可用，有时是为了防止发生系统过载

503 : 服务器过载或暂停维修

504 : 关口过载，服务器使用另一个关口或服务来响应用户，等待时间设定值较长

505 : 服务器不支持或拒绝支请求头中指定的HTTP版本

可能这么多返回状态大家很难能把每个状态码的表达内容记在心里，这里狄吉堂网站seo优化给大家提供一个比较粗略的方式方便大家记忆：

1**：请求收到，继续处理

2**：操作成功收到，分析、接受

3**：完成此请求必须进一步处理

4**：请求包含一个错误语法或不能完成

5**：服务器执行一个完全有效请求失败

代码中的“11177”表示加载文件的大小，此处的单位是字节，换算下来也就是10.92KB。

代码中的“98”表示操作所花费的时间，单位是毫秒。

一条网站日志分析完了，综合以上信息，就可以得出一个结论，我们用通俗的白话来说就是在2015年10月24日中午12点58分28秒的时候，有一位来自北京的用户使用火狐浏览器成功的访问了网站中的http://域名/tuiguang/432.html这个页面，服务器加载这个页面的大小为10.92KB，用时98毫秒。

网站日志是网站被访问最真实的记录，如果是平时查看网站日志完全可以通过现在的一些seo工具来查看或者使用Excel工具进行简化，但是当网站出现某些问题，比如访问错误，蜘蛛爬行情况等，就必须得依靠原始的网站日志了，分析网站日志也是网站seo优化工作者必修的一门功课之一。

标签：网站日志,流量数据监测,URL地址

如无特殊注明，文章均为优搜网原创，转载请注明来自优搜网（www.uso520.com）。