#contents

*アクセス解析
----
ログ解析と、それにまつわるツール(Webalizer)について。

** 参考資料
-マーケティングに利用するアクセスログ解析の基本と評価
~http://www.mediaweb.biz/database/others/market_log.html
-Log analyzers Comparisons(ログ解析ツールの比較)
~http://awstats.sourceforge.net/docs/awstats_compare.html
-CCCモール(ショッピングモールサイト)
~Webalizerによるショップページアクセスログ解析方法
&br;http://mall.commercecity.or.jp/Mall/contents/static/webalizer_sample/
-HTTPレスポンスコード概説
~http://www.studyinghttp.net/status_code

**ログ解析ツールさまざま
Apacheのログを解析するツールとして、以下の3つを挙げる。
-[[analog>http://www.jp.analog.cx/]]
~最も基本的なログアナライザ。&br;
アナライズしたものを表にはできるが、ここからツールを用いて、さらなる分析を行う必要がある。

-[[Webalizer>http://www.mrunix.net/webalizer/]]
~analogよりは一歩進んだログアナライザ。&br;
今回の説明の中心。Webminに最初からモジュールが用意されており運用は簡単。

-[[AWFFull:http://www.stedee.id.au/awffull]]
~AWFFull is a fork of the venerable Webalizer log analysis program.

-[[AWStats>http://awstats.sourceforge.net/]]
~Webalizerの上を行く『と評判の』ログアナライザ。~
AWStatsのtoolsにWebminのモジュールが用意されており運用は簡単。~

-[[phpSiteAnalyser:http://emutyworks.com/psa/]]
~phpSiteAnalyser は、良くありがちな「HTMLに特定のタグを埋め込むと訪問者のアクセスを記録してくれる」ってやつです。

-[[RedKernel Referrer Tracker - Free Php/MySql Script:http://rkrt.redkernel-softwares.com]]
~RedKernel Referrer Tracker use a powerful tmp/cache filsystem (combined with MySql) to reduce the server load, it can handle a very big amount of hits even on a little server.

-[[PHPSiteStats:http://sourceforge.net/projects/phpsitestats/]]
~PHPSiteStats is a website statistics and monitoring software for small to large web sites and can be either database driven or logfile driven

-[[Google Analytics:http://www.google.com/analytics/ja-JP/]]
~Google Analytics では、訪問ユーザーがどのようにサイトを見つけたか、サイトでどのような操作を行ったかなど、必要なあらゆる情報を収集できます。これにより、投資収益率の高いキャンペーンや広告活動にマーケティング リソースを重点的に配分して、サイトの訪問ユーザー数を増やすことができます。

各ログアナライザのインストールと設定については、[[こちら>Setup/Apacheログアナライザ]]を参照

**Webalizerのログの意味
実際の概要については、上記リンクに譲るとして、ここでは、アクセス解析時に使われる情報についてのみ述べることにする。
&br;
Webalizerのログ解析では、Visits(訪問者数)と他の項目をからめてさらに解析を行うことで、より深い分析に用いるための材料が提供される、と考えた方がよい。

*** 月ごとの統計
-グラフ(Graph)&br;
季節ごとの推移を見る場合には、役立つ情報。&br;

#hr

月ごとの統計は『一日あたりの平均』と『一ヶ月の合計』に分かれており、各項目は次のような意味を持つ。

-Pages(ページ数)&br;
閲覧されたHTMLのページ数。&br;
『月当たり○○ページビュー』といったときの○○と同じ意味である。&br;
静的なHTMLページでできているサイトであれば、自サイトにおけるページ閲覧数の合計を知ることができる。&br;
ただし、URLとからめた行動追跡には使いづらいと思われる。

-Visits(訪問の数)&br;
30分以内の同一IPアドレスからのアクセスを除いたカウント。&br;
訪問者数の基準値としては、一番使いやすいモノと考えられる。

-Sites(訪問されたサイト数)&br;
1年以内の同一IPアドレスからのアクセスを除いたカウント。&br;
測り始めてから、1年ごとの統計を取るとサイト数の合計はわかる。が、実際の客数から考えるとかなり多めの数になるはず(DHCPでのアドレス変更を考慮する必要がある)。

#hr

なお、日ごとの統計ページにも、項目名を変えて同じサマリが存在しており、これを参考にしてもよい。


*** 日ごとの統計
日ごとの統計は、月単位の統計をさらに、日単位(または時単位)に分割して、再統計したモノである。
多くの項目が表示されるが、このうち、アクセス解析に必要と思われる表のみを掲載する。

-レスポンスコードごとのヒット数&br;
HTTPレスポンスコードごとに、ヒット数をカウントし直したもの。&br;
有効アクセス数を知る場合の材料として使う。

-日ごとの統計&br;
1日ごとのアクセスの統計。
キャンペーンを行ったときなどに普段の何倍になったか?&br;
というような場合の判断材料として使う。&br;
たくさんきてほしい日に、予想より低い値であれば、そのときは客入りが悪かった、などと言い換えて考えるための材料。

-時間ごとの統計&br;
一ヶ月のログを、時単位で分割し直したもの。&br;
ここ一ヶ月において、どの時間帯にアクセスが集中しているか、などの判断材料として用いる。&br;
タイムサービスを行うときの判断材料として使えると思われる。
-トップ 30 of ?? 全URL&br;
『??』は、有効アクセスのURL数である。これは、各サイトの構造やログの取り方によって異なる。&br;
どのページに対して、アクセスが試みられたかがURLごとにランキングされる。

-トップ 10 of ?? Total Entry Pages&br;
Visitsにカウントされるような訪問者が、どのページを一番最初に訪れたのかを示すランキング。&br;
極端にTopページのカウントが少ないようであれば、訪問者は、Topページを見たくない(または見るのを面倒)と考えていることになり、構造の見直しのきっかけとなる。

-トップ 10 of ?? Total Exit Pages&br;
Visitsにカウントされるような訪問者が、どのページを一番最後に見ているかを示すランキング。&br;
ランクに表示されるページから訪問者は他(ドメイン)のサイトへ行ったことになり、これらのページに目的ページ(商品一覧や訪問してほしいサイト)へのリンクを置くことで、効果的にリンクを目に触れさせることができる。&br;
つまり、誘導ポイントを置くための判断材料。


-トップ 30 of ?? リファラー&br;
訪問者は、どのページのリンクをクリックして、このサイトを訪れたかを示すリファラーのランキング。&br;
自サイト外で、もっとも多いリファラーを洗い出すことで、どのページのリンクが訪問者に最も効果的にクリックされているか、を知ることができる。&br;

-トップ 7 of ?? Total Search Strings&br;
検索サイトで、どのキーワードによって検索されたかを示すランキング、SEOが有効に機能しているかどうかの検討材料。&br;

そのほかの項目として以下の表も存在するが、アクセス解析にとっての材料としては、やや使いにくい。(セキュリティ上は使えるものもある)

-トップ 30 of ?? サイト&br;
訪問者のIPアドレスのランキング。&br;

-トップ 14 of ?? ユーザエージェント&br;
訪問者のブラウザ(User-Agent)を示すランキング。&br;

-トップ 1 of ?? Total Usernames&br;
訪問者がBasic認証で、どのユーザを使用したかのランキング。&br;

-トップ 5 of ?? 国&br;
訪問者が、どの国(の管轄下にある)ドメインを持つかを示すランキング&br;


----
**活用面から見たログ

***総ヒット数と、レスポンスコードごとのヒット数&br;
総ヒット数とレスポンスコードごとのヒット数を相関させることで、有効ヒット数を知る場合に使える。&br;
たとえば、あるサイトログにおいて、以下のようなレスポンスコードごとのヒット数があったとする。
|Code 200 - OK|899|
|Code 301 - Moved Permanently|55|
|Code 302 - Found|439|
|Code 304 - Not Modified|409|
|Code 400 - Bad Request|1|
|Code 401 - Unauthorized|13|
|Code 403 - Forbidden|21|
|Code 404 - Not Found|69|
|Code 500 - Internal Server Error|18|
|Code 501 - Not Implemented|1|
|有効アクセス数&br;(2xxと3xxの合計)|1802|
|エラーアクセス数&br;(4xxと5xxの合計)|123|
|総アクセスカウント&br;(Hitと同じ数かまたはそれに近い)|1925|
|有効アクセスの割合&br; (有効アクセス数÷総アクセスカウント)|93.61%|
このとき、有効アクセスの割合が低い場合(8割以下など)であれば、サイトの構造に欠陥があったり、不正アクセスを試みられている場合が多い、ということであり、サイトの構造を見直す必要があると考えられる。


ページ先頭へ   最終更新のRDF 最終更新のRSS
Valid XHTML 1.1 Valid CSS! [Valid RSS]