touch入りURLのアクセスベスト10の続きのようなものです.先日は,はてなカウンターのページからの切り貼りで,上位アクセス記事を取得しましたが,今回,月単位でダウンロードできる,アクセスログのCSVファイルをもとに,集計を行うRubyスクリプトを作成しました.
出来上がったExcelファイルを,http://d.hatena.ne.jp/takehikom/files/takehikom_access.xlsx?d=downloadよりダウンロードできるようにしました*1.
集計にあたり,少し手間を要したのは,URLの統一化(正規化)です.そのままでいいパターンのほかに,書き換え(正規化)が必要となるものが4パターンあり,場合分けして処理しました.Excelファイルの「note」ワークシートに書いたものを,表にしておきます.
アクセスログ記載のURL | 正規化URL | アクセス種別 |
---|---|---|
http://d.hatena.ne.jp/takehikom/20140530/1401399035 | http://d.hatena.ne.jp/takehikom/20140530/1401399035 | PC |
http://d.hatena.ne.jp/takehikom/comment/20140530/1401399035 | http://d.hatena.ne.jp/takehikom/20140530/1401399035 | PC |
http://d.hatena.ne.jp/takehikom/touch/20140530/1401399035 | http://d.hatena.ne.jp/takehikom/20140530/1401399035 | モバイル |
http://d.hatena.ne.jp/takehikom/touch/comment/20140530/1401399035 | http://d.hatena.ne.jp/takehikom/20140530/1401399035 | モバイル |
http://d.hatena.ne.jp/takehikom/mobile?date=20140530§ion=1401399035 | http://d.hatena.ne.jp/takehikom/20140530/1401399035 | モバイル |
集計にあたっては,PCアクセス数+mobileアクセス数が100以上を対象とし,mobileアクセス率が高いURLより順に,mobileアクセス率,PCアクセス数,mobileアクセス数,URLを,CSVファイルに書き出しました.
ですが,眺めてみても,何の記事だったかが思い出せないのがほとんどです.そこで,hatedmaによりメンテナンスしている記事一覧を(Rubyスクリプト内で)開き,URL・タイトル・カテゴリーを取り出して,新たなCSVファイルを生成させました.
モバイルアクセス率(=モバイルアクセス数/(PCアクセス数+モバイルアクセス数))が最も高かったのは,0.9を超えていました.その記事は……
と言いたいところですが,該当記事を読み直しまして,注目されるにはふさわしくない内容と判断しました.Excelファイルでは,URL・タイトル・カテゴリーを「―」に置き換えました.他にもう1つ,同様の措置をした記事があります.
上から下まで,順に眺めてみると,いくつか興味深いことが浮かび上がってきます.上位(モバイル率の高い記事)は,多彩なタイトルが見られます.上位から中位までは,[5×3]や[OoM]などの「かけ算の順序」カテゴリーが多い中,[研究室],[教育],[英語]といった,ふだんの研究教育活動をもとにした記事も確認できます.下位(モバイル率0.2以下あたり)では,[computing],[Ruby],[C]など,プログラミング関連のカテゴリーが大部分を占めています.カテゴリーの違いから,各記事へのアクセスの経緯も想像できます.それと,記事数の比較的多い「親馬鹿」カテゴリーでは,アクセス数100以上の記事が少ないことにも気づかされます.
日によっては,検索流入を期待し,また日によっては,書き残したいことを手短にまとめた内容にしています.今後もご愛顧のほどよろしくお願い申し上げます.