わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

ランキングに隠れている真理

数日かけて,読みました.数学的なところを,きちんと理解していないとはいえ,面白い内容でした.
どんな本かというと…なのですが,以下の書評がおすすめです.

Amazon.co.jpの和書群=アマゾン書店における,ランキングの値と,最後に売れてからの経過時間の関係は,p.78の表4-1に,また,「1000位で30分/冊」といった,上位ランキングの値と,注文頻度の関係については,その次のページで表4-2としてまとめられています.ビッグヒットとロングテールの関係,より正確には,ロングテールビジネスモデルが成立する/しない状況については,p.155の図7-1から見ることができます.
上の書評で書かれていませんが,読み直して,一番「そうなのか!」と思ったのは,以下のくだりです(太字は引用者).

一般に,インターネットの小売店での商品購入やウェブの掲示板の書き込みやブログ閲覧など,多数の利用者がアクセスすることを目的として,多数の項目をウェブページとして公開するウェブのシステムにおいて,各項目のページに先頭に飛ぶ規則に従う順位(ランキング)が貼ってあるか,または項目名の並んだ一覧ページが先頭に跳ぶ規則に従って,利用のあった項目が一覧の先頭に跳ぶように配置してあれば,どれか一つの項目の順位の時間経過を見ることで,アクセス頻度の分布という基礎的な統計情報が得られる.(略)
(p.157)

ここは,こう考えています.小中学生の算数・数学(理科を含むかも)の話でいうと,xとyの関係を知る(例えば,グラフを描く)には,まっとうな方法ではそれなりの数の(x,y)を取得しないといけないけれども,「yはxに比例」という情報があれば,1組の(x,y)を知るだけで,関係が何なのかが分かる,というのと,似ているように思います.“yはxに比例”に対応する本書の数理モデルが,“確率順位付け模型”になるわけです.
本日のエントリのタイトルは,p.156の小見出しによるものです.