わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

年末年始に読む

まずは,昨日読み終えたものの書評から.

Rで学ぶクラスタ解析

Rで学ぶクラスタ解析

デンドログラム*1,k-means法,混合分布モデル,スペクトラルクラスタリング,次元縮約(LSI,pLSI,NMF),ファジィクラスタリングの各手法について,数学的背景,分析例,Rでの実行例,Rの小技の順に並べてあり,クラスタ解析手法とRプログラミング技法を同時に学べます.
Rは,統計処理が一通り揃っているフリーソフトウェアというだけでなく,ベクタの処理について,情報の学科で学ぶプログラミング言語にない興味深い特徴をもっています.固有値問題を解く関数eigenについても,同書で『かなり高次元の行列も扱えるし,高速です.これだけでもRを扱う価値は十分にあります』(p.137)と述べられているとおり,見逃せません.
文書クラスタリングを想定しています(p.46)が,分析例では数値のみで,(直接的な)文書のクラスタリング例がなかったのが残念です.
本日の本題,「年末年始に読む予定の本」については,箇条書きで.

*1:研究室の卒業生ですが,研究発表を前に「“デンドログラム”も“樹状図”も言いにくい」とこぼしていた学生がおりました.同書p.35脚注には“樹形図”という表現がありますが,これだと,単純な木構造の表現と誤解されるように思えます.