IIRの一章を読んでみた

発売まで2ヶ月を切ったということもあって,噂のIIRことIntroduction to Information Retrievalを読んでみた.

Introduction to Information Retrieval

Introduction to Information Retrieval

山下たつを氏らがやっているアレ
はてなのnaoya氏がIIR輪講の復習資料とかuploadしているけれど,あえて事前知識を入れずに読んでみる.


一章はBoolean retrieval.term-document matrixの話から始めて,ナチュラル?に転置インデックスに持ってきている.

Dictionary -> Posting list

の説明と,複数ANDを取る際にposting listが短いもの同士のANDを取っていきましょう,というところでジャブ程度の擬似コードが出てきた.


個人的にはExampleで紹介されているWestlawの話がよかった.ウェブ検索エンジンでは見かけないクエリ条件などが説明されていて,さらにそれが演習問題に使われているのがおもしろい.
まとめのところにも繰り返しかかれているが,ここで近接検索の必要性について気がつかせる布石になっている,と感じた.直接的に○章で述べる,という記述が多い気がするけれど,きちんと考えて構成しているんだろうなぁ.
演習問題は易しめ.(一章だからか?)Furthur readingはもっと充実させてもよい気がする.


英語は非常に簡単なのですいすい読める.とはいっても一章読むのに1.5hかかった...英語がんばろう.
僕はすでに情報検索アルゴリズムを通して読んでいることもあって,この章に限っていえば,目新しい話題はなかった.
この先を読んでみないとわからないけれど,初心者でも読めるレベルに設定されていると思うし,英語もわかりやすいのでB4でも輪読できるんじゃないかなぁ


読み終わってから,naoya氏の復習資料を拝見.とてもわかりやすい.
というか,これを読めば10分で理解できるorz
読みやすい&章が多くて一章あたりの分量が少ないので,ちょくちょく読んでいきたいと思います.
今さら感はあるけれど,Introduction to Modern Information Retrievalも読んでみたい.


5月病が終わってリバウンド気味な6月の夜.


情報検索アルゴリズム

情報検索アルゴリズム

Modern Information Retrieval (Acm Press Series)

Modern Information Retrieval (Acm Press Series)