IIRの一章を読んでみた
発売まで2ヶ月を切ったということもあって,噂のIIRことIntroduction to Information Retrievalを読んでみた.
Introduction to Information Retrieval
- 作者: Christopher D. Manning,Prabhakar Raghavan,Hinrich Schuetze
- 出版社/メーカー: Cambridge University Press
- 発売日: 2008/07/07
- メディア: ハードカバー
- 購入: 7人 クリック: 115回
- この商品を含むブログ (37件) を見る
山下たつを氏らがやっているアレ.
はてなのnaoya氏がIIR輪講の復習資料とかuploadしているけれど,あえて事前知識を入れずに読んでみる.
一章はBoolean retrieval.term-document matrixの話から始めて,ナチュラル?に転置インデックスに持ってきている.
Dictionary -> Posting list
の説明と,複数ANDを取る際にposting listが短いもの同士のANDを取っていきましょう,というところでジャブ程度の擬似コードが出てきた.
個人的にはExampleで紹介されているWestlawの話がよかった.ウェブ検索エンジンでは見かけないクエリ条件などが説明されていて,さらにそれが演習問題に使われているのがおもしろい.
まとめのところにも繰り返しかかれているが,ここで近接検索の必要性について気がつかせる布石になっている,と感じた.直接的に○章で述べる,という記述が多い気がするけれど,きちんと考えて構成しているんだろうなぁ.
演習問題は易しめ.(一章だからか?)Furthur readingはもっと充実させてもよい気がする.
英語は非常に簡単なのですいすい読める.とはいっても一章読むのに1.5hかかった...英語がんばろう.
僕はすでに情報検索アルゴリズムを通して読んでいることもあって,この章に限っていえば,目新しい話題はなかった.
この先を読んでみないとわからないけれど,初心者でも読めるレベルに設定されていると思うし,英語もわかりやすいのでB4でも輪読できるんじゃないかなぁ
読み終わってから,naoya氏の復習資料を拝見.とてもわかりやすい.
というか,これを読めば10分で理解できるorz
読みやすい&章が多くて一章あたりの分量が少ないので,ちょくちょく読んでいきたいと思います.
今さら感はあるけれど,Introduction to Modern Information Retrievalも読んでみたい.
5月病が終わってリバウンド気味な6月の夜.
- 作者: 北研二,津田和彦,獅々堀正幹
- 出版社/メーカー: 共立出版
- 発売日: 2002/01/01
- メディア: 単行本
- 購入: 6人 クリック: 552回
- この商品を含むブログ (38件) を見る
Modern Information Retrieval (Acm Press Series)
- 作者: Ricardo Baeza-Yates,Berthier Ribeiro-Neto
- 出版社/メーカー: Addison Wesley
- 発売日: 1999/05/15
- メディア: ペーパーバック
- 購入: 2人 クリック: 11回
- この商品を含むブログ (13件) を見る