検索エンジンはなぜ見つけるのか
- 作者: 森大二郎
- 出版社/メーカー: 日経BP社
- 発売日: 2011/03/10
- メディア: 単行本(ソフトカバー)
- 購入: 8人 クリック: 1,195回
- この商品を含むブログ (27件) を見る
(2011-03-14読了)
国内の検索エンジン業界で知らない人はいない森大二郎氏の著書.残念なことにお会いしたことはないのだけれど,森氏による検索エンジン本は必読だろうということでさっそく読んでみた.
「なぜ〜」シリーズの一冊ということもあり,あくまで初心者でも読める「10年後も通用する基本」を提供するための本であるという立場を意識して書かれている.
たくさんの図を交え,今までの検索解説本ではなかった方法で解説してあり,「そうか,こんな説明の方法があったのか」と感動した.トライやダブルアレイをツメカケで説明したりBWTを木のフダとゴム紐で説明したり,全く事前知識がない人間でも読んで理屈を理解することのできる内容になっている.
裏を返せば,具体的な技術の解説までには踏み込んでいない.それらについて詳しく知りたい人は脚注にあるリファレンスをたどるか,本ブログで紹介した情報検索の教科書 (その1, その2) を読むことをお薦めする.
個人的には検索エンジンの話なので,転置インデクスの話題やランキングまわりについてもう少し最新の話題を書いてもよかったのではないかと感じたが,「10年後も通用する基本」に焦点を絞るという著者の狙いから外れてしまうということもあるし,本書で書かれているようにシステム要件によっては必ずしも転置インデクスや現在一般的に取られている手法が最適な選択肢とは限らない場合もある.
いろいろけっこう示唆に富む一文をサラっと書いてあり,検索エンジンについて一通り知識を持っている人間にも参考になる点が多い.技術の本質を捉えた著者ならではの一冊だと思う.
願わくば,第二弾として,著者にもっと詳細な検索エンジン実装や運用のノウハウを著書にまとめて世に出してもらいたいなぁと思った.企業秘密かもしれないけれど.
メモ
- REP (Robot Exclusion Protocol)
- Ro言語
- メルヴィル・デューイの言葉 p.80