04 Index construction (2) (pp.68-72)

昨日の続きを読んだ.

4.3 Distributed indexing

どうやって分散するか

  • termIDで分散するか,docIDで分散するか
    • 多くの検索エンジンはdocIDで分散しているらしい
    • 本書ではtermで分散するindexを紹介

本節はメインがMapReduceの説明で,特に目新しいものはなし.keyである程度のかたまり(segment)にまとめておくというのを知らなかった.MapReduce論文読み直さねば.

logarithm mergingが理解できなかったので読むのをやめた.