2008-07-23 04 Index construction (2) (pp.68-72) IIR 昨日の続きを読んだ. 4.3 Distributed indexing どうやって分散するか termIDで分散するか,docIDで分散するか 多くの検索エンジンはdocIDで分散しているらしい 本書ではtermで分散するindexを紹介 本節はメインがMapReduceの説明で,特に目新しいものはなし.keyである程度のかたまり(segment)にまとめておくというのを知らなかった.MapReduce論文読み直さねば.logarithm mergingが理解できなかったので読むのをやめた.