情報検索ことはじめ(3): 情報検索 (IR) 分野の国際会議と論文誌

どの会議や雑誌に投稿すべきかの情報を共有するのは素晴らしい - 発声練習を読んで,そういやIR系のカンファレンスまとめを見たことがないなぁ,と思ったのでIR系の研究を取り扱っているまとめてみることにしました.とはいうものの,自分が通ったことないので,偉そうに語っている部分は全て又聞き情報と妄想によるです.


長らく書いていなかったので,「情報検索ことはじめ」シリーズにしてみました.今回が第3弾です.


何が情報検索 (IR; information retrieval) なの? と言われると明確な定義を説明することができません.愛するIIRから引用します.

Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collecions (usually stored on computers).

(意訳) 情報検索とは,計算機に格納された大規模な文書群から,ユーザの情報要求を満たすような文書を見つけること.

(IIR p.1)

  • [IIR] C.D.Manning, P.Raghavan and H.Schutze. Introduction to Information Retreival, Cambridge Press, 2008.


余計にわからないですね.平たくいえば検索システム (ウェブ検索に限りません) に関する分野だと思います.具体的な技術分野についてはSIGIR2010 CFPなどを参考にしてください.


IRは元々は図書館学から始まった分野ですが,データベース,自然言語処理機械学習などの分野で生まれた技術を広く取り入れながら発展してきた,様々な分野に横断的に存在する分野となっています.


下記に紹介する以外にも研究テーマによってはチェックしなければいけない会議はあります.最近流行りのlearning to rankはNIPS, ICML, KDDといった機械学習系,データマイニング系でも見かけるし,NLP系 (ACL, EMNLP, etc.) やデータベース系 (SIGMOD, VLDB, etc.) のカンファレンスでもto-read paperを見つけることがあります.


会議の種類を適当に分類して紹介しますが,全て「情報検索 (IR)」に関する会議としての紹介です.いかんせん若輩が蓄えたばかりの薄っぺらい知識なので,「この紹介の仕方おかしくない?」「なんでこれがないの?」といったご意見等ありましたらコメントお願いします.


(2010-02-14追記)
id:tmasaoさんから情報検索関連の論文誌まとめリンク集を教えて頂きました!ありがとうございます! 下記リストには含まれていないものがありますので,こちらもご覧ください.

情報検索系
  • SIGIR: Annual ACM Conference on Research and Development in Information Retrieval
  • ECIR: European Conference on IR Resarch
  • AIRS: Asia Information Retrieval Symposium

IRの冠名がつく,いわゆるIR会議.SIGIR>ECIR>AIRS.SIGIRはいわずもがな.スケジュールの関係上,ECIRに出されたネタが,改善されて続くSIGIRに出現という研究をたまに見る.AIRSはアジア版,採択率がけっこう低い.

図書館系
  • JCDL: International Conference on Digital Libraries
  • ECDL: European Conference on Digital Libraries
  • ICADL: International Conference on Asian Digital Libraries

情報検索は元々図書館学から始まったこともあり,図書館系の会議にも含まれる.JCDL>ECDL>ICADL

Web系
  • WWW: International World Wide Web Conference
  • WSDM: Web Search and Web Data Mining
  • CIKM: Conference on Information and Knowledge Management

ウェブ系は守備範囲が広く,いわゆるIRネタも含まれます.微妙な差こそあれ,WWW=WSDM=CIKMという印象.
WWWは面白さが重要,という話はよく聞くけれど,僕が読む論文はなんでこれがWWWなの? というようなカタいpaperもあるので,けして面白さだけではないと思います.(かなり偏った情報) CIKMはG2会議という印象があったけれど,実は投稿数がSIGIRの1.5倍程度で採択率が同じかそれ以下という難関会議.WSDMは2,3年前にカンファレンスが肥大化するのを嘆いた人たちを中心に創られた超selectedな会議.採択率はSIGIRと同程度だけれど,とにかく採録数がしぼられるイメージ.

文字列系
  • SPIRE: String Processing and Information Retrieval Symposium

文字列系.アルゴリズム寄りの印象.採択率だけを見ると,そんなにレベルが高くないように見えるけれど,採択率の割にレベルが高いpaperが出てくるイメージがある.IRの観点からすると,インデクスやクエリ処理,文字列探索あたりが守備範囲.僕はSIGIRでは見かけたことのないCSAなどの圧縮全文索引ネタもSPIREでよく見かける.

IRコンテスト系
  • TREC: Text REtrieval Conference
  • NTCIR: NII-Test Collection for IR

コンテスト中心.毎年いろいろなトラック,ワークショップが開催される.さまざまな検索用テストコレクションが提供されている.


まとめ: IR系のトップカンファレンス

結局トップカンファレンスどれよ? ということで,僕が思うG1級トップカンファレンスはSIGIR, WWW, WSDM, CIKMの4つだと思います.

(2010-02-14追記)
CIKMは日程の関係で,SIGIRやWWWに落ちたpaperが投稿されることがあるため,必ずしもSIGIR級のトップカンファレンスというわけではないかもしれません.
ここらへんは採択率だけでは判断できないようです.


International Journal

会議を紹介したついでに,IRに関する研究が掲載される論文誌もリストアップしてみる.参考文献で良く見かける論文誌の順番に並べてみる.

  • ACM Transaction of Information Systems (TOIS)
    • IR系のpaperを出すとしたら,たぶん最高峰の論文誌
  • Information Processing & Management
    • レベルはわからないけれど,TOISよりは低い印象.こちらも良い論文をよく見かける
  • Journal of the American Society for Information Science and Technology (JASIST)
    • 引用文献としてはたまにしか見かけないけれど,眺めると魅力的なpaperが多い.
  • Journal of Information Systems
    • レベルはわからない
  • SIGIR Forum
    • 論文誌というより学会誌.paperもあるけれど,学会レポートが多い.流行を掴むのに良い.
  • Foundations and Trends in Information Retrieval
    • 最近できた雑誌? カンファレンスのチュートリアル資料などをまとめているので,内容としては充実している.一冊ずつAmazonなどで購入できる.高いけど.

おまけ: Introduction to Information Retrievalの引用回数

愛するIIRは,参考文献のbibファイルを公開しているので,数えてみた.こうやって眺めるとけっこう面白い.

  • bibファイルはこちらから見れます
Conference

SIGIRダントツ一位.機械学習NLP系,データベース系もけっこうある感じ.

    100 Proc. SIGIR
     20 Proc. WWW
     20 Proc. CIKM
     13 Proc. ICML
     11 Proc. KDD
     10 Proc. INEX
      8 Proc. TREC
      8 Proc. NIPS
      6 Proc. ECIR
      6 Proc. ACL
      5 Proc. SPIRE
      5 Proc. SDAIR
      4 Proc. UAI
      3 Proc. VLDB
      3 Proc. Empirical Methods in Natural Language Processing
      2 SIGHAN Workshop on Chinese Language Processing
      2 Proc. SIGMOD
      2 Proc. SIGCHI
      2 Proc. PODS
      2 Proc. PKDD
      2 Proc. International Conference on Data Engineering
      2 Proc. ECML
      2 Proc. ACM Symposium on Applied Computing
      2 Language Modeling for Information Retrieval
      2 Advances in Large Margin Classifiers
      1 {XML
      1 {TREC
      1 {NTCIR
      1 Workshop on Intelligent Scalable Text Summarization
      1 Workshop Information Extraction Meets Corpus Linguistics
      1 Towards information retrieval
      1 The {SMART
      1 The Handbook of Brain Theory and Neural Networks
      1 SIGIR 2006 Workshop on {XML
      1 Proc. {AAAI
      1 Proc. Symposium on Operating System Design and Implementation
      1 Proc. Symposium on Foundations of Computer Science
      1 Proc. SIAM International Conference on Data Mining
      1 Proc. North American Chapter of the Association for Computational Linguistics
      1 Proc. New Trends in Intelligent Information Processing and Web Mining Conference
      1 Proc. National Conference on Artificial Intelligence and Proc. Conference Innovative Applications of Artificial Intelligence
      1 Proc. National Conference on Artificial Intelligence
      1 Proc. JADT
      1 Proc. International Conference on User Modelling
      1 Proc. International Conference on Language Resources and Evaluation
      1 Proc. International Conference on Knowledge Management
      1 Proc. International Conference on Inductive Logic Programming
      1 Proc. International Conference on Cooperative Information Systems
      1 Proc. INEX 2002
      1 Proc. IJCAI
      1 Proc. IEEE International Conference on Image Processing, Special Session on Multimedia Indexing, Browsing and Retrieval
      1 Proc. Human Language Technology Conference / North American Chapter of the Association for Computational Linguistics
      1 Proc. Human Language Technology Conference
      1 Proc. Fall Joint Computer Conference
      1 Proc. FAST
      1 Proc. European Symposium on Artificial Neural Networks
      1 Proc. European Conference on Research and Advanced Technology for Digital Libraries
      1 Proc. ECDL
      1 Proc. ECAI
      1 Proc. Data Compression Conference
      1 Proc. Cross-Language Information Retrieval
      1 Proc. Cross-Language Evaluation Forum
      1 Proc. Conference on Innovative Applications of Artificial Intelligence
      1 Proc. Conference on Data Compression
      1 Proc. Conference on Applied Natural Language Processing
      1 Proc. COLING
      1 Proc. Berkeley Symposium on Mathematics, Statistics and Probability
      1 Proc. Australian World Wide Web Conference
      1 Proc. Australasian Conference on Computer Science
      1 Proc. Artificial Intelligence and Applications
      1 Proc. ACM Symposium on Theory of Computing
      1 Proc. ACM Symposium on Computational Geometry
      1 Proc. ACM SIGCOMM on Internet Measurement
      1 Proc. ACM Conference on Digital Libraries
      1 Nonlinear Estimation and Classification
      1 Nearest Neighbor Methods in Learning and Vision: {T
      1 Multiple Classifier Systems
      1 Languages at Crossroads: {P
      1 KDD Workshop on Text Mining
      1 KDD '02: Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining
      1 International Workshop on Web Information and Data Management
      1 International Workshop on Research Issues in Digital Libraries
      1 International Workshop on Information Retrieval With {A
      1 International Workshop on Artificial Intelligence and Statistics
      1 ICDM 2003 Workshop on Clustering Large Data Sets
      1 Handbook of Massive Data Sets
      1 Handbook of Discrete and Computational Geometry
      1 Grouping Multidimensional Data: {R
      1 Encyclopedia of Language and Linguistics
      1 Combinatorial Algorithms on Words, NATO ASI Series Vol F12
      1 Advances in information retrieval
      1 Advances in Knowledge Discovery and Data Mining
      1 Advances in Kernel Methods - Support Vector Learning
      1 AAAI/ICML Workshop on Learning for Text Categorization
Journal

こちらも機械学習 (JMLR) やNLP (Computational Linguistics) をけっこう引用している.

     16 TOIS
     15 JASIS
     15 IP\&M
     11 IR
      9 JMLR
      8 CACM
      7 Computational Linguistics
      5 SIGIR Forum
      5 Journal of the American Statistical Association
      5 ACM Computing Surveys
      4 Machine Learning
      4 JASIST
      4 JACM
      4 Computer Journal
      3 VLDB Journal
      3 Internet Mathematics
      3 Information Systems
      3 IEEE Transactions on Information Theory
      3 Data Mining and Knowledge Discovery
      3 Computer Networks
      2 Science
      2 SIGMOD Record
      2 Journal of the Royal Statistical Society Series~B
      2 Journal of Documentation
      2 Journal of Classification
      2 International Journal on Digital Libraries
      2 IEEE Transactions on Knowledge and Data Engineering
      2 IBM Journal of Research and Development
      2 American Documentation
      1 {IEEE
      1 Webology
      1 Web Techniques Magazine
      1 Translation and Computational Linguistics
      1 The Atlantic Monthly
      1 Statistical Science
      1 Soviet Physics Doklady
      1 Soviet Mathematics Doklady
      1 Software Practice and Experience
      1 SIAM Review
      1 Psychometrika
      1 Program
      1 Problems of Information Transmission
      1 Neural Computation
      1 Nature
      1 Knowledge Engineering Review
      1 Journal of Information Science
      1 Journal of Ecology
      1 Journal of Computer-Mediated Communication
      1 Journal of Artificial Intelligence Research
      1 Internet Research: {E
      1 International Statistical Review
      1 International Journal Man-Machine Studies
      1 Intelligent Data Analysis
      1 Information Storage and Retrieval
      1 IEEE Transactions on Parallel and Distributed Systems
      1 IEEE Transactions in Signal Processing
      1 IEEE Trans. Pattern Anal. Mach. Intell.
      1 IEEE Micro
      1 IEEE Intelligent Systems
      1 IBM Systems Journal
      1 Human Communication Research
      1 Electronic Networking: {R
      1 D-Lib Magazine
      1 Computing Systems
      1 Computers and the Humanities
      1 Computer Networks and ISDN Systems
      1 Automation and Remote Control
      1 Applied Stochastic Models in Business and Industry
      1 Applied Statistics
      1 Annals of Statistics
      1 ACM Transactions on Database Systems
      1 ACM Trans. Database Syst.
      1 ACM SIGKDD Explorations