正規表現で気をつけること

RubyistじゃないのにRuby教えててつまづいた.偉そうに講釈たれてたのでとても凹んだ.日本語の正規表現を使う際には文字コードを指定しないといけないっぽい

/(\w+)\s+(\d+)/ =~ line      # これだとうまくいかないことが多い
/(\w+)\s+(\d+)/u =~ line     # UTF-8
/(\w+)\s+(\d+)/s =~ line     # Shift-JIS
/(\w+)\s+(\d+)/e =~ line     # EUC

Perlとは違った文字コードの苦労ですな.以後気をつけよう.