研究

テキスト処理にWekaを使う(その2:文書セットをARFFに変換する)

前回:テキスト処理にWekaを使う(その1:文書のトークン化とTFIDF重みづけ) 昨日やらなかったことがとても簡単なことに気がついたので,メモ. Weka3.5.xからTextDirectoryToArffがTextDirectoryLoaderに変更になったので,注意.今後はそちらになると思…

テキスト処理にWekaを使う(その1:文書のトークン化とTFIDF重みづけ)

テキスト分類課題などでは,文書をTF-IDF重み付けしたbag-of-wordsで表現することが多い.これをベースラインにするため,さくっとこの処理をしたい.卒論やM1のときは,この処理をわざわざ手で書いたのだが,バグが出たら大変だし,なにより面倒くさい. 論…

Gmailで論文管理(思いつき編)

論文管理の方法をずっと悩んでいた.最近は手元に保存しておかなくても,ネット上に残り続けることが多いのでそんなに気にせずともいいのだろうけれど,ルーチン化できたらいいな,ともんもんと考えていた. 誰もが思いつくんだろうけれど,Gmailで保存して…