2008-09-01から1ヶ月間の記事一覧

転置インデックスで学ぶ検索エンジンの中身アプリ

学生の頃から情報検索っぽい研究をやっていたくせに,転置インデックスてこんなものなんだ,ということを知るまで検索エンジンが正直怖かった.転置インデックスの概要を理解したら急に甘く見はじめるようになった(それはそれでいかんのだけど).位置情報…

ナイーブベイズによるテキスト分類アプリで日本語を扱えるようにしました

たくさんの方にブックマークして頂いて,感謝感激でした.感謝の意味をこめて少しだけ改良しました.といっても自分の力ではないですが... 昨日の日記でも紹介したTinySegmenterによって日本語の文も扱えるようにしました Naive Bayes Text Classifer ver…

TinySegmenterによるJavaScriptエンジンベンチマーク

ナイーブベイズアプリが僕にとっては一生の思い出に残るほどはてなブされたので,きちんと日本語も分割できるように改良しようと思った.工藤拓氏のJavaScriptだけで書かれた分かち書きソフトウェアTinySegmenterを使うことにした. TinySegmenter:JavaScrip…

ナイーブベイズによるテキスト分類体験アプリ

もともとは研究室の新入生にNaive Bayesのイメージをつけるためにつくったもの.Naive Bayesを世の中に広めるために,きちんと公開することにしました. Text classification by Naive Bayes (2008-09-11追記)好評だったので日本語を扱えるようにしました.…

同じvalueを持つハッシュを生成

my @array = qw(apple orange pine); のような配列が渡された際に, my %hash = ( apple => 1, orange => 1, pine => 1, ); のように同じ値を持つハッシュを生成したい.クックブックにも載ってなかったので頭の体操. ハッシュの初期化はリストで.というイ…