TinySegmenterによるJavaScriptエンジンベンチマーク

ナイーブベイズアプリが僕にとっては一生の思い出に残るほどはてなブされたので,きちんと日本語も分割できるように改良しようと思った.工藤拓氏のJavaScriptだけで書かれた分かち書きソフトウェアTinySegmenterを使うことにした.


ところで巷ではGoogle Chromeが大流行のようで,きやつの持つV8エンジンというエンジンをちょいと試してみたくなった.

そんなわけで,JavaScriptエンジンのベンチマークにTinySegmenter使ってみたくなった.「TinySegmenter ベンチマーク」とかで検索してもやっている人いなさそうだから,ベンチマーク用の検証プログラム(html)を用意してみた.


長いテキストがいいなー,と思って思いついたのが日本国憲法.けれど,そんなに長くなかったので,夏目漱石こころと比較.

本文を埋め込んで,TinySegmenterで分割する時間を測定.時間測定の方法は「JavaScript ベンチマーク」で検索して出てきたコードを眺めて選択.(実はこれでよいのかわかっていません.)

Google Chromeベンチマークを取りたかったので,手元にある環境で実験.
Windows Vista (Core2 Duo U7700 1.33GHz) でIE7, FireFox, Google Chromeの比較.



いずれも5回の試行の平均(IE7によるこころ分割を除く).うーん.IEがいけてない,ということしかワカラン.ちなみに生データはこんな感じ



この結果からではFireFoxChromeどちらが速いか優位性は語れない.IE7がほげほげだということはわかる.FireFoxは処理時間の分散が大きいイメージ.


Mac持ってないのでSafariを試すことができません.ご興味があれば誰か検証してみてください.


ついカッとなってやった,でも反省はしていない
ナイーブベイズ日本語分割版は後日後悔予定.