MeCabを使って集合知プログラミングという書籍のサンプルコードの日本語対応をしてみた.書籍でも日本語対応について書かれてるけど,Yahoo!形態素解析が使われてるんでレスポンスが悪い.大量のデータを用いて分類機とかの性能を評価するには不向きなので,MeCabでやれば良い.残念ながら落ちてる車輪が見つからんかったから自分で実装した.
bitbucketで公開
hirokiky / pci_chap6 / source / mecabsplitter.py — Bitbucket
$ sudo apt-get install mecab python-mecab
apt-getがあればこれだけでいけると思う.
使い方はyahoosplitter.pyと同じ.mecabsplitter.pyって名前で作ったから
>>>#import yahoosplitter as splitter >>>import mecabsplitter as splitter
置き換えるだけで使えると思う.