読者です 読者をやめる 読者になる 読者になる

Ubuntu12.04LTSでRを使う(2)

WindowsMeCabをインストール。

しかし、既存のtxtファイルを読み込む方法わからず。

コマンドラインで新規txtファイルを作成後、コンパイル

C:\Users > notepad sample.txt

C:\Users > mecab sample.txt

次に形態素分解してキーワード抽出してカウント。

ネットで適当なJAVAのプログラムを拾う。

以下のブログを参照させて頂きました。

JavaからMeCab(Windows)を手軽に利用する方法

 

単語あたりの使用回数を数えるプログラムは知恵袋を参考にしました。

Java Mapを使い、txtファイルから単語の抽出 その頻度の数をカウントしたいのです... - Yahoo!知恵袋

 

とりあえず以上です。

JAVAは忘れてる部分が多く、焦る。可能なら毎日さわりたい。