2014-02-01から1ヶ月間の記事一覧

大田区探訪

本日の記録。 1.川瀬巴水展いってきました。 大田区ホームページ:大田区立郷土博物館特別展「川瀬巴水―生誕130年記念―」のご案内 水面に映る月や富士、強いコントラスト、鮮やかなピンクと橙色が素敵。 日本庭園に池がセットなのは水面に景色が映えるから…

Twitterマイニング計画

やりたいこと TwitterのタイムラインをMongoDBに保存。 Rを使ったテキストマイニング。MeCabでKmeans まずはツイッターのAPI取得とターミナル上での表示。下記のブログを参照しました。 kk6のメモ帳* 次、MongoDBとの連携。以下のブログを参照しました。 twi…

はだしのゲン回顧録

「はだしのゲン」作者の中沢啓治さんの自伝を読みました。 「はだゲン」は政治的主張の濃い漫画なので賛否両論ありますが、文学として見れば、個人的にかなり好きな作品です。 本編では戦争・アメリカ・天皇許すまじと、徹底した責任糾弾が繰り広げられ、休…

正規表現

今日使ったものをメモ。 Twitterの単語あたりの使用回数を抽出した所、以下のようになった。 洋装1洒落1洗浄2洗濯5津波3活かし1活かそ1活力1 … この最後の数字をもとにソートしたい。以下の置換を使った。 [0-9]+$ → >\0 ^ → < <.+> → これで数字以外の<>で…

Ubuntu12.04LTSでRを使う(2)

WindowsにMeCabをインストール。 しかし、既存のtxtファイルを読み込む方法わからず。 コマンドラインで新規txtファイルを作成後、コンパイル。 C:\Users > notepad sample.txt C:\Users > mecab sample.txt 次に形態素分解してキーワード抽出してカウント。…

Ubuntu12.04LTSでRを使う

備忘録。 以下のサイトで紹介されているように、R+MeCabによるTwitterの解析にチャレンジ。 【解析いろは25】Rでソーシャルリスニングをやってみた 1 http://kaisekiiroha.blogspot.jp/2013/10/25r1.html やったこと。 Rのインストール MeCabのインストール…