正規表現
今日使ったものをメモ。
Twitterの単語あたりの使用回数を抽出した所、以下のようになった。
洋装1
洒落1
洗浄2
洗濯5
津波3
活かし1
活かそ1
活力1
…
この最後の数字をもとにソートしたい。以下の置換を使った。
- [0-9]+$ → >\0
- ^ → <
- <.+> →
これで数字以外の<>で囲まれた部分を消去。結果を元のCSVデータの隣列にコピペする。あとはソート機能を使えばOK。
私の全ツイート1,882件中における結果のうち、主だった物だけ紹介。
- インド…122/1882
- 思う...64/1882
- 日本…55/1882
- W...30/1882
- 中国…27/1882
- 女子…22/1882
- 最高…15/1882
- 寒い…2/1882
旅行にいって以来ハマってる、インドがぶっちぎりで多いですねw。