正規表現

今日使ったものをメモ。

Twitterの単語あたりの使用回数を抽出した所、以下のようになった。

洋装1
洒落1
洗浄2
洗濯5
津波3
活かし1
活かそ1
活力1

この最後の数字をもとにソートしたい。以下の置換を使った。

  1. [0-9]+$ → >\0 
  2. ^ → <
  3. <.+> → 

これで数字以外の<>で囲まれた部分を消去。結果を元のCSVデータの隣列にコピペする。あとはソート機能を使えばOK。

 

私の全ツイート1,882件中における結果のうち、主だった物だけ紹介。

  • インド…122/1882
  • 思う...64/1882
  • 日本…55/1882
  • W...30/1882
  • 中国…27/1882
  • 女子…22/1882
  • 最高…15/1882
  • 寒い…2/1882

旅行にいって以来ハマってる、インドがぶっちぎりで多いですねw。