ぷろぐら×でざいん

正規表現1

正規表現1

仕事の関係上、頻繁にメールの文章内容を解析し、そのデータをデータベースに突っ込むことを良くする。
スクレイピングできれば楽だが、メールによってはHTML形式ではないので、そのようなケースでは正規表現を利用する。

下記リンクが作成した正規表現が期待している動作になっているかを確認するのに利用している。
非常に便利なので是非。

リンク

import re
regular_expression = u'(手数料:|合計金額:)\s*(\d+)'
p = re.compile(regular_expression, re.IGNORECASE | re.UNICODE | re.MULTILINE)
random_text = u'手数料: 5000円'
m = p.search(random_text)
m.group(2)

\d+ は数値だけ取得してくれるので表示便利です。
上記のアウトプット u'5000'

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です