見出し画像

正規表現、少し学んでみました

こんにちは、アイシーティーリンクの塩崎です。今回は正規表現についてお話ししたいと思います。

■正規表現って何?
「文字列を特定のパターンに落とし込んで表現します」という認識で覚えました。例えば全ての半角数字0~9の文字列を表現したい場合は[\d]を途中にタブスペースがある場合は[\t]でタブスペースを表します。ソフトによって使用可能な表現に多少の差異はありますが、以下のような文字列があった場合に正規表現ではパターンで表せます。
例:12345 (タブスペース) abcde
\d{5}\t\w{5}
{}は桁数を表します。よって\d{5}は5桁までの全ての数字の組み合わせを表し
\w{5}は5桁までの全ての英数字の組み合わせを表します。(英数字の組み合わせを限定できる場合は絞った方が処理は軽くなります)

■/sって何?
スペースと一言に言っても様々なスペースがあります。半角スペースや全角スペース、改行や改ページ、先ほどあげたタブスペースもあります。基本的にこれらの「全ての空白文字」を表現できるのが[\s]です。(全角スペースだけは非対応の場合が多いです)
そのためAという文字列の後に空白文字がありBという文字列がある時は以下のように表せます。
A(\s| )B
()内で全ての空白文字を表現しています。|パイプがOR条件を表すため読み替えると(全角スペース以外の全ての空白文字 or 全角スペース)を表しています。

正規表現は様々なパターンがあるため、勉強が必要なように見えますが実用業務で使うものはそんなには多くないように感じます。(Excelの関数と一緒な感覚です)覚えておくと業務が楽になると思いますのでおすすめです。
今回はここまでとなります。最後までお付き合いいただきありがとうございました。

いいなと思ったら応援しよう!