正規表現

正規表現とは、「改行やスペースを取る」「大文字を小文字に変換する」などの「検索して取る/置き換える」などの表現手法をいいます。これらは通常の文字および特殊な意味を持つメタ文字で構成されています。全てを覚えるのは容易ではないので、「使用方法」のみ覚えて下さい。

それでは正規表現をもっと簡単に言うと・・・・・「ある特定の文字列に当てはまるパターン検索!」となります。それでは例をご覧下さい。

※正規表現=正しい出力・保存をする為の事前変数処理

下記表は覚えないで結構です。必要な時に閲覧して下さい。
■パターンマッチ演算子
i 大文字・小文字を区別しない。
m 文字列を複数行として扱う(^、$は各行の行頭、行末にマッチする)。
s 文字列を単一行として扱う(^、$は\nを無視する)。
x 拡張正規表現を使う(空白文字を無視し、#以降をコメントとする)。
■基本的なメタ文字
. 任意の1文字(改行文字を除く)。
* 直前のパターンの0回以上の繰り返し。
+ 直前のパターンの1回以上の繰り返し。
? 直前のパターンが0回または1回現れる。
^ 文字列(m修飾子指定の時は行)の先頭。
$ 文字列(m修飾子指定の時は行)の末尾。
右隣のメタ文字をクォートするエスケープ文字。
| パターンの論理和(選択)。
( ) パターンのグループ化。
[ ] 文字クラス。
{ } 量指定子。
■特殊な文字や文字クラスにマッチするメタ文字
\a アラーム。
\cx 対応するコントロール文字(\cDはコントロール-D)。
\e エスケープ。
\f 改ページ。
\n 改行。
\r リターン。
\t タブ。
\xnn \x31など、その16進数を文字コードとする文字。
\nnn \061など、その8進数を文字コードとする文字。
\d 数字[0-9]と同義。
\D 数字以外。[^0-9]と同義。
\w 単語構成文字(通常英数字)。[_a-zA-Z0-9]と同義。
\W 単語構成文字以外。[^_a-zA-Z0-9]と同義。
\s 空白文字。[ \t\n\r\f ]と同義。
\S 空白文字以外。[^ \t\n\r\f ]と同義。
\l 直後の文字を小文字に変換。
\u 直後の文字を大文字に変換。
\L 次の\Eまでを小文字に変換。
\U 次の\Eまでを大文字に変換。
\Q 以降のメタ文字をクォート。次の\Eまで有効。
\E \ L / \ U の効果を終了。
\b 単語の境界(単語構成文字\Wと非単語構成文字\Wの間)。
\B 単語の境界以外。
\A 文字列の先頭。
\Z 文字列の末尾。または、末尾に改行文字がある時はその直後。
\z 文字列の末尾。
\G 直前のm//gが終わった位置(g修飾子がある時のみ機能)。