Regular Expression replacer (and its inverse) / 正規表現置換器 in Javascript

初期状態では置換しません。それぞれ「⬃ Code」ボタンを押して下さい。/ does not replace in the initial state. Please press each “⬃ Code” button.
隅の「正規表現チートシート」が全体的なヒント集になっています。/ The “Regular Expression Cheat Sheet” in the corner is the overall hint collection.

㈱ ⟺ (株) 等の相互変換 / ㈱ ⟺ (株) etc. Mutual exchange

理解の一助として、既定のコード例のフローチャートを記しておきます。

漢字（よみがな）⟺ ruby タグ相互変換 / Kanji (reading Kana) ⟺ ruby tag Mutual exchange

理解の一助として、既定のコード例のフローチャートを記しておきます。

rgb(𝑟₍₁₀₎, 𝑔₍₁₀₎, 𝑏₍₁₀₎) ⟺ #FFFFFF₍₁₆₎ 相互変換 / Mutual exchange

理解の一助として、最終案のコード例のフローチャートを記しておきます。

TSV (tab separated values) ⟺ HTML table tbody contents 相互変換 / Mutual exchange

理解の一助として、既定のコード例のフローチャートを記しておきます。

ハイフン-マイナス ⟺ ダッシュ他、相互変換 / hypen-minuses ⟺ dash symbols etc. Mutual exchange

「万物の根源は数なり。」/ "The root of all things is number." --- Pythagoras (ピタゴラス) BC582-BC496 「ギャンブルの最大の利益は、それを行わないことで得られる。」/ "The greatest profit in gambling is obtained by not doing it." --- Gerolamo Cardano (ジェロラモ・カルダーノ) 1501-1576 「宇宙は数学という言語で書かれている。」/ "The universe is written in the language of mathematics." --- Galileo Galilei (ガリレオ・ガリレイ) 1564-1642 「私はこの命題の真に驚くべき証明をもっているが、余白が狭すぎるのでここに記すことはできない。」/ "I have a truly remarkable proof of this proposition, but the space is too small for me to give it here." --- Pierre de Fermat (ピエール・ド・フェルマー) 1601-1665 「人間は考える葦である。」/ "Man is a thinking reed." --- Blaise Pascal (ブレーズ・パスカル) 1623-1662 「神は数によって万物を創造した。」/ "God created all things by numbers." --- Isaac Newton (アイザック・ニュートン) 1642-1727 「整数は神の作ったものだが、他は人間の作ったものである。」/ "The integers are the work of God, but the rest is the work of man." --- Leopold Kronecker (レオポルト・クロネッカー) 1823-1891 「我々は知らねばならない、我々は知るであろう。」/ "We must know, and we shall know." --- David Hilbert (ダフィット・ヒルベルト) 1862-1943 「数学は生命の燃焼である。」/ "Mathematics is the combustion of life." --- 岡潔 (おかきよし) 1901-1978 「これで、世界で２番目に計算が上手な奴が生まれた。」/ "Now we have the second best calculator in the world." --- John von Neumann (ジョン・フォン・ノイマン) 1903-1957

「万物の根源は数なり．」/ “The root of all things is number.” — Pythagoras (ピタゴラス) BC582–BC496 「ギャンブルの最大の利益は，それを行わないことで得られる．」/ "The greatest profit in gambling is obtained by not doing it." — Gerolamo Cardano (ジェロラモ・カルダーノ) 1501–1576 「宇宙は数学という言語で書かれている．」/ "The universe is written in the language of mathematics." — Galileo Galilei (ガリレオ・ガリレイ) 1564–1642 「私はこの命題の真に驚くべき証明をもっているが，余白が狭すぎるのでここに記すことはできない．」/ "I have a truly remarkable proof of this proposition, but the space is too small for me to give it here." — Pierre de Fermat (ピエール・ド・フェルマー) 1601–1665 「人間は考える葦である．」/ "Man is a thinking reed." — Blaise Pascal (ブレーズ・パスカル) 1623–1662 「神は数によって万物を創造した．」/ "God created all things by numbers." — Isaac Newton (アイザック・ニュートン) 1642–1727 「整数は神の作ったものだが，他は人間の作ったものである．」/ "The integers are the work of God, but the rest is the work of man." — Leopold Kronecker (レオポルト・クロネッカー) 1823–1891 「我々は知らねばならない，我々は知るであろう．」/ "We must know, and we shall know." — David Hilbert (ダフィット・ヒルベルト) 1862–1943 「数学は生命の燃焼である．」/ "Mathematics is the combustion of life." — 岡潔 (おかきよし) 1901–1978 「これで，世界で２番目に計算が上手な奴が生まれた．」/ "Now we have the second best calculator in the world." — John von Neumann (ジョン・フォン・ノイマン) 1903–1957

理解の一助として、「肯定先読み言明」と「肯定後読み言明」を採ったコード例のフローチャートを記しておきます。

全角数字 ⟺ 半角数字相互変換 / Full width ⟺ Half width Mutual exchange

北海道０６０－８５８８札幌市中央区北３条西６－１０１１－２３１－４１１１青森県０３０－８５７０青森市長島１－１－１０１７－７２２－１１１１岩手県０２０－８５７０盛岡市内丸１０－１０１９－６５１－３１１１宮城県９８０－８５７０仙台市青葉区本町３－８－１０２２－２１１－２１１１秋田県０１０－８５７０秋田市山王４－１－１０１８－８６０－１１１１山形県９９０－８５７０山形市松波２－８－１０２３－６３０－２２１１福島県９６０－８６７０福島市杉妻町２－１６０２４－５２１－１１１１茨城県３１０－８５５５水戸市笠原町９７８－６０２９－３０１－１１１１栃木県３２０－８５０１宇都宮市塙田１－１－２００２８－６２３－２３２３群馬県３７１－８５７０前橋市大手町１－１－１０２７－２２３－１１１１埼玉県３３０－９３０１さいたま市浦和区高砂３－１５－１０４８－８２４－２１１１千葉県２６０－８６６７千葉市中央区市場町１－１０４３－２２３－２１１０東京都１６３－８００１新宿区西新宿２－８－１０３－５３２１－１１１１神奈川県２３１－８５８８横浜市中区日本大通１０４５－２１０－１１１１新潟県９５０－８５７０新潟市中央区新光町４－１０２５－２８５－５５１１富山県９３０－８５０１富山市新総曲輪１－７０７６－４３１－４１１１石川県９２０－８５８０金沢市鞍月１－１０７６－２２５－１１１１福井県９１０－８５８０福井市大手３－１７－１０７７６－２１－１１１１山梨県４００－８５０１甲府市丸の内１－６－１０５５－２３７－１１１１長野県３８０－８５７０長野市大字南長野字幅下６９２－２０２６－２３２－０１１１岐阜県５００－８５７０岐阜市藪田南２－１－１０５８－２７２－１１１１静岡県４２０－８６０１静岡市葵区追手町９－６０５４－２２１－２４５５愛知県４６０－８５０１名古屋市中区三の丸３－１－２０５２－９６１－２１１１三重県５１４－８５７０津市広明町１３０５９－２２４－３０７０滋賀県５２０－８５７７大津市京町４－１－１０７７－５２８－３９９３京都府６０２－８５７０京都市上京区下立売通新町西入薮ノ内町０７５－４５１－８１１１大阪府５４０－８５７０大阪市中央区大手前２－１－２２０６－６９４１－０３５１兵庫県６５０－８５６７神戸市中央区下山手通５－１０－１０７８－３４１－７７１１奈良県６３０－８５０１奈良市登大路町３００７４２－２２－１１０１和歌山県６４０－８５８５和歌山市小松原通１－１０７３－４３２－４１１１鳥取県６８０－８５７０鳥取市東町１－２２００８５７－２６－７１１１島根県６９０－８５０１松江市殿町１０８５２－２２－５１１１岡山県７００－８５７０岡山市北区内山下２－４－６０８６－２２４－２１１１広島県７３０－８５１１広島市中区基町１０－５２０８２－２２８－２１１１山口県７５３－８５０１山口市滝町１－１０８３－９２２－３１１１徳島県７７０－８５７０徳島市万代町１－１０８８－６２１－２５００香川県７６０－８５７０高松市番町４－１－１００８７－８３１－１１１１愛媛県７９０－８５７０松山市一番町４－４－２０８９－９４１－２１１１高知県７８０－８５７０高知市丸ノ内１－２－２００８８－８２３－１１１１福岡県８１２－８５７７福岡市博多区東公園７－７０９２－６５１－１１１１佐賀県８４０－８５７０佐賀市城内１－１－５９０９５２－２４－２１１１長崎県８５０－８５７０長崎市尾上町３－１０９５－８２４－１１１１熊本県８６２－８５７０熊本市中央区水前寺６－１８－１０９６－３８３－１１１１大分県８７０－８５０１大分市大手町３－１－１０９７－５３６－１１１１宮崎県８８０－８５０１宮崎市橘通東２－１０－１０９８５－２６－７１１１鹿児島県８９０－８５７７鹿児島市鴨池新町１０－１０９９－２８６－２１１１沖縄県９００－８５７０那覇市泉崎１－２－２０９８－８６６－２３３３

北海道 060−8588 札幌市中央区北3条西6−1 011−231−4111 青森県 030−8570 青森市長島1−1−1 017−722−1111 岩手県 020−8570 盛岡市内丸10−1 019−651−3111 宮城県 980−8570 仙台市青葉区本町3−8−1 022−211−2111 秋田県 010−8570 秋田市山王4−1−1 018−860−1111 山形県 990−8570 山形市松波2−8−1 023−630−2211 福島県 960−8670 福島市杉妻町2−16 024−521−1111 茨城県 310−8555 水戸市笠原町978−6 029−301−1111 栃木県 320−8501 宇都宮市塙田1−1−20 028−623−2323 群馬県 371−8570 前橋市大手町1−1−1 027−223−1111 埼玉県 330−9301 さいたま市浦和区高砂3−15−1 048−824−2111 千葉県 260−8667 千葉市中央区市場町1−1 043−223−2110 東京都 163−8001 新宿区西新宿2−8−1 03−5321−1111 神奈川県 231−8588 横浜市中区日本大通1 045−210−1111 新潟県 950−8570 新潟市中央区新光町4−1 025−285−5511 富山県 930−8501 富山市新総曲輪1−7 076−431−4111 石川県 920−8580 金沢市鞍月1−1 076−225−1111 福井県 910−8580 福井市大手3−17−1 0776−21−1111 山梨県 400−8501 甲府市丸の内1−6−1 055−237−1111 長野県 380−8570 長野市大字南長野字幅下692−2 026−232−0111 岐阜県 500−8570 岐阜市藪田南2−1−1 058−272−1111 静岡県 420−8601 静岡市葵区追手町9−6 054−221−2455 愛知県 460−8501 名古屋市中区三の丸3−1−2 052−961−2111 三重県 514−8570 津市広明町13 059−224−3070 滋賀県 520−8577 大津市京町4−1−1 077−528−3993 京都府 602−8570 京都市上京区下立売通新町西入薮ノ内町 075−451−8111 大阪府 540−8570 大阪市中央区大手前2−1−22 06−6941−0351 兵庫県 650−8567 神戸市中央区下山手通5−10−1 078−341−7711 奈良県 630−8501 奈良市登大路町30 0742−22−1101 和歌山県 640−8585 和歌山市小松原通1−1 073−432−4111 鳥取県 680−8570 鳥取市東町1−220 0857−26−7111 島根県 690−8501 松江市殿町1 0852−22−5111 岡山県 700−8570 岡山市北区内山下2−4−6 086−224−2111 広島県 730−8511 広島市中区基町10−52 082−228−2111 山口県 753−8501 山口市滝町1−1 083−922−3111 徳島県 770−8570 徳島市万代町1−1 088−621−2500 香川県 760−8570 高松市番町4−1−10 087−831−1111 愛媛県 790−8570 松山市一番町4−4−2 089−941−2111 高知県 780−8570 高知市丸ノ内1−2−20 088−823−1111 福岡県 812−8577 福岡市博多区東公園7−7 092−651−1111 佐賀県 840−8570 佐賀市城内1−1−59 0952−24−2111 長崎県 850−8570 長崎市尾上町3−1 095−824−1111 熊本県 862−8570 熊本市中央区水前寺6−18−1 096−383−1111 大分県 870−8501 大分市大手町3−1−1 097−536−1111 宮崎県 880−8501 宮崎市橘通東2−10−1 0985−26−7111 鹿児島県 890−8577 鹿児島市鴨池新町10−1 099−286−2111 沖縄県 900−8570 那覇市泉崎1−2−2 098−866−2333

理解の一助として、最終案のコード例のフローチャートを記しておきます。特に言語 Javascript を使い倒しているので、それを学ぶよい機会となるかと思います。

TSV (tab separated values) ⟺ CSV (comma separated values) 相互変換 / Mutual exchange

理解の一助として、~~（改良版ではなく）既定の~~改良版のコード例のフローチャートを記しておきます。正規表現だと何やらさらっと済んでいる処理が、プローチャートにすると具体的には緻密に処理されていることがわかると思います。

♀ ⟺ ♂ 相互変換 / Mutual exchange

理解の一助として、コード例のうち「絵文字のみの交換」と「絵文字以外の交換」のフローチャートを記しておきます。特に後者は Unicode における処理の落とし穴として、「意図せず絵文字の性別が変わった」などという事故がありうるという筆者による問題提起でもあります。

一つ目のテキストエリアのテキストをその下のテキストフィールドの Javascript コード（入力文字列は v）で変換した文字列を、二つ目のテキストエリアに表示します。一方で、二つ目のテキストエリアのテキストをその下のテキストフィールドの Javascript コードで変換した文字列を、一つ目のテキストエリアに表示します。

The text in the first text area is converted by the Javascript code (input string is v) in the text field below it, and the string is displayed in the second text area. On the other hand, the string obtained by converting the text in the second text area with the Javascript code in the text field below it is displayed in the first text area.

一覧

㈱ ⟺ (株) 等の相互変換 / ㈱ ⟺ (株) etc. Mutual exchange
漢字（よみがな）⟺ ruby タグ相互変換 / Kanji (reading Kana) ⟺ ruby tag Mutual exchange
rgb(𝑟₍₁₀₎, 𝑔₍₁₀₎, 𝑏₍₁₀₎) ⟺ #FFFFFF₍₁₆₎ 相互変換 / Mutual exchange
TSV (tab separated values) ⟺ HTML table tbody contents 相互変換 / Mutual exchange
ハイフン-マイナス ⟺ ダッシュ他、相互変換 / hypen-minuses ⟺ dash symbols etc. Mutual exchange
全角数字 ⟺ 半角数字相互変換 / Full width ⟺ Half width Mutual exchange
TSV (tab separated values) ⟺ CSV (comma separated values) 相互変換 / Mutual exchange
♀ ⟺ ♂ 相互変換 / Mutual exchange

正規表現チートシート

文字列の検索や置換を効率よく確実に行うためには「正規表現」が便利です。以下、正規表現の任意のパターンを x, y で表します。

正規表現リテラルの例

/\u[0-9A-F]{4}/i … \u200b にマッチ、「i」はプロパティ・フラグ

正規表現オブジェクトの例

new RegExp("\\u[0-9A-Fa-f]{4}", "i")^† … 同上

主なプロパティ・フラグ flags

s: 改行 ∈ すべての文字集合フラグ、dotAll プロパティ …「\n」が「.」にマッチ
i: 大文字・小文字無視フラグ、ignoreCase プロパティ … Unicode の大文字か小文字を区別しない
u: Unicode 機能フラグ、unicode プロパティ … すべての Unicode の１文字が「.」にマッチ
g: グローバル・フラグ、global プロパティ … 正規表現のマッチから何回も検査（既定は一回）
y: スティッキー・フラグ、sticky プロパティ … 正規表現はバッファ先頭のみマッチ
m: 複数行フラグ、multiline プロパティ … 言明「^」の前と「$」の次に「\n」がマッチ

文字集合

.（ピリオド）: 任意の１文字（非 dotAll のとき、改行は含まない）
[-0-9A-Fa-f]: 16 進法の数、加えて、マイナス記号
[^-0-9A-Fa-f]: 上例以外の文字集合
[^-0-9A-Fa-f^]: 上例、加えて「^」以外の文字集合
\d, \D: アラビア数字, それら以外
\s, \S: 空白類, それら以外
\t, \n, \cA…\cZ: タブ, 改行コード, 制御コード
\x00…\xff: 基本ラテン文字とラテン1補助の文字
\u0000…\uffff: Unicode 基本多言語面 (BMP、第０面) の文字まで^†
\u{0000}…\u{10ffff}: Unicode 基本多言語面〜私用面 (PUP、第15,16面)まですべて^†

基本的な言明

^（ハット）: 文字列の先頭、または、行頭（multiline のとき）
$（ドル記号）: 文字列の末尾、または、行末（multiline のとき）

最左最大マッチの量指定子

x*: 0 以上の x の繰り返しの最左最大にマッチ
x+: 1 以上の x の繰り返しの最左最大にマッチ
x?: 1 以下の x の繰り返しの最左最大にマッチ
x{n}: n の x の繰り返しの最左最大にマッチ
x{n,}: n 以上の x の繰り返しの最左最大にマッチ
x{n,m}: n 以上 m 以下の x の繰り返しの最左最大にマッチ

最左最小マッチの量指定子

x*?: 0 以上の x の繰り返しの最左最小にマッチ
x+?: 1 以上の x の繰り返しの最左最小にマッチ
x{n,}?: n 以上の x の繰り返しの最左最小にマッチ（他の量指定子についても同様）

キャプチャグループと後方参照の例

x|y: x または y にマッチ
(x|y): 同上をキャプチャ
(?:x|y): 同上を非キャプチャ … 後方参照が不要でキャプチャ番号を浪費しない
(x|y)\1: １番目のキャプチャに続いてマッチ

すすんだ言明

x(?=y): 肯定先読み言明
x(?!y): 否定先読み言明
(?<=x)y: 肯定後読み言明^‡
(?<!x)y: 否定後読み言明^‡

正規表現リテラルのエスケープ文字

「^$.*+?/$)[]{} 」そのものはバックスラッシュ「\」でエスケープ
例: /\((株)$/ … 「(株)」にマッチし「株」をキャプチャ

文字列リテラルのエスケープ文字^†

さらに、文字列で正規表現を表すとき、「\」は「\」でエスケープ
例: new RegExp("\$(株)\$") … 同上

文字列の match 関数^†

string.match(/x/flags) はマッチの真偽を返す

文字列の replace 関数^†

string.replace(/x/flags, target) は正規表現と規則に基づいて置換文字列を返す

文字列の置換先 target の文字列形式

例：: "$1$2" … 1 番目と 2 番目のキャプチャグループへ置換
$n: n 番目のキャプチャ文字列を参照
$&: マッチ範囲の文字列を参照
$`: バッファ先頭からマッチ範囲先頭未満までの文字列を参照
$': マッチ範囲末尾の次からバッファ末尾までの文字列を参照
$$: 「$」そのものを表す

文字列の置換先 target の関数形式^†

例：: (m, p1, p2)=>p1 + p2 … 1 番目と 2 番目のキャプチャグループへ置換
: (m, p1, p2)=>`${p1}${p2}` … 同上
: function (m, p1, p2) { return `${p1}${p2}`; } … 同上

参考文献

the Mozilla Foundation, “正規表現,” mdn web docs, 2022.
Taiji Yamada, “基本正規表現,” 2014.
Taiji Yamada, “拡張正規表現,” 2014.
Taiji Yamada, “テキストプロセッサとしての Python,” 2014.
Taiji Yamada, “各種正規表現おける特徴,” 2014.

補遺：正規表現は、sed コマンド等の「基本正規表現」から Perl や POSIX 規格における「拡張正規表現」の歴史的な流れで追加された記法を眺めてみると、それらの需要が窺い知れて理解しやすいと思います。そして、モダンなプログラミング言語はおよそ「Perl の正規表現」をサポートしており、Javascript は機能過多や過負荷にならない程々のところの「Perl 互換正規表現のサブセット」といった趣きですので大変学習しやすいと思います。

^† Javascript の仕様で、他の実装 (Perl, PHP, etc.) では異なります。 ^‡ SeaMonkey では後読み言明は未対応なので、少し苦労する場合があります。

Regular Expression replacer (and its inverse) / 正規表現置換器 in Javascript

㈱ ⟺ (株) 等の相互変換 / ㈱ ⟺ (株) etc. Mutual exchange

漢字（よみがな）⟺ ruby タグ相互変換 / Kanji (reading Kana) ⟺ ruby tag Mutual exchange

rgb(𝑟₍₁₀₎, 𝑔₍₁₀₎, 𝑏₍₁₀₎) ⟺ `#FFFFFF`₍₁₆₎ 相互変換 / Mutual exchange

TSV (tab separated values) ⟺ HTML table tbody contents 相互変換 / Mutual exchange

ハイフン-マイナス ⟺ ダッシュ他、相互変換 / hypen-minuses ⟺ dash symbols etc. Mutual exchange

全角数字 ⟺ 半角数字相互変換 / Full width ⟺ Half width Mutual exchange

TSV (tab separated values) ⟺ CSV (comma separated values) 相互変換 / Mutual exchange

♀ ⟺ ♂ 相互変換 / Mutual exchange

template

Regular Expression replacer (and its inverse) / 正規表現置換器 in Javascript

㈱ ⟺ (株) 等の相互変換 / ㈱ ⟺ (株) etc. Mutual exchange

漢字（よみがな）⟺ ruby タグ相互変換 / Kanji (reading Kana) ⟺ ruby tag Mutual exchange

rgb(𝑟(10), 𝑔(10), 𝑏(10)) ⟺ #FFFFFF(16) 相互変換 / Mutual exchange

TSV (tab separated values) ⟺ HTML table tbody contents 相互変換 / Mutual exchange

ハイフン-マイナス ⟺ ダッシュ 他、相互変換 / hypen-minuses ⟺ dash symbols etc. Mutual exchange

全角数字 ⟺ 半角数字 相互変換 / Full width ⟺ Half width Mutual exchange

TSV (tab separated values) ⟺ CSV (comma separated values) 相互変換 / Mutual exchange

♀ ⟺ ♂ 相互変換 / Mutual exchange

template

rgb(𝑟₍₁₀₎, 𝑔₍₁₀₎, 𝑏₍₁₀₎) ⟺ `#FFFFFF`₍₁₆₎ 相互変換 / Mutual exchange

ハイフン-マイナス ⟺ ダッシュ他、相互変換 / hypen-minuses ⟺ dash symbols etc. Mutual exchange

全角数字 ⟺ 半角数字相互変換 / Full width ⟺ Half width Mutual exchange