『言語研究のための正規表現によるコーパス検索』

正規表現練習用ページへのアクセス

『言語研究のための正規表現によるコーパス検索』(大名力著，ひつじ書房) 3章及び4章のためのページです。次の「正規表現練習用ページに進む」をクリックすると，練習用ページに移動します。

練習用ページをダウンロードして使用する場合には，次のアーカイブファイルをご利用ください。

ファイルはZIP形式でアーカイブされています。ZIPファイルの展開方法については，サーチエンジンで「zip 解凍方法」「zip 展開方法」などと指定して検索すれば，方法を説明したページが見つかりますので，そちらでご確認ください。

本練習用ページ及びアーカイブファイルは『言語研究のための正規表現によるコーパス検索』の本文に沿って使用してください。ひつじ書房及び作者 (大名力) は動作や使用方法に関するサポートはいたしません。

現在わかっている不具合：Windows の Internet Explorer では，［正規表現を選択して挿入］メニューから正規表現を選択する際，最初の操作では正規表現入力欄に正規表現が挿入されません。ページが表示された後，まずは正規表現入力欄をクリックし「ここに正規表現を入力します」の文字列をクリアしてからご使用いただくよう，お願いいたします。なお，Firefox では上記不具合は生じません。

2012/09/07

電子書籍化にあたっての補足

■p. 164の次の機能が利用できるサイト，ページは現在ではサーバーが停止しているため利用できない。

　A. 共通の字母を持つハングルをリストする
　B. 指定の字母を含むハングルをリストする

同様の処理が行えるウェブページをこちらに置いたので，必要な方はご利用いただきたい。

https://www.hituzi.co.jp/560regex/kybd4ko.html

使い方：初声・中声・終声ごとに字母を選択 (「全選択」「全解除」ボタンですべてを選択・解除)，「該当文字を出力」で下部の欄に文字の一覧を出力。

■CJK統合漢字１字にマッチする文字クラス
本書では漢字１字 (CJK統合漢字) にマッチする文字クラスを 1 または 2 としているが，「龥」と「龻」の違いは Unicode のバージョンの違いに依る。

　1. [一-龥]
　2. [一-龻]
　3. [一-鿿]

Unicode 1.1 では「龥」(U+9FA5) までが定義されていたが，2005年リリースの Unicode 4.1 で「龦」(U+9FA6) 〜「龻」(U+9FBB) が追加された。

現在では「龻」より後の部分 (「龼」(U+9FBC) 〜「鿿」(U+9FFF)) もすべて定義されているので，この部分も含めるには 3 のように指定する。

2026/03/16