ひつじ書房 サーチエンジン・テキストエディタ・表計算ソフトで学ぶ 言語研究のためのテキストデータ処理入門 大名力著 ひつじ書房 サーチエンジン・テキストエディタ・表計算ソフトで学ぶ 言語研究のためのテキストデータ処理入門 大名力著
2025年5月刊行予定

サーチエンジン・テキストエディタ・表計算ソフトで学ぶ

言語研究のためのテキストデータ処理入門

大名力著

定価2,200円+税 A5判並製カバー装 160頁

ISBN978-4-8234-1248-6

装丁 稲田のぞみ

ひつじ書房

Introduction to Text Data Processing for Language Studies: Using Search Engines, Text Editors and Spreadsheets
Ohna Tsutomu



【内容】
利用可能なデータは多くとも適当な処理手段なしには有効活用することはできない。本書では、言語研究のための専用ツールではなく、サーチエンジン、正規表現、テキストエディタ、表計算ソフトを用いてテキストデータを検索・加工する方法について学ぶ。処理の過程を確認しながら入力・処理・出力をセットで捉えるデータ処理の感覚を身に付けるとともに、研究以外でも使える知識・技術を習得することを目指す。演習問題付き。

【演習で用いるファイルについて】
本書演習で用いるデータはこちらをご覧ください。

★関連書籍『言語研究のための正規表現によるコーパス検索』の正規表現練習用ページ (本書第3章で使用)はこちら

【目次】
はじめに
演習で用いるファイルについて

第1章 言語研究とテキストデータ処理
1 本書のねらい
2 本書の構成

第2章 サーチエンジンによる英語表現の検索
1 サーチエンジンと用例検索
2 環境やツールなどによる違い
3 Googleによる用例検索
3.1 Googleのウェブ検索のクエリで使用できる構文
3.2 Googleのクエリを利用した用例検索
3.3 活用形を調べる:コンピューターのマウス mouseの複数形
3.4 名詞の数:0は単数か複数か
3.5 前置詞,形容詞,動詞,副詞の検索
3.5.1 前置詞の検索(1)
3.5.2 前置詞の検索(2):前置詞や動詞を加えて制限する
3.5.3 動詞の検索
3.5.4 形容詞の検索(1):限定用法
3.5.5 形容詞の検索(2):叙述用法
3.5.6 副詞の検索
4 サーチエンジン利用の際の注意点

第3章 正規表現によるテキストの検索
1 正規表現について
1.1 正規表現とは
1.2 正規表現を学ぶ意義
1.3 正規表現が使えるツールの例と正規表現の種類
2 練習用ページ,表記,バックスラッシュについて
3 正規表現の文法
3.1 リテラル,語の境界
3.2 論理和と範囲指定
3.3 任意の文字と文字クラス
3.4 量指定子(繰り返し)
3.5 量指定子の有効範囲
3.6 「任意の語」
3.7 「任意の語」の語数の指定
3.8 メタキャラクタのエスケープ
3.9 検索の単位と制御文字,位置
3.10 正規表現によるパターンの指定の例
4 正規表現による検索で注意すべきこと

第4章 テキストデータ処理のための基礎知識
1 はじめに
2 ファイル,ディレクトリ,ワイルドカード
2.1 ファイルの形式
2.1.1 ビットとバイト
2.1.2 テキストファイルとバイナリファイル
2.1.3 ファイルの形式と拡張子
2.2 ワイルドカード
2.3 ディレクトリ,フォルダ
2.4 圧縮・展開,アーカイブ
3 キー操作,マウス操作,ショートカットなど
3.1 モディファイアキー,ショートカット
3.2 タブ
3.3 マウス操作
3.4 ウィンドウの分割など
4 データと処理ツールの分離,ファイルの共有
4.1 アプリケーションを指定してファイルを開く
4.2 ファイル名
4.3 改行コード
4.4 論理行と表示行
5 文字コードについて
5.1 ビット列の表記法
5.1.1 ビット数と区別可能な状態の数
5.1.2 2進数と16進数
5.2 文字コード
5.2.1 符号化文字集合と文字符号化方式
5.2.2 バックスラッシュ(\)と円記号(¥)
5.2.3 半角文字と全角文字
5.2.4 漢字
5.3 ツールの文字コードと対象テキストの文字コード

第5章 テキストエディタによる検索と加工
1 テキストエディタの種類と機能
2 エディタによる検索・抽出
3 エディタによるテキストの加工
4 後方参照と文字列のマーキング
5 まとめ

第6章 表計算ソフトによるテキストデータ処理
1 はじめに
2 表計算ソフトによるテキストデータ処理
2.1 テキストファイルのデータの読み込みと保存
2.2 セルの書式(データの形式)
2.3 セルの選択,コピー,移動,削除,挿入,オートフィル
2.4 行の高さ,列の幅の変更,表示・非表示
2.5 オートフィルター:条件に合ったデータの取り出し
2.6 並べ替え
2.7 式,セルの参照,関数
2.8 関数の組み合わせ
2.9 ユーザー定義関数
2.10 単語の頻度表の作成
2.11 n-gramの頻度表の作成

付録 Wordのワイルドカードによる処理
演習問題解説
参照文献




【著者紹介】
大名力(おおな つとむ)
名古屋大学大学院人文学研究科教授。1989年、東京学芸大学修士課程修了(教育学修士)。群馬大学教養部、社会情報学部講師、名古屋大学国際開発研究科助教授、准教授、教授を経て、現職。専門は言語学・英語学。著書に『言語研究のための正規表現によるコーパス検索』(ひつじ書房、2012年)、『英語の文字・綴り・発音のしくみ』(研究社、2014年)、『英語の綴りのルール』(研究社、2021年)、『英語の記号・書式・数量表現のしくみ』(研究社、2023年)、『英語の発音と綴り』(中央公論新社、2023年)、などがある。


ご注文は、最寄りの書店さんでお願いします。
お店に在庫が無くても、お取り寄せができます。 書店が最寄りにない場合は、オンライン書店でご注文ください。

 

 



お急ぎの場合は、小社あてにご注文いただくこともできます。
郵便番号、ご住所、お名前、お電話番号をメールか、FAXでお知らせください。
新刊案内へ
ひつじ書房ホームページトップへ