Rで学ぶ日本語テキストマイニング 石田基広・小林雄一郎 著  ひつじ書房 Rで学ぶ日本語テキストマイニング 石田基広・小林雄一郎 著  ひつじ書房
2013年10月

Rで学ぶ日本語テキストマイニング

石田基広・小林雄一郎 著

A5判並製 定価2,600円+税

ISBN978-4-89476-654-9

ひつじ書房


『Rで学ぶ日本語テキストマイニング』の誤植について

本文中の以下の箇所に関しまして、誤りがありました。ここに訂正し、深くお詫び申し上げます。
p.113, 118, 135, 139

お手数でございますが、正誤表をダウンロードしてお使い下さいますようお願い申し上げます。ご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。
【『Rで学ぶ日本語テキストマイニング』正誤表】


さまざまな研究領域や実務分野で、テキストマイニングという技術の導入が進んでいる。テキストマイニングとは、特に大規模なテキストデータを対象に、情報科学やデータ科学の技術にもとづいて分析を行い、新しい知見を導こうとする試みの総称である。本書は、テキストマイニングを語学・文学研究に応用するための入門書である。前半では、言語データ分析とRの操作方法について詳細に解説し、後半では、テキストマイニングをさまざまな課題に適用した事例を紹介する。


目次
第1章 テキストマイニングとは何か
1. はじめに
2. 計量言語学
3. コーパス
4. 形態素解析
5. 構文解析
6. 意味解析
7. 日本語・日本文学研究におけるテキストマイニング

第2章 R と基本統計量
1. はじめに
2. インストール
3. R の基本操作
4. プログラミング言語としてのR
5. 基本統計量

第3章 R によるテキストマイニング
1. はじめに
2. 形態素解析済みのテキストの読み込み
3. RMeCab パッケージ

第4章 日本語作文のテキストマイニング
大学生が書いた作文を例に
1. はじめに
2. 分析データ
3. 独立性の検定
4. 相関分析
5. まとめ

第5章 政治的談話のテキストマイニング
所信表明演説を例に
1. はじめに
2. 分析データ
3. 分割表の用意
4. 対応分析によるクラスタリング
5. クラスター分析によるクラスタリング
6. まとめ

第6章 対照言語データのテキストマイニング
ヨーロッパ10 言語の数詞を例に
1. はじめに
2. 分析データ
3. 多次元尺度法によるクラスタリング
4. 系統樹によるクラスタリング
5. まとめ

第7章 対話形式データのテキストマイニング
『機動戦士ガンダム』の台本を例に
1. はじめに
2. 分析データ
3.  変数
4. ネットワーク分析による人間関係の可視化
5. まとめ
第8章 文学作品のテキストマイニング
芥川龍之介と太宰治を例に
1. はじめに
2. 分析データ
3. 説明変数
4. クラスター分析による著者推定
5. 線形判別分析による著者推定
6. サポートベクターマシンによる著者推定
7. まとめ

第9章 ジャンル別データのテキストマイニング
書き言葉均衡コーパスを例に
1. はじめに
2. 分析データ
3. 説明変数
4. ナイーブベイズによるジャンル判定
5. k 近傍法によるジャンル判定
6. バギングによるジャンル判定
7. まとめ

第10章 方言データのテキストマイニング
 「茸」のアクセントパターンを例に
1. はじめに
2. 分析データ
3. 説明変数
4. 決定木によるアクセントパターンの推定
5. ランダムフォレストによるアクセントパターンの推定
6. まとめ

参考文献
索引



著者
石田基広
小林雄一郎



ご注文は、最寄りの書店さんでお願いします。
お店に在庫が無くても、お取り寄せができます。 書店が最寄りにない場合は、オンライン書店でご注文ください。

 

 



お急ぎの場合は、小社あてにご注文いただくこともできます。
郵便番号、ご住所、お名前、お電話番号をメールか、FAXでお知らせください。
送料420円でお送りします。
新刊案内へ
ひつじ書房ホームページトップへ