5月の新刊『言語研究のためのテキストデータ処理入門』
新緑が美しい季節になりました。GWに実家の庭で写真を撮ったのですが、その緑の力強さにびっくりしています。
学会のシーズンも始まり、続々と新刊が出来上がってきています。5月下旬刊行予定の1冊をご紹介します。
------
サーチエンジン・テキストエディタ・表計算ソフトで学ぶ
言語研究のためのテキストデータ処理入門
大名力著
https://www.hituzi.co.jp/hituzibooks/ISBN978-4-8234-1248-6.htm
------
「サーチエンジンで用例検索する」「コーパスを使う」といったデータ処理は、これからの言語研究にとって欠かせないと思います。しかしながらそれらのツールが備えているユーザーフレンドリーな自動処理に頼っていると、その処理の裏で何が行われているのかが見えず、処理がブラックボックス化してしまい、間違いが起きても気がつきにくくなります。
この本は、タイトルにある通り、専門的なソフトではなく、GoogleやExcelといった基本的なものを使って、データ処理における「入力・処理・出力」の基本を身につけるものです。
Googleのフレーズ検索を知っていますか。正規表現を使えますか。Excelに入力された単語数を数えたいとき、どうすればいいでしょうか。「なんとなく」やってもそれなりの成果が得られてしまうからこそ、そこで何が起きているのか、どうすれば適切な結果を効率的に得られるのか、その方法を知っている必要があります。この本ではそのための基礎的な部分を学ぶことができます。
「言語研究のための」と銘打ってはいますが、この本で得られる知識は研究以外でも使えるものです。著者の大名先生は、研究者にならない学生の卒業後も有効な、データ処理の技術とセンスを養うことを目指すということをおっしゃっていました。
編集者をしていると学生時代に会いたかったと思える原稿/本を担当することが出てきますが、この本は間違いなくその部類です。
個人的には、技術的なことはもちろんですが、データ処理を行う上での意識にも重要な示唆を与えると思っています。生成AIが発展した今、質問したら答えが返ってくるというのが当然のように感じる人も出てくるかもしれません。しかし、重要なのはその質問=入力の裏でどんな処理が行われているかに意識を向けることだと思います。そのうえで、出力されたものが「なに」であるのか、きちんと考えて向き合う必要があると思います。
これからの社会に必須の知識と感覚を身につけ、真面目に誠実にデータと向き合うための本です。ぜひご覧ください。
|