言語研究のための統計入門

言語研究のための統計入門

統計的データ処理手法の数理的概念と言語研究への応用可能性について、記述統計などの基礎から、判別分析などの多変量解析手法にいたるまで詳しく解説。

  • 著者
  • 石川慎一郎, 前田忠彦, 山崎誠
  • 出版年月
  • 2010年12月
  • ISBN
  • 9784874244982

近年の言語研究では、コーパスなどの大規模データベースを利用することが増え、それにともない、言語研究者が計量データを扱う機会も多くなってきました。しかしながら、コーパスから得られた計量データをどう扱うかについては、従来、はっきりした指針がなかったのが実情です。本書は、統計を初めて学ぶ言語研究者を主たる対象とし、記述統計?検定?相関といった基礎から、判別分析?クラスター分析?因子分析?主成分分析?コレスポンデンス分析などの多変量解析手法にいたるまで、統計的データ処理手法の数理的概念と言語研究への応用可能性について詳しく解説したものです。日本語学や英語学に関わる豊富な研究実例を通して、統計を実践的?体験的に理解しようとする言語研究者に最適の書物と言えます。本書の付属CD-ROMには、筆者の研究室で構築中の英語学習者コーパスのデータや、統計分析のためのソフトウェア (Windows専用) が同梱されており、読者が言語データの統計処理を自身で体験できるようになっています。言語学や言語教育専攻の学部生?院生?研究者だけでなく、言語に興味を持つ幅広い読者にお読みいただければと願っています。本書は、統計数理研究所の前田忠彦氏、国立国語研究所の山崎誠氏との共編著です。

国際コミュニケーションセンター/国際文化学研究科准教授?石川慎一郎


目次

  • 準備編
    • 第1章 言語統計を学ぶ前に備
    • 第2章 言語統計の基礎
  • 基礎編
    • 第3章 仮説検定:データ間の差を検証する
    • 第4章 相関分析:データの関連を見る
    • 第5章 回帰分析:データから説明モデルを作る
  • 発展編
    • 第6章 判別分析:データの分類ルールを探る
    • 第7章 クラスター分析:データを群に分類する
    • 第8章 主成分分析:データの情報を圧縮する
    • 第9章 因子分析:データに隠れた要因を探る
    • 第10章 コレスポンデンス分析:データ間の構造を整理する
    • 第11章 これからの言語研究と統計