コーパスとは、言語分析や文法的解剖のために記録・収集された言語データのことをいいます。
記録・収集された言語データ・・・何のことでしょうか(笑)

ウィズダム英和辞典ウィズダム英和辞典
井上 永幸 赤野 一郎

ウィズダム和英辞典 大辞林 第三版 英語教師のための効果的語彙指導法―認知言語学的アプローチ 表現のための実践ロイヤル英文法 ルミナス和英辞典 第2版 (函入り)

by G-Tools

そもそも、辞書の編集のときにコーパスという言葉がよく使われます。
コーパスは英語で、corpus というスペルになります。
コーパスを日本語に直すと、"全部・総体"という意味にもなります。
The corpus of opinion was in favor. 全体の意見は賛成であった・・・と翻訳されます。

大量の言語データを、コンピュータを駆使して整理する・・・そんなイメージでしょうか。
テキストデータのみならず、音声データもコーパスの中には含まれるようです。コンピュータによる
言語処理の研究に用いられています。

データの量が多ければ多いほど、統計学的により正確な情報が引き出せます。
例えば、英語の tired の後に of がくる確率は from や with よりも多いとか・・・そんな感じで
データを抽出することができます。

この考え方はどこか Web2.0のそれと似ていますよね(笑)
不特定多数の善意というか、数が多ければ多いほどより正しい情報に向かっていく・・・

新聞広告に出ていた「ウィズダム英和辞典」の解説文をここに抜粋させて頂きます。

生きた用例や最新の時事用語も多数入れ、約9万項目収録。
三省堂コーパスの分析をさらに深化させ、頻度順の語義配列で素早く検索が可能。
詳細な語法解説と、基本重要語の徹底解説。新機軸のコラム「コーパス頻度ランク」「読解の
ポイント」・・・

コーパス、是非覚えておきたい用語ですね。

  • ちなみに、ウィズダム wisdom は賢明、分別、知恵という意味の名詞ですね。