ウィズダム英和辞典 井上 永幸 赤野 一郎 by G-Tools |
そもそも、辞書の編集のときにコーパスという言葉がよく使われます。
コーパスは英語で、corpus というスペルになります。
コーパスを日本語に直すと、"全部・総体"という意味にもなります。
The corpus of opinion was in favor. 全体の意見は賛成であった・・・と翻訳されます。
大量の言語データを、コンピュータを駆使して整理する・・・そんなイメージでしょうか。
テキストデータのみならず、音声データもコーパスの中には含まれるようです。コンピュータによる
言語処理の研究に用いられています。
データの量が多ければ多いほど、統計学的により正確な情報が引き出せます。
例えば、英語の tired の後に of がくる確率は from や with よりも多いとか・・・そんな感じで
データを抽出することができます。
この考え方はどこか Web2.0のそれと似ていますよね(笑)
不特定多数の善意というか、数が多ければ多いほどより正しい情報に向かっていく・・・
新聞広告に出ていた「ウィズダム英和辞典」の解説文をここに抜粋させて頂きます。
生きた用例や最新の時事用語も多数入れ、約9万項目収録。
三省堂コーパスの分析をさらに深化させ、頻度順の語義配列で素早く検索が可能。
詳細な語法解説と、基本重要語の徹底解説。新機軸のコラム「コーパス頻度ランク」「読解の
ポイント」・・・
コーパス、是非覚えておきたい用語ですね。