機械翻訳への紹介
困難な課題…
公式文法の理論に関して詳細に検討する前に、機械翻訳の概念や構築の概要を説明したいと思う。
翻訳というのは、原書の創作に比較できる行為だと思っている人がたくさんいると見える(それは大げさに言うことだと思っている人がもっと多いかもしれない)。
私は、機械翻訳がうまく行われるため、まず翻訳の過程がどうやって人間の脳に処理されているか理解する必要だといつも思っていた。しかし、本当にそうなんですか?機械翻訳というのは、人間の翻訳の特徴をコンピュータで鏡映されたものはずですか?それとも、人間に特有の分析のやり方を使っうことより、コンピュータに特有の分析能力を利用して機械翻訳に関して考えていく方が良いですか?その質問に正しく答えられるかどうかことによって、機械翻訳の改善が違うかもしれない。
翻訳というのは、人間との間のコミュニケーションだ言うまでもない。それなら、機械翻訳というのは、人間との間、人間とコンピュータの間、それともコンピュータを通して人間との間のコミュニケーションですか?その最初だと思わない。人間とコンピュータの間のコミュニケーションには、自然言語ではなく、プログラミング言語が利用されている。コンピュータを通して人間との間のコミュニケーションだと思っているが、実は、それはどういう意味ですか?
どっちにしても、コンピュータが引き込まれている。それで、自然言語のような一番並外れた人間固有の能力をコンピュータで処理させることは、言語そのものよりずっと並外れたことだと言えるかもしれない。コンピュータで処理させようとしながら、自然言語の秘密を解決できるようになる可能性もある。そこに失敗するにもかかわらず、機械翻訳を研究することによって、自然言語についてまだ知らないことを勉強できることがきっといっぱいあるから、たくさんの言語学者、コンピュータ科学者、及び心理学者や他の分野からの学者が興味を持っているテーマです。
…どうやって成し遂げるか?
簡単に言えば、機械翻訳の過程の構築には以下のような部分を示すことができる。
解析の相
- 単語を直接な翻訳
- 統語上の移動
起点言語と目標言語の文法構造があまり違う可能性が高いから、構文の移動が必要になる。その移動のため、移動文法と言う文法が利用される。移動文法として色々な文法を適用できるが、両方の言語の特徴を適当に表さないといけないから、公式文法が一番良いです。もちろん、公式文法の種類もたくさんあって、どっちにするか、よく言語ペアによって違うものです。
- 意味上の移動
知識表現モデルを使って、起点言語の意味情報が目標言語の意味構造へ移動される。
- インターリングア
理想的なMTモデルには、起点言語がインターリングアと言う中間の言語に翻訳される。その中間の言語は、起点言語も目標言語も、両方の意味を示すはずです。
生成の相
生成というのは、インターリングア、意味構造、統語構造の計算表現を目標言語の文章に変換することです。解析の逆の過程だとも言える。
以上の過程に利用された色々な理論的枠組みを示すことができて、それを次の投稿に説明してみたいと思う。
参考資料:John Hutchinsの個人ページ
leave a comment