|
|||||||||||||||||||||||||||||||||||||||||||
古文翻訳装置は、どのようにして翻訳をしているのでしょうか。
実際のところ、そんなに難しいことをやっているわけではありません。
古文翻訳装置が翻訳をするのも、基本的に、人間が翻訳をするのと同じ行程をたどっています。
みなさんが古文を現代文にしようと思った際、どのような手順を踏むでしょうか。 ためしに「いとをかし」という文章を古文に直す時のことを考えてみてください。 まず、「いと」が「とても」という意味であり、「をかし」が「おもしろい」という意味であるということを、 皆さんは、すでにご存じだと思います。この知識があるから、古文を現代語に直すことが出来るのです。 つまり、古文を現代文に直す時には、このような単語の知識が必要なのです。 古文翻訳装置は、皆さんの頭の中にある知識を、辞書として持っています。この辞書を参照しながら、翻訳を進めていきます。 古文翻訳装置に「いとをかし」と入力して翻訳ボタンを押すと、まず、古文翻訳装置は「いとをかし」の先頭の文字、「い」を切り出してきて辞書を引きます。 この時点では、「弓を射る」の「射」、つまり「ラ行上一段活用動詞の連用形」とか、名詞としての「い」とかの意味が考えられます。 次に、「いと」で辞書を引きます。「いと」には「とても」と言う意味、また「糸」と言う意味などが考えられます。 続けて、「いとを」で辞書を引きます。しかしながら、「いとを」という単語は辞書に登録されていません。 そこで、古文翻訳装置は「いと」までがひとつの単語だと認識するわけです。 上記の作業を繰り返して、古文翻訳装置は文を単語ごとに切り分けていきます。 基本的にはこの処理の繰り返しです。 細かいところでは、「をかし(形容詞)」の前に来る「いと」は「糸」ではなく「とても」という意味だ…というような判断もとり入れ、 翻訳精度を高める努力をしています。
単語を区切る位置が違う場合
英語なら I like tennis.の文にみられるように、単語と単語の間に空白が存在するため、日本語と比べて楽に文を単語に分けることが出来ます。
しかしながら、日本語は単語と単語の間に英語のような空白は存在しないため、どこまでがひとつの単語なのか見分けるのが難しいのです。
もし、古文翻訳装置が単語の区切りを間違えて訳出してしまった時は、単語と単語の間に読点(、)や空白( )、または改行を挿入してから翻訳してやると、
正しい翻訳結果が得られます。逆に、ひとつの単語が読点や空白、または改行によって分断されていると、ひとつの単語として認識されません。この場合は、それらを
削除してやると、正しい翻訳結果が得られます。
古文翻訳装置の辞書に単語が登録されていない場合
古文翻訳装置は、あらかじめ辞書に登録されている単語を参照しながら翻訳をしています。そのため、その辞書に載っていない単語は、正しく訳出することが出来ません。
そんなときは、ユーザー辞書に単語を追加してやることで、正しい結果が得られるようになる場合があります。
ユーザー辞書とは、古文翻訳装置の辞書に自分で単語を追加してやることが出来る機能のことです。
詳しくはこちらを御覧ください。
複数の意味がある単語を間違った意味に解釈した場合
「をこたる」という単語には「気がゆるむ」という意味と「(病気が)治る」という意味とがあります。単純に「をこたる」のみを入力して翻訳した場合、
どちらの意味になるのか判断する基準はありません。そこで、「やまひおこたりけり」のように判断の基準になる単語を入れてやります。そうすると、正しい翻訳が
出来る場合があります。言い換えれば、単語ひとつを入力するよりは、ある程度まとまった文章で入力した方が、正しい翻訳結果を得られる場合が多いということです。
また、「われをもふ」という文章よりも、「我思ふ」のような文章の方が、正しい翻訳結果を得られやすいです。「われ」には「割れる」という動詞の可能性も否定出来ませんが、
「我」と書いてしまえば「私」という意味に限定されるためです。
古文翻訳装置の辞書には、色々な種類の単語が登録されています。これらの単語の情報を元に、訳文を生成してゆきます。
このうち、名詞と動詞、形容詞、形容動詞はユーザー辞書機能にて追加することが可能です。詳しくはこちらを御覧ください。 その他の品詞に関して、登録の間違い、または未登録の単語を見つけられた場合は、当センターまでご報告いただければ幸いです。 当センターにて、古文翻訳装置の辞書に登録いたします。 |
|
||||||||||||||||||||||||||||||||||||||||||
制作:古文自動翻訳研究センター |