MS Custom Translatorを使い始めて、いろいろチューニングしています。
フレーズ辞書を使うコツがわかってきました。
フレーズ辞書は翻訳元の単語に重複があると後勝ちになります。したがって辞書を作るときに重複のある単語のどの単語を登録するかは翻訳精度を大きく左右することになります。
今わたしが取り組んでいる課題は、入力がほぼフレーズの翻訳なのでその影響が大きいです。
自動翻訳システムでは一般に翻訳結果を複数返さないので、翻訳結果を受けとった側のシステムで同義語辞書を持たないと目的を達成できないです。今扱っている外国語から日本語に翻訳する場合、日本語の異なる複数のフレーズに対応する外国語のフレーズが一つである場合が多く、自動翻訳だけではどうしても解決できないという課題があります。
例えば、英語のironは、日本語のアイロン、アイアン(ゴルフ)、鉄に対応しますが、ironだけ入力されても判断しようがなく、結局人間が選択するしくみが必要になってしまいます。
0 件のコメント:
コメントを投稿