MSのカスタムトランスレータを最近触っていますが、例によってMSのドキュメントが少なくて苦労しています。
最近わかったことがあります。これは注意点ですね。
●MSのドキュメントには、句辞書は重複がある場合、後に登録された方が有効だと書かれています。ところが挙動を見ているとどうもおかしいの確認しました。重複した句はどちらが実際の翻訳に使われるかは一定でないとのことです。基本は辞書に重複のあるのは避けることだそうです。ドキュメントと違うこと言われてもと思うのですが、同じ単語で異なる訳がある場合、その扱いは十分注意して重複を排除しなければなりません。場合によっては重複しているその句全体を削除した方がいいかもしれません。
●作成した翻訳モデルを実行状態にするときに地域を指定できます(世界を3地域に分けて指定できます)。これ何も考えずに全部指定していたのですが、これは無駄なお金を使うことになることがわかりました。ASIAだけで十分でした。地域ごとに基本料金がかかるので要注意です。
自動翻訳はAIで成功している代表的なものですね。AIの活用はまず自動翻訳から入るとわかりやすいですね。モデル作る時に結構お金かかりますけど。
0 件のコメント:
コメントを投稿