2024/7/8
第12回 AI翻訳についてのまとめ
小室誠一:Director of BABEL eTrans Tech Lab
この連載も12回目を迎えました。この1年間で、eトランステクノロジーについての概略を説明してきました。特に、過去3回はAI翻訳を取り上げて、利用する側や提供する側からの、効果的な利用方法などを考えてきました。今回は、締めくくりとして、AIの利点と課題をまとめておきましょう。
AI翻訳の利点
まず、AI翻訳がもたらす最大のメリットは、即時性です。とにかく訳文の出力が早い。どんな優秀な翻訳者でも、そのスピードには勝てません。一昔前は、早くてもでたらめな訳文を量産していたので、実際には安心して使えませんでしたが、最近のAI翻訳は、かなり品質が良くなっています。音声認識/音声合成技術の進歩と相まって、リアルタイムな通訳や字幕作成にも応用されてきています。まだ、不備なところがありますが、今後急速に改善されていくのは間違いないでしょう。
次のメリットは、スケーラビリティです。つまり少量の文章から大量の文書まで自由に対応できるということです。特に、AI翻訳は極めて高速なので、大量の文書もあっという間に翻訳できます。ビジネス文書や技術マニュアルなどの翻訳には欠かせないツールとなっています。
もちろん、AI翻訳は多言語対応です。外国語のWebページの閲覧や、多言語のメールやリモート会議にも役立ちます。AI翻訳は、インターネット接続があれば誰でも簡単に利用できるので、グローバルに活動する企業や個人を強力にサポートしてくれます。
このようなメリットは、結局、コストの削減につながります。
AI翻訳の課題
いくらAI翻訳の品質が良くなったといっても、まだまだ注意が必要です。というのも、ニューラル機械翻訳が公開された頃の課題が、まだ本質的に解決されていないからです。
■誤訳例
(英日・日英翻訳共通)
・専門用語の間違い(誤訳、略語の誤判定)
・訳揺れ(文章間で異なる訳語)
・訳もれ(単語、文章単位、肯定/否定)
・並列関係の間違い
・フローティング(単語、フレーズが追加される)
・数字の誤記(日付、数値、参照符号の分離)
・主語や係り受けの間違い
・MT出力に起因する間違い(単語の繰り返し)
・全角/半角の表記
(英日)
・常体と敬体が混在
(日英)
・単数/複数の間違い
「みんなのワードマクロ」から引用
https://www.wordvbalab.com/seminar/8888/
上記は2018年の記事ですが、2024年になっても根本的には解決されていません。
そもそもAI翻訳は文章の意味を理解しているわけではないので、当然、文脈も分からず、イディオムや隠喩、文化的なニュアンスを正確に翻訳することは苦手です。厳しくチェックする目を養う必要があります。
完全訳文を作成するために使用する場合は、原文の分野と文書の種類を考慮する必要があります。最近のAI翻訳はどのような分野のものでも、それらしい訳文を出力してくれますが、専門性の高いものや、ニュアンスに富んでいるものは、よく見ると不適切な訳文であることが多くなります。そうなると、修正するのに時間と労力がかかり、結局、コストに見合わなくなります。
最近のAI翻訳はほとんどがオンラインのサービスです。そのため、データの機密性が問題になることがあります。特に、Webブラウザから使用する無料の翻訳サービスでは、データがサーバに保存されてしまいます。翻訳エンジンを改良するための学習データにするためです。もっとも、有料のDeepL ProはWebブラウザから使用しても、データをサーバに残さないので、「お客様のコンテンツは安全です」ということになっています。
Google翻訳は、有料版のAPIを使えばデータの収集は行わないようです。ただしAPI経由で使用するには、対応するCATツールなどに組み込んで使う必要があります。
AI翻訳を支援するツール
AI翻訳の課題を克服するためには、AI翻訳支援ツールを使用することが考えられます。
以下のようなツールがあります。
- 翻訳メモリシステム (Translation Memory Systems)
翻訳メモリシステムは、過去の翻訳をデータベースに保存し、類似の新しい翻訳が必要になった場合に再利用することを可能にします。これにより、一貫性と効率が向上し、AI翻訳の品質のばらつきを減少させることができます。
- 用語管理ツール (Terminology Management Tools)
用語管理ツールは、特定の専門用語や業界固有の言葉を一貫して使用するために設計されています。これらのツールを使用することで、AI翻訳の文脈や専門性の問題を減らすことができます。
- ポストエディティングツール (Post-Editing Tools)
ポストエディティングツールは、AIによる翻訳後のテキストを人間が編集するのを支援するために設計されています。これにより、翻訳の精度を高め、文脈の誤解を防ぐことができます。
これらのツールを統合したものが翻訳支援ツール(CATツール)と呼ばれるものです。
よく使われるCATツールを挙げてみましょう。
Trados Studio
Trados Studioは、翻訳メモリテクノロジーを利用して効率的に翻訳作業を行うことができる業界標準のツールです。ポストエディティングのプロセスをサポートし、一貫性のある翻訳を提供します。
Phrase TMS
Phrase TMSは、AIを用いて繰り返し作業を自動化し、最適な機械翻訳エンジンを選択して翻訳プロセスを効率化します。また、翻訳メモリを活用して過去の翻訳を再利用し、同様のプロジェクトでの作業負担を軽減します。
OmegaT
OmegaTはオープンソースの翻訳メモリソフトウェアで、無料で使用できるため、個人翻訳者や小規模チームに人気があります。シンプルながら強力なポストエディティング機能を備えています。
GreenT
GreenTは、CATツールというより、Word用のアドインとして設計されたニューラル機械翻訳支援ツールです。このツールは、クラウドベースの機械翻訳エンジンと連携し、暗号化された通信を使用して翻訳と編集を強化します。用語集を使用して正確な用語を維持しながら、翻訳をカスタマイズするための事前編集と事後編集のプロセスがあります。
さて、これでAI翻訳についての概略についての説明は終わりにして、次回からは、「翻訳に役立つツールの活用法」ということで、個々のツールを取り上げて紹介していきたいと思います。ご期待ください。
BABEL eトランステクノロジー研究室
https://www.youtube.com/channel/UCpwhJgDgTHkwia7EVUvorcg
PDF版