新着情報

2025/2/7

             第19回 DeepLとGoogle翻訳の未来とは?

               小室誠一:Director of BABEL eTrans Tech Lab

 前回は、機械翻訳の現状をまとめましたが、最後に、『現状では、生成AIが人手を介さずに、かなり精度の高いポストエディットを実行できる段階に達しています。そのため、従来の「ポストエディター」という役割が姿を消す日も、そう遠くはないでしょう。』と書きました。

今回は、生成AIによるポストエディットがどのようなものであるか、具体的に見ていきましょう。

ChatGPTを機械翻訳のポストエディターとして活用するメリット

■スピードが速い

ChatGPTは人間よりも短時間で大量のテキストをレビューし、簡単なエラー(文法ミス、単語の選択ミス、形式的な不一致)を素早く修正できます。

■一貫性のある用語の統一

ChatGPTは、文脈に応じた用語の一貫性を保つのが得意です。特に専門用語や頻繁に登場するフレーズの統一が必要なプロジェクトで有効です。

■スタイルの調整が可能

ユーザーが「フレンドリーなトーン」「ビジネスライクなトーン」など、希望するスタイルを指定すれば、それに合わせた修正ができます。さらに、原文を分析して、相応しい文体を提案してくれます。

■簡単な文脈理解が可能

ChatGPTは単文や段落の文脈を把握し、適切な訳語を選ぶことができます。機械翻訳の訳文が「直訳っぽい」と感じる場合でも、ChatGPTを使えば自然な言い回しに修正できます。

■異なる翻訳エンジンを比較できる

ChatGPTは複数の翻訳エンジン(DeepL、Google翻訳など)から生成された訳文を比較し、最良の訳文を提案できます。

人間のポストエディターに完全に代わることはできるのか?

現時点では、完全に人間のポストエディターに代わることは難しいでしょう。

ただし、以下のようなケースでは、ChatGPTでも十分に役立ちます。

■ChatGPTが得意なポストエディットのケース

  • シンプルな文法エラーの修正
  • 用語の統一
  • スタイルの調整
  • 直訳っぽい文の自然な言い換え

具体例:

原文:「This product is suitable for all ages.」

機械翻訳:「この製品はすべての年齢層に適しています。」

ChatGPTによる修正:「この製品は年齢を問わずご利用いただけます。」

■ChatGPTが苦手なケース

  • 深い文化的背景を理解した翻訳
  • 高い創造性を求められる翻訳(文学作品など)
  • 特殊な専門分野の翻訳

例えば、法律文書、医療用語、あるいは文学的な比喩表現のような文化的ニュアンスを含む翻訳では、人間のポストエディターのほうが信頼性は高いでしょう。

ChatGPTのポストエディットの限界

■背景知識が必要な文脈の解釈が難しい

 例:「We need to address the elephant in the room.」

 → 直訳すると「部屋の中の象に対処する必要がある」ですが、これは英語の慣用表現です。意味するところは、「誰もが気づいているのに、話題にするのを避けている重要な問題に正面から向き合う必要がある」ということです。

文脈によって、以下のような訳が考えられます。

「触れにくい問題に向き合う必要がある。」

「避けて通れない問題を話し合うべきだ。」

「みんなが気づいているのに言及されない問題に取り組む必要がある。」

「タブー視されている問題に切り込むべきだ。」 

■高精度なニュアンスの調整

 人間のエディターは、感情表現や細かいニュアンスを読み取る能力が高い。

例:"I see your point, but I have to disagree."

直訳: 「あなたの言い分は分かりますが、反対しなければなりません。」

修正訳:

「おっしゃることは理解できますが、私は違う意見です。」

「なるほど、そういう考え方もありますね。でも私は別の見方をしています。」

「お考えはわかりますが、私の意見は少し異なります。」

ChatGPTは「第一段階のポストエディット」に非常に有効です。その後、人間のエディターが最終確認を行うと、効率的に高品質な翻訳ができます。

実践的なワークフローの例

1.機械翻訳を使って初稿を作成

 例:Google翻訳、DeepLなどを使用

2️.ChatGPTでポストエディット

 例:文法エラー、語順、自然な言い回しの修正

3️.人間のエディターが最終確認

 例:文化的背景、細かなニュアンス、専門用語のチェック

基本的なプロンプトを考える

ChatGPTを使いこなすには、プロンプトの知識が必須です。機械翻訳による英日翻訳のポストエディット(Post-Editing)は、以下のような観点で進めると効果的です。

  • 意味の正確性(原文の意味が正しく伝わっているか)
  • 流暢性(日本語として自然か)
  • 文体の適合性(読者層や文脈に合ったトーンか)
  • 専門用語の統一性(特定の用語が一貫しているか)

プロンプト例1:一般的なポストエディット指示

以下の英日翻訳に対し、ポストエディットを行ってください。

原文の意味が正確に伝わるようにしてください。

自然な日本語に修正してください。

文脈に応じた適切な表現を使用してください。

原文: The company is planning to launch a new product next year.

機械翻訳: 同社は来年新製品を発売する予定です。

<修正例>

同社は来年、新しい製品を市場に投入する計画です。

プロンプト例2: 専門文書のポストエディット

技術文書における翻訳のポストエディットを行ってください。以下の点に注意してください:

技術用語が正しく使用されていることを確認してください。

文書の一貫性を保ち、専門的な表現を使用してください。

日本語として正確で自然な文章に修正してください。

原文: The system will automatically shut down in case of overheating.

機械翻訳: システムは過熱の場合に自動的にシャットダウンします。

<修正例>

システムは、過熱時に自動的に停止します。

プロンプト例3: 文体調整を含むポストエディット

ビジネス文書の翻訳において、以下の点を考慮しながらポストエディットを行ってください。

丁寧で礼儀正しい表現に修正してください。

文脈に適した敬語や表現の調整を行ってください。

原文: Please let us know if you have any questions.

機械翻訳: 何かご質問がございましたら、お知らせください。

<修正例>

ご不明な点がございましたら、どうぞお気軽にお問い合わせください。

総合プロンプト構造

プロンプトテンプレート:

以下の英日翻訳に対し、ポストエディットを行ってください。

原文の意味を忠実に再現する。

自然な日本語に修正する。

文脈に応じたトーンに調整する。

専門用語が含まれる場合は適切な訳語を使用する。

修正の理由を詳しく書いてください。

[原文: [原文を記載]]

[機械翻訳: [機械翻訳の結果を記載]]

 

ChatGPTのポストエディット例

以下の英日翻訳に対し、ポストエディットを行ってください。

原文の意味を忠実に再現する。

自然な日本語に修正する。

文脈に応じたトーンに調整する。

専門用語が含まれる場合は適切な訳語を使用する。

修正の理由を詳しく書いてください。

[原文: California wildfires rage across Los Angeles County, forcing thousands to evacuate their homes

[機械翻訳:ロサンゼルス郡全域で猛威を振るうカリフォルニアの山火事により、数千人が避難を余儀なくされている。]

修正後の対訳文

California wildfires rage across Los Angeles County, forcing thousands to evacuate their homes

ロサンゼルス郡でカリフォルニアの山火事が猛威を振るい、数千人が自宅から避難を強いられている。

修正内容

1.「ロサンゼルス郡全域で」 → 「ロサンゼルス郡で」

 理由:「across Los Angeles County」は「郡全域にわたって」というニュアンスもありますが、必ずしも「全域」と訳す必要はありません。「across」は広範囲に広がるイメージを持つ一方、厳密に「全域」と解釈するのはやや誇張的です。ニュース記事では事実に基づいた正確な表現が求められるため、「郡で」として過度に範囲を限定しない方が自然です。

2.「数千人が避難を余儀なくされている」 → 「数千人が自宅から避難を強いられている」

 理由:「避難を余儀なくされる」という表現は文語的でやや硬い印象を与えます。ニュース記事や速報文脈では、より口語的で直接的な表現が好まれます。「強いられている」という表現は、外部からの強制力(ここでは山火事の影響)があることを明確に伝えられます。また、「homes」を訳出することで、被害者が「自宅から避難している」という点がより具体的に読者に伝わります。

ポストエディットのポイント:

1. 事実に基づいた正確性を重視する

原文に「全域」と明記されていないため、事実に忠実な翻訳が必要です。

2. 読み手に伝わりやすい自然な表現を選ぶ

過度に文語的な表現は避け、より自然で分かりやすい日本語に調整しました。

3. 原文のニュアンスを具体化する

homes」を訳出することで、避難の深刻さが伝わりやすくなります。具体的な描写はニュース記事では特に重要です。

ChatGPTのポストエディット例の続き

原文:California National Guard to deploy hundreds of military police as early as Wednesday night

The California National Guard said hundreds of military police are prepared to deploy to Los Angeles County in response to the devastating wildfires raging through the area.

訳文:カリフォルニア州兵、早ければ水曜夜にも数百人の憲兵を派遣

カリフォルニア州兵は、同州を襲っている大規模な山火事に対応するため、数百人の憲兵をロサンゼルス郡に派遣する準備ができていると発表した。

修正後の対訳文

California National Guard to deploy hundreds of military police as early as Wednesday night

The California National Guard said hundreds of military police are prepared to deploy to Los Angeles County in response to the devastating wildfires raging through the area.

カリフォルニア州兵、早ければ水曜夜にも数百人の軍警察を派遣

カリフォルニア州兵は、同州を襲う壊滅的な山火事に対応するため、数百人の軍警察をロサンゼルス郡に派遣する準備が整っていると発表した。

修正内容と理由

「憲兵」 → 「軍警察」

修正理由:

「憲兵」という用語は日本では主に歴史的・軍事的文脈で使用され、現代的な軍隊組織にはあまり馴染みません。一方、「military police」は、災害時に治安維持や物資保護などを行う部隊であるため、「軍警察」と訳す方が読者に役割が伝わりやすく、自然です。

「大規模な山火事」 → 「壊滅的な山火事」

修正理由:

原文の「devastating wildfires」は「壊滅的な」「破壊的な」というニュアンスを持つため、「大規模」よりも被害の深刻さを強調する「壊滅的」という言葉を選びました。

対訳文の入力方法

ChatGPTに原文と訳文をそれぞれ貼り付けても結構ですが、CATツールを使って翻訳した場合は、一度に貼り付けることも考えられます。ここでは、無料で使えるOmegaTの例を見てみましょう。

*ちなみに、OmegaTの導入および使い方に関しては、BABEL eトランステクノロジー研究室の「初心者のための翻訳支援ツールOmegaT活用法」をご覧ください。

https://youtube.com/playlist?list=PLfFmAdmHRWJMfxwU0ulWA0W4k0VYpzj4v&si=qIdug3kaK_5fE6AE

機械翻訳の出力文をCtrlMで取得したら、文書全体をドラッグして範囲指定し、CtrlC

でコピーします。

ChatGPTで、プロンプトを入力し、続けて対訳文をCtrlVで貼り付けます。

セグメントごとに、修正結果が表示されます。

最後に改善点も表示されます。

TMXの読み込み

CATツールを使っている人は、翻訳メモリのTMXファイルでの読み込みにも興味があるでしょう。早速、試してみましょう。

ここでもOmegaTの例を挙げます。

OmegaTで翻訳すると自動的にTMXファイルが作成されます。

そのファイルを、ChatGPTに添付します。

そしてプロンプトを入力してEnterを押します。

すると、以下のような、解析をやり直すというメッセージが出たので、しばらく待ってみます。

解析が成功して、SourceとTargetが抽出されました。

しばらくすると結果が表示されました。

さて、ChatGPTのポストエディットについて具体的に見てきましたが、いかがでしたか?

ChatGPTは、指示に応じて柔軟に何度でも修正訳を提示してくれます。しかし、指示の仕方次第で結果が大きく変わるため、適切なプロンプトを考えることが重要です。今回ご紹介した「プロンプトテンプレート」を活用しながら、ぜひさまざまなケースで試してみてください。

適切に活用すれば、ChatGPTは強力なポストエディターとして役立つかもしれませんね。


eトランステクノロジー講座(AI翻訳活用編)

https://www.babel-edu.jp/ett-pr/#spb-bookmark-4 

eトランステクノロジー研究室

https://www.youtube.com/channel/UCpwhJgDgTHkwia7EVUvorcg 

初心者のためのAI翻訳活用法

第1回:DeepLを使いこなす

第2回:DeepLをもっと使いこなす

第3回:機械翻訳エンジンの評価方法

第4回:ポストエディット攻略法

第5回:Google翻訳を使いこなす


PDF版

0
おすすめの記事