2024/9/7
第14回 機械翻訳支援ツール「OmegaT」
小室誠一:Director of BABEL eTrans Tech Lab
翻訳に役立つツールの第2回は、翻訳支援ツールの「OmegaT」を取り上げます。
OmegaTは、オープンソースの翻訳支援ツールで、商用版の製品に匹敵する機能を備えています。初心者からプロの翻訳者まで利用可能で、翻訳メモリや用語集の管理が簡単に行えます。何よりも無料で使えて、本格的な機能が付いているので、初めて翻訳支援ツールを使う方に特にお勧めです。
OmegaTとは?
OmegaTの初版がリリースされたのは2002年のことです。それ以来、現在まで頻繁に改善され続けています。移り変わりの激しい翻訳支援ツールの中でも、一貫して進化してきた、信頼のおけるツールと言えます。筆者も初期のころから愛用しています。
最新バージョンは、2023年6月22日にリリースされたOmegaT 6.0.0です。このバージョンでは、マニュアルも整備され、さらに使いやすくなりました。
OmegaTの公式ページから、OmegaTの特長を引用してみましょう。(ダウンロードも可能です)
OmegaTは、Windows、macOS、Linuxで動作するフリーの翻訳メモリアプリケーションです。そして、プロ翻訳者向けのツールです。OmegaTは、自動的に翻訳するわけではありません(これを行うソフトウェアは「機械翻訳」と呼ばれます。OmegaTは一部の機械翻訳プログラムまたはインターネットサービスに接続して利用できます)。
OmegaTは、自由なソフトウェア(free software)です。つまり、ユーザーが自由にダウンロードでき、わずかな制約の下で使えます。ユーザーは、自由にコピーし、他の人々に配布することもでき、さらに自分のニーズにあわせて改変することもできます。
OmegaT 6.0.0のデフォルトの画面は以下のようになります。
従来のバージョンに比べ、ウィンドウの数が多くなっていますが、必要に応じて柔軟にレイアウトを変更できます。
OmegaTの機能の概要
OmegaTで翻訳作業をする際には、「プロジェクト」を作成して、原文、翻訳メモリ、用語集、辞書などを一括管理します。
これから翻訳する原文を「source」をフォルダーに入れてプロジェクトを開くと、原文の翻訳能な部分が、センテンス(またはパラグラフ)単位で自動的に分節化されて、「編集」ウィンドウに表示されます。そして、セグメントをアクティブにすると原文の下に入力スペースが現れるので、そこに訳文を入力して、Ctrl+Uを押すと、対訳が翻訳メモリに保存され、その瞬間に次の未翻訳セグメントがアクティブになります。
次のセグメントがアクティブになると同時に、翻訳メモリ、用語集、辞書が自動検索され、その結果が、「参考訳文」ウィンドウ、「用語集」ウィンドウ、「辞書」ウィンドウに表示されます。
検索結果は、ショートカットキーを使って、編集中の訳文セグメントに挿入することができます。
OmegaTにはいくつかの機械翻訳エンジンと連携する仕組みが備わっており、アクティブセグメントに対する訳文を「機械翻訳」ウィンドウに出力することができます。これもショートカットキーで訳文セグメントに挿入できます。
翻訳が終わって、訳文ファイルを生成すると、「target」フォルダーに訳文ファイルができます。このファイルは、原文ファイルのレイアウトを保持しています。例えば、原文ファイルがWordなら訳文ファイルも同じレイアウトのWordファイルになります。この他にも、テキストファイル、HTMLファイル、OpenDocument、XLIFFなど、数多くの形式に対応しています。
また、訳文ファイルを生成すると、プロジェクト全体の翻訳内容が含まれたTMXも出力されます。TMX(Translation Memory eXchange)というのは、翻訳メモリの標準規格で互換性があります。各翻訳支援ツールの翻訳メモリはそれぞれ独自ファイルなのでそのままでは、他のツールで使用できませんが、TMXに変換すればデータを交換できます。
OmegaTでは、TMXファイルを、プロジェクトフィルダーの中の「tm」フォルダーに入れるだけで、変換することなく翻訳メモリとして利用できます。これは他のツールにない、非常に便利な機能です。
さらに、初心者にも優しいのが用語集機能です。原文と訳文をタブ区切りにした、文字エンコードをUTF-8にした、テキストファイル作成すれば用語集となります。用語集はテキストエディタやExcelなどで簡単に作成できます。
OmegaTの便利な機能
OmegaTは、主な翻訳支援ツールと同等の機能を有していますが、よく見ると他のツールにはない機能、(あったとしても)より実務的で使いやすい機能が数多くあるのが分かります。
形式の異なる原文ファイルを同じプロジェクトに登録して同時に翻訳できます。翻訳メモリや用語集も複数登録して同時に参照できます。ただし、あまり多くのファイルを入れると検索が遅くなることがあるので、PCの性能に応じて手加減しましょう。
原文ファイルを「編集」ウィンドウで開くときの分節化の方法を調整することができます。OmegaTの「分節化規則」は正規表現に基づいており、「プロジェクト専用の分節化規則」から追加することができます。例えば、英文の中にピリオドを含む略語が出てくると、そこでセンテンスの終わりとみなされて分節化されてしまうことは良くあります。その場合は、その略語を登録することで、分割を防ぐことができるというわけです。
OmegaTの検索機能は他のツールにはない、優れた機能の一つと言えます。
「プロジェクトの検索」画面では、プロジェクトに設定した原文、訳文、翻訳メモリ、用語集だけではなく、外部ファイルを指定して、検索条件を細かく指定して、丸ごと検索することができます。完全一致検索、キーワード検索の他に、正規表現も使えます。
検索結果から原文の該当セグメントにジャンプする機能までついています。
まさに言語資産の活用ツールと言えますね。
品質チェック機能も、他のツールとは一味違います。タグの問題の他に、スペルミス、用語の問題、Language Tool指摘があり、言語に応じて細かく誤りを指摘してくれます。
便利な機能はまだまだたくさんありますが、キリがないので、最後に「整合」ツールを紹介して終わりにしましょう。
「整合」とは、原文ファイルと訳文ファイルが別々にある場合、それぞれの原文センテンスと訳文センテンスを対にしてくれる機能です。すでに翻訳したファイルが多数あり、翻訳メモリとして活用したいのだが、手作業で突き合わせていては日が暮れてしまいます。
整合機能は他の翻訳支援ツールにも搭載されていることが多いのですが、どれも使い勝手が良くありません。原文と訳文は1対1になっているとは限らないので(むしろ、そうなっていないほうが多い)、修正作業が必要になります。OmegaTはかなり使いやすいと言えます。ここにも言語資産活用ツールの一面が見られます。
さて、このようにOmegaTが優れた翻訳支援ツールであることがお分かりいただけたと思います。これだけの機能が無料で利用できるのですから、ぜひ使っていただきたいと思います。それも、特に初心者にお勧めします。
BABEL eトランステクノロジー研究室
初心者のための翻訳支援ツールOmegaT活用法
https://www.youtube.com/playlist?list=PLfFmAdmHRWJMfxwU0ulWA0W4k0VYpzj4v
PDF版