一般的な(ベースライン)ニューラル機械翻訳ソリューションの専門会社

Trusted Translationsは、Google、Microsoft、Amazon、DeepLなどのベースライン機械翻訳(MT)エンジンと翻訳メモリ(TM)サーバーおよびポストエディットサービスとを統合して、大量の最高レベルの翻訳出力を生成する技術プロセスを開発しました 。クライアントのリクエストと提供された仕様に基づいて、ベースラインMTソリューションと品質管理プロセスとを統合して、信頼性の高い正確な翻訳を作成します。この独自のプロセスは、非常に高レベルの翻訳品質を維持しながら、所要時間を大幅に改善し、コストを削減することが示されています。

一般的なドメイン機械翻訳エンジンの概要

一般的なドメイン機械翻訳エンジン(「GMTE」と呼ばれることもある)は、人間の介入をほとんどまたはまったく必要とせずに、特定の言語との間でテキストを翻訳できるソフトウェアプログラムを指します。これらのベースラインエンジンはそれぞれ異なる方法で構築されますが、それらのほとんどは、専門用語を含まない一般的なコンテンツを翻訳するように設計されているため、「一般的なドメイン機械翻訳」ソリューションと呼ばれています。最も人気のあるのは、Google翻訳、Systran、Microsoft Translator、Microsoft Hub、およびAmazonです。

比較的基本的なコンテンツの全体的な理解に対しては、ベースラインエンジンは適切な結果をもたらします。ただし、現時点で、カスタマイズされたエンジンは依然として競争力があります。つまり、GMTEのみで生成された翻訳は、単純な文書であってもエラーは避けられないため、プロが使用するには十分な信頼性がありません。

よって、GMTEは、クライアントの目的とプロジェクトの性質に応じて、翻訳プロセスの有用な部分になる可能性があります。Trusted Translationsでは、GMTEを活用し、お客様のニーズと目標に基づいて統合する方法を見出しました。特定のプロジェクトがGMTEをプロセスに組み込むのに適していると感じる場合、クライアントとオプションについて話し合い、GMTE、メモリサーバー、および人間による翻訳(HT)とレビューのすべての利点を組み合わせたソリューションを設計します。

翻訳メモリサーバーと一般的なドメインMT

GMTEを使用する場合の翻訳メモリサーバー(「TMS」)の使用は、出力の一部としてレガシー翻訳者が翻訳したセグメントを活用するため、翻訳出力の品質を全体的に向上させる一つの方法です。このようなレガシーコンテンツを使用すると、クライアント固有のスタイルガイドラインの忠実度が向上し、用語集が強力ではない可能性がある場合、用語のサポートに反映される品質を確保できます。コンテンツ準備のワークフローの可能な設定の一つとしては、TMS を使用して最初に翻訳される各コンテンツセグメントで構成されることです。この最初のステップで同一または類似のセグメント(完全一致またはあいまい一致)が見つからない場合、コンテンツは一般的な機械翻訳エンジンに送信されます。

現在、ほとんどのTMSでは、これら二つのステップを同時に完了することができます。最後に、翻訳メモリまたは完全な機械翻訳の出力のいずれかから生成されたバイリンガルコンテンツは、専門のポストエディターによって編集することもできます。 つまり、そのMT出力と協力するように特別に訓練された翻訳者が編集します。さらに、人間によるポストエディットはすべてTMSにフィードバックされるため、次の翻訳の品質が向上します。

一般的なドメイン機械翻訳の人間によるポストエディット

GMTEを使用すると、人間の翻訳者のみが関与する翻訳プロセスと比較して、出力速度が大幅に向上します。十分な処理能力があれば、わずか数日で何億もの単語を翻訳できます。MT出力とHT出力の間でパリティに達したかどうかについての近年の議論に関係なく、一般に、最終出力の品質に関する懸念の原因があるかもしれません。一つの解決策は、ワークフローの一部として、人間によるポストエディットのステップと、場合によっては追加のレビューステップを追加することです。人間のポストエディットプロセスを統合することで、多少時間はかかりますが、より高いレベルの品質が得られ、GMTEを使用するときに問題を見つけるのにも役立ちます。

一般的なドメインMTエンジン、メモリサーバー、
そして人間によるポストエディットのワークフロー

機械翻訳ソリューションはまだ初期段階にあるため、Trusted Translationsは各プロジェクト毎に独自のケースとしてアプローチしています。しかし、私たちの経験に基づいて、機械翻訳を正常に統合するいくつかのワークフローを開発および実証しました。以下は、GMTEを翻訳メモリおよび人間によるポストエディットソリューションと統合する一般的なワークフローです。

上記で示されるように、コンテンツは、APIまたは他のタイプの統合を介してプロセスのすべての段階を通ります。各コンテンツセグメントは、TMSおよび一般的なドメイン機械翻訳エンジンを通じて、ポストエディット環境に到達します。つまり、弊社の翻訳メモリサーバーおよび/または一般的な機械翻訳エンジンから出力される各セグメントの結果は、クラウドベースのポストエディット環境のプロのポストエディターのいずれかによってオンライン上でポストエディットされます。プロセスは、複数の言語で同時に実行される場合があります。このプロセスではほとんどの場合、瞬時にポストエディットする環境に流れ込みます。人間のポストエディットタスクから生じるレトロフィードバックにより、TMSの自動更新が生成されます。

一般的なドメインMTとカスタムMT

一般的なドメイン機械翻訳エンジンと翻訳メモリサーバーとを組み合わせて使用すると、人間による翻訳(ゼロから)およびレビューの代わりに人間によるポストエディットを使用することにより、コストを大幅に削減できます。所要時間を大幅に短縮できます。このオプションの欠点は、品質がそれほど高くなく、機械翻訳エンジンが、カスタマイズされた機械翻訳エンジンが学習できるような方法で学習および自己改善を行う動的な能力に欠けることです。