Chat with us, powered by LiveChat

機械翻訳の人間によるポストエディット

近年、機械翻訳の技術は非常に素晴らしい進歩を遂げています。「人間同等」が達成されたかどうかに関して論争する人もいるほどです。 Trusted Translations では、状況によっては達成していると考えています。ただし、ほとんどの場合、経験豊かな翻訳者の判断力に代わるものではないことを認識しています。人間の手が加わることは、言語の組み合わせ、コンテンツドメイン、複雑さ、技術レベル、コンテンツが単純であるか創造的であるか、原文の書き方、入力形式などのいくつかの要因に応じて、多少の価値を与えます。

これらの無限のバリエーションが存在するため、機械翻訳はすべての状況において正しい翻訳を検出して実装することはできません(おそらく不可能です)。したがって、機械翻訳を利用する際に信頼性の高い翻訳出力を得るためには、ほとんどの場合、人間によるポストエディットが不可欠です。また、カスタムニューラル機械翻訳エンジン(CMTE)のパフォーマンスを向上させるには、リトレーニングのために人間の翻訳者からのフィードバックが必要です。

Trusted Translationsには、機械で生成された翻訳をポストエディットするために特別に訓練された専門の翻訳者がいます。弊社の専門のポストエディターは、機械または自動翻訳出力の経験を活用して、出力を修正するだけでなく、将来の機械翻訳出力を改善します。

適切なテクノロジーツールが適切に配置されている場合、ポストエディットプロセスにより、現在の翻訳プロジェクトの出力の品質が向上し、その品質データを翻訳メモリ(TM)に保存できるようになり、今後のプロジェクトのための機械翻訳エンジンの効率性および精度を上げます。

翻訳とポストエディットの手順

翻訳のプロセスと機械で生成されたコンテンツをポストエディットするプロセスはまったく異なり、それぞれ異なるスキルとトレーニングが必要です。すべての翻訳者がポストエディットに向いているとは限りません。たとえ翻訳者ポストエディット業務に登録しても、手順がわからず、ある程度の訓練を必要とするでしょう。学界ではごく最近、人間のポストエディターに対する高まる需要に対処するためのカリキュラムの開発を開始しました。

すべてはバイリンガルコンテンツを確認するときに使用される精神的なプロセスから始まります。コンテンツを一から翻訳するとき、(翻訳となる)「ターゲット」が空白のキャンバスであるという事実に対し、翻訳者は通常以下のプロセスに従います。

  • まず、原文を注意深く読む。
  • そして、頭の中で翻訳を作成する。
  • 最後に、作成したターゲット言語(訳文)をソフトウェアプログラムまたはインターフェイスに入力します。

コンテンツとプロジェクトに応じて、翻訳者はテキストをすぐに編集したり、追加の調査を行ったり、後でテキスト全体が翻訳された後に戻ってくることがあります。
翻訳メモリ(TM)からのあいまい一致または完全一致を翻訳する際のプロセスはわずかに異なる場合がありますが、通常は三つのステップが含まれます。活用できるコンテンツを見つけた場合:

  • まず、原文を注意深く読み、
  • そして、TMによって提供されるターゲットを注意深く読み、
  • 最後に、適合したバージョンのターゲット(訳文)をソフトウェアプログラムまたはインターフェイスに入力します。

機械翻訳されたコンテンツのポストエディットは、プロセスが異なり、次の手順が含まれます。

  • まず、MT出力の文またはセグメントが読み取られます(つまり、ターゲットから始まります)。
  • 次にMT出力と原文とが比較されます。
  • ポストエディターは、明示的な指示に基づいて、MT出力の品質に関して即時判断します。
  • MTの出力が十分であれば、テキストを改善するために作業します。
  • MTの出力の品質が低い場合、MTが提供しているものをすべて削除し、再翻訳します(前述した翻訳手順と同じように)。

人間によるポストエディットおよび人間翻訳

人間の翻訳と機械生成の翻訳のレビューに関連するスキルとアプローチには大きな違いがあります。一般的に、人間の翻訳で見られるエラーのタイプは、機械翻訳されたテキストで見られるものとは大きく異なります。たとえば、数値を転置する場合、機械翻訳はより正確になる傾向があります。また、機械エンジンは、訳抜けが発生する傾向がありません(たとえば、長い法的段落内の句の省略)。しかし、機械翻訳は不自然なフレーズを生成する傾向があります。一部のMTエンジンは、用語に関して非常にパフォーマンスが低い場合もあります。

一方、人間の翻訳は、自然な翻訳を作成するのに優れている傾向があり、コンテキストと意味のエラーが少ない一方、数値を翻訳するときにエラーが発生しやすい傾向があります。また、人間の翻訳者は省略をする傾向があります。意図的に曖昧さをなくそうとするときに、コンテンツを追加する傾向がある場合もあります。しかし、それは確実に原文から離れてしまいます。Trusted Translationsでは、これらの違いを認識し、独自のツールを使用して出力を改善するように、機械翻訳ポストエディターを教育しています。さらに、弊社のツールは、機械翻訳エンジンを「トレーニング」して次の出力を改善する方法で、エディターが使えないフレーズを再翻訳するのに役立ちます。

簡単なポストエディットと完全なポストエディット

Trusted Translations では、すべてに当てはまるのソリューションは存在せず、すべてのソリューションをお客様のニーズに合わせる必要があります。

品質が求められる場合、エンジンのパフォーマンスの見込みだけでなく、出力の使いやすさに応じて必要なポストエディットのレベルも評価します。この場合、このタスクの出力として、完全な(すぐに公開できる)ポストエディットが要求されます。つまり、バイリンガルコンテンツがさらにレビューステップ(編集など)を経る場合、エディターは、MTのポストエディットされたセグメントと100%HT(人間が翻訳した)セグメントとの違いを検出すべきではありません。

コスト削減が求められる場合、または時間が重視され、MT出力の品質が十分な場合、文の流れを改善するために軽いポストエディットのみを推奨し、スペルチェッカーを利用して主な文法エラーを修正し、用語の利用方法についても改善することもできます。

ポストエディットとプレエディット

ポストエディットとプレエディットとを一緒にしてはいけません。プレエディットとは、自動翻訳ツールで特定のテキストを実行する前の準備段階を指します。基本的なエラーについてコンテンツを見直し、特定のコンテンツを特定の方法で翻訳する(またはまったく翻訳しない)ようにタグ付けし、フォーマットを最適化します。翻訳ツールを使用する前にこの準備を行うと、出力された品質が大きく改善され、ほとんどの機械翻訳案件または自動翻訳案件において重要なステップと見なされます。

効率的なプレエディットプロセスを組み込むと、出力が大幅に改善され、ポストエディターが高品質な翻訳を提供することが容易になります。機械翻訳技術が向上し続けるにつれて、高品質の翻訳を提供するためにはプレエディットとポストエディットとの両方のプロセスで必要な人間のスキルを備えることが重要になります。