هل تقبل تحرير نتاج الترجمة الآلية (post-editing)؟

شئنا أم أبينا، يبدوا أن الترجمة الآلية (machine translation أو ما تُعرف اختصارًا باسم MT) أصبحت تُستخدم على نطاق واسع وقد يكون وراء هذا أسباب عدة، على رأسها بالطبع توفير المال. نتاج الترجمة الآلية قد يكون لا غبار عليه مع بعض اللغات اللاتينية مثل الإسبانية والفرنسية مثلا، رغم أنه غير دقيق مع لغات معقدة بعض الشيء مثل الألمانية بسبب صعوبة تراكيب الجملة فيها. ولكن، هل الترجمة الآلية مجدية وفاعلة مع اللغة العربية؟ أشك كثيرًا في هذا الأمر. فكل ما أراه من مخرجات الترجمة الآلية عند الترجمة إلى العربية أو من العربية لا يبشر بخير وبعض الترجمات مضحكة للغاية. انظر هذا المثال مثلا لترجمة جوجول لجملة بسيطة مثل:

‎5 Examples Of How The Languages We Speak Can Affect The Way We Think

أتت ترجمة Google على النحو التالي:

5 أمثلة يمكن للكيفية التي تؤثر ونحن نتكلم لغات الطريقة التي نفكر بها

 

في حين كانت ترجمة Bing من ميكروسوفت على النحو التالي:

5 أمثلة كيف نتكلم اللغات يمكن أن تؤثر على الطريقة التي نفكر

 

مقدمة بسيطة عن الترجمة الآلية وأنظمتها

مع بدايات الترجمة الآلية، كان الشائع هو نموذج rule-based وهو يعتمد على كتابة الكثير من القواعد التي تحاول التحكم في اللغة وهو أمر معقد جدًا لوجود عدد لا حصر له من الجمل والتراكيب في كل لغة بما يؤثر على الجودة بشكل ملحوظ. وهذا ما كانت تتبعه شركة صخر وكان المشرف على المشروع الدكتور نبيل علي وهو شخصية معروفة في مجال اللغويات الحاسوبية وصاحب الكتاب الشهير "اللغة العربية والحاسوب". للأسف الدكتور نبيل علي وأعماله لم تحقق النجاح المرجو رغم ما بذل من جهد كبير فيها هو وفريقه. وأتمنى يومًا ما أن يقوم أحد الحريصين على اللغة بالاهتمام بأعمال الدكتور نبيل علي ومحاولة استغلال علمه فيما ينفع لغتنا.

أما جوجول مثلا فتستخدم ما يعرف بالترجمة الآلية الإحصائية Statistical Machine Translation أو ما يعرف اختصارًا باسم SMT وهذا النوع من الترجمة الآلية يعتمد على تحليل كم هائل من النصوص بحيث يقوم النظام بتحليل ملايين وإن لم يكن مليارات الكلمات والجمل ليعرف مثلاً عدد تكرار حرف الجر "ب" مثلا مع فعل مثل "يقتل" وبالتالي عندما تصادفه جملة مشابهة، يستطيع النظام تقديم أكثر المقترحات قربًا وصلة اعتمادًا على طريقة إحصائية بحتة. وهذا النظام تكون جودته أفضل، خاصة إذا كان قد تمت تغذية النظام بملايين الجمل والتراكيب. وهناك نوع آخر يجمع بين النموذجين السابقين ويُسمى hybrid system.

ونظرًا لضعف المحتوى العربي، فإن نظام الترجمة الآلية الإحصائية (SMT) غير مجدي عندما تترجم نصًا علميًا مثلا أو نصًا ترويجيًا لمنتج، ولكن مجدي أحيانًا مع نصوص قانونية أو بمعنى أصح مع نصوص تشبه نصوص الأمم المتحدة لأن جوجول اعتمدت على مسارد ونصوص الأمم المتحدة ثنائية اللغة في بناء الترجمة الآلية العربية. 

وبالرجوع للموضوع الأصلي للمقال، هل تقبل تحرير أو مراجعة نص تم ترجمته آليًا؟

ربما صادفت أحد العملاء يطلب منك العمل على أحد هذه النصوص وربما سألك عن أسعارك لمثل هذا العمل؟

بالطبع العميل سيقول لك أن النص مُترجم آليا ولن تحتاج لكتابة كل كلمة وكل حرف لأن النص موجود بالفعل وكل ما عليك القيام به هو إجراء تحرير للنص، وهكذا ستجده يعرض عليك سعرًا زهيدًا جدًا استنادًا إلى هذه الحجة. وفي معظم الأحوال، لن تجد ترجمة ذات جودة عالية حين يتعلق الأمر باللغة العربية وذلك لصعوبة تراكيبها ولنقص المحتوى. ولا يفوتني هنا ذكر أن هناك عملاء تترجم ملايين الكلمات في مجال معين ولديهم مخزون لغوي كبير جدًا ويستطيعون بهذا الكم الهائل من البيانات تدريب نظام ترجمة آلية لديهم بالشركة وإعطاء نتائج لا بأس بها ولكن كما أسلفت، ما زالت اللغة العربية مستعصية بعض الشيء على أنظمة الترجمة الآلية لصعوبة تراكيبها وقواعدها.

هناك عدد كبير جدًا من المترجمين الذين يستشعرون الخطر من الترجمة الآلية لاعتبارها مصدرًا يهدد رزقهم وبالتالي سيرفضون مثل هذا العمل بدون تردد. هل أنت منهم؟ ولماذا؟ هل يمكن أن تكون هناك فرص لا ندركها الآن في مثل هذا النوع من العمل؟ هل من الممكن أن تقبل العمل بمثل هذه المشروعات مقابل نصف أو ثلث سعرك الأساسي؟

أتمنى من زوار الموقع مشاركتنا آرائهم وسأحاول في تدوينات قادمة إن شاء الله تفصيل هذا الموضوع من زاوية التعامل مع العملاء وكيف تتفاوض على السعر بهذا الشأن، وأتمنى أن تشاركوني آرائكم لتحفيزي على الاستفاضة في الموضوع لاحقًا.