الرئيسية / ملحوظات تقنية / كيف يعمل مترجم غووغل Google Translate ؟ (نقلاً عن أراجيك)

كيف يعمل مترجم غووغل Google Translate ؟ (نقلاً عن أراجيك)

المقال منقول عن موقع آراجيك بقلم 

خدمة Google Translate هي خدمة مجانية طُوِّرت بواسطة Google، تستطيع ترجمة النصوص والمُحادثات والصور والمواقع لحظياً، وذلك بين 103 لغة مدعومة بالإضافة إلى أربعة عشر لغة يتم تطويرها. أُطلِقت الخدمة للمرة الأولى في أبريل من عام 2006، أي أن أبريل من العام السابق كان ذكرى إنشائها العاشر. يزور الموقع ويستخدمه ما يزيد عن 200 مليون زائر يومياً. بدأت الخدمة في البداية ك Statistical Machine Translation، حتى تحولت في نوفمبر من عام 2016 إلى Neural Machine Translation، وهما ما سنقوم بشرحهما قدر المُستطاع في الأسطر التالية.

آلة الترجمة الإحصائية – Statistical Machine Translation

كانت بداية هذه التقنية في بدايات عام 2000، حيث تقوم آلات الترجمة بتطوير لوغاريتمات مُعقدة للحصول على أكثر الترجمات دقة، إلا أنها بالطبع لا ترقى للترجمة مثل بنو انسان.

 

 

عمل الموقع مثله كمثل باقي مواقع الترجمة من خلال الإحصائيات. وذلك من خلال إدخال الملايين من المُستندات والكُتب التي تم ترجمتها بواسطة البشر. بالإضافة إلى وثائق الأمم المُتحدة، والتي يتم ترجمتها إلى الست لُغات الرئيسية، ومن ثم يقوم بتوفير البيانات اللغوية. وبهذا يتمكن الموقع من تقديم العديد من خيارات الترجمة للجمل، والتي تم تقديمها – بالفعل من قبل- بواسطة البشر، وبعد ذلك يقوم بإختيار أقرب هذه الترجمات وأكثرها إستخداماً وشيوعاً. على سبيل المِثال وليس الحصر:

إذا قامت الخدمة بإكتشاف أن جملة”darsa Cuenta”  الإسبانية تُستخدم عادةً كترجمة لكلمة “Realize” بالإنجليزية أو “يُدرِك” بالعربية. يقوم الموقع حينها -وفقاً للإحصائيات- بترجمة الجملة كاملةً إلى كلمة  “Realize“بالرغم من أنه إذا قام بترجمتها كلمة بكلمة فسيكون الناتج هو “Give account“.

تكمن هنا الصعوبة، فالأمر ليس كما سبق وذكرنا عدد مهول من البشر يجلسون ليُدخلون الكلمات ومعانيها كلمةٍ بكلمة، وإنما تكمن الصعوبة في إيجاد هذا المُحتوى اللغوي الضخم. ذلك أنه على سبيل المِثال، ستجد أن المُحتوى المكتوب باللغة الإنجليزية أكثر من أي لُغةٍ أخرى، وهو ما يجعلك قد تجد أن الترجمة من وإلى الإنجليزية تُعطي نتائج أفضل من أية ترجمة أُخرى بين لُغتين أخرتين. ولذلك، فقد كان يتم إستخدام اللغة الإنجليزية كوسيط بين أي لغتين، حيث أنه إذا كنت تُريد ترجمة كلمة من العربية إلى الفرنسية على سبيل المِثال، سيتم ترجمة العربية أولاً إلى الإنجليزية، ومن ثم سيتم الترجمة من الإنجليزية إلى الفرنسية، وبالطبع تحدث كل هذه العملية في أقل جزء من الثانية. مما يعني أنه عند الترجمة بين لُغتين ليس بينهما الإنجليزية، تقوم الآلة المُختصة بالترجمة بإتمام عمليتين مُتتاليتين، وذلك يُظهر العظمة وراء بناء هذا النظام العبقري بالطبع.

أضِف إلى ذلك، أن هُناك بعض اللغات التي يزيد فيها عدد العمليات عن اثنان، فعلى سبيل المِثال، إذا أردت أن تقوم بترجمة كلمة من اللغة الكتالونية إلى الصينية، سيقوم الموقع أولاً بترجمة الكلمة الكتالونية إلى كلمة إسبانية، وهي أصل هذه اللغة في هذه الحالة، ومن ثم يقوم بترجمة الكلمة الإسبانية إلى كلمة إنجليزية، وبعدها من الإنجليزية إلى الصينية، وذلك يتم أيضاً في جُزء من الثانية.

قبل عام 2007، كان يتم الترجمة بُناءً على نظام شركة SYSTRAN في اللغات مثل العربية والصينية والروسية، وهو مُحرك مازال يتم استخدامه بواسطة العديد من خدمات الترجمة عبر الإنترنت حالياً مثل Babel Fish، حتى تم التحول منذ أكتوبر من عام 2007 إلى النظام السابق وهو Statistical Machine Translation.

تم تأسيس شركة SYSTRAN بواسطة دكتور بيتر توما في عام 1968 وهي واحدة من أقدم الشركات في مجال الترجمة في قسم الدفاع بالولايات المُتحدة. وقد قامت هذه الشركة بتوفير التقنية ل Yahoo وعِدة مواقع أخرى.

إذاً يظل السؤال مُتواجداً، وهو لماذا لم تكن خدمة Google Translate بتلك الجودة؟ وإجابة هذا السؤال تكمن في ثلاثة نقاط وهي:

  • جوجل لا تعرف لمن تُترجم، نعم، فببساطة شديدة لا تتوحد ترجمات كافة المواقع والمُترجمين عامةً، وذلك لأنه كما نعرف لكل مقامٍ مقال، فهناك بعض الكلمات التي تُعد مُعقدة لدرجة لا يُمكن إستخدامها على سبيل المِثال في مقالات مُوجهة لجمهور بسيط، بل يُمكن إستخدامها في دواوين الشعر وما إلى ذلك، فلا تعرف جوجل من الجمهور المُوجه له الجمل المُترجمة كما أنها ليست ترجمة مُتخصصة، بالتالي هي قد تُعطيك ترجماتٍ بسيطة حينما لا تحتاجها، وترجماتٍ مُعقدة للغاية حينما لا تحتاجها، فقد تقوم مثلاً بترجمةً لكلمة Glaucoma، والتي تعني في المجال الطبي إرتفاع ضغط العينإلى الزرق، وهي الكلمة الشائعة بين الأوساط العادية، إلا أنها ليست مُناسبة في المقالات المُوجهة لخريجي ودارسي الطب، وعلى هذا المنوال، فهي لا تعرف لمن أنت تُترجم، وبالتأكيد لا تُعطيك خياراً لإختيار جمهورك الذي تُترجم له.
  • ترجمة جوجل الإحصائية لا تمتلك مشاعر، كما ذكرنا سابقاً، فإن هذا النظام من الترجمة يعتمد على الإحصاء، وأفضل ترجمة بالنسبة له هي أكثر ما تم إستخدامه من قِبل المُترجمين، بغض النظر عن أماكن ومواقف إستخدامهم لهذه الكلمات، فهي لا تقوم مثلاً بإعطائك الجملة الأكثر تأثيراً في القارئ، أو أكثر الجُمل والكلمات جاذبية، حتى وإن كانت الترجمة دقيقة، فهي لازالت تخلو من المشاعر الحية بالطبع. وهذا يظهر في صوت القارئ الذي قد تستخدمه أحياناً في نُطق الكلمات لمعرفة كيفية نُطقها الصحيحة، فهو ينطق بدون مشاعر، فقط صوت إلكتروني خالي من أي شيء له علاقة بالمشاعر الإنسانية.
  • المُعاناه مع القواعد النحوية للغات، سببُ آخر وهام في ضعف ترجمة جوجل وغيرها من الترجمات، ذلك أن لكل لُغة قاعدة، وأسلوب تعلم جوجل الإحصائي لا يُمكنه وبكل أسف من تعلم القواعد اللغوية لكل لُغة، ذلك لأن الموقع دائماً ما يقوم بالمرور على اللغة الإنجليزية –والخالية من التمييز ما بين الجنسين من حيث القواعد النحوية- أثناء ترجمته للغات الأخرى، مما يجعل الجمل خاليةً من القواعد عند الترجمة للغات التي يُطلق عليها لُغات رومانسية نظراً لتمييزها النحوي بين المُذكر والأُنثى.

آلة الترجمة العصبية – Neural Machine Translation

في نهاية عام 2016، وتحديداً في نوفمبر، انتقل نظام الترجمة في جوجل من الترجمة الإحصائية إلى الترجمة العصبية، وهو نمط ترجمة يستخدم تقنيات التعلم العميق. تم تطوير هذا النظام بواسطة Google نفسها.

تقوم آلة جوجل للترجمة العصبية بإستخدام شبكة عصبية ضخمة ذات ذكاء إصطناعي قادرة على التعلم العميق من خلال إستخدام الملايين من الأمسلة، حيث يقوم هذا النظام بتحسين الترجمة من خلال إستخدام سياق الكلا ليصل إلى أفضل ترجمة مُمكنة. وبعد ذلك يتم ترتيب الترجمة وأقلمتها لتُصبح مُتوافقة مع قواعد الترجمة البشرية.

قارب هذا النظام بشكل أكبر من المُستوى البشري للترجمة، كونه استطاع التغلب على العقبات التي كانت تواجه النظام الإحصائي عند ترجمة الجمل الكاملة بين اللغتين الصينية والإنجليزية وذلك من خلال الترجمة بواسطة الإستفادة من البشر ثُنائيِّ اللغة ليقوموا بتعليم النظام. أي أن Google قامت ببساطة بزيادة مصادر الكلمات والجُمل التي يتم إدخالها للنظام.

حيث قامت الشركة بإطلاق ما يُعرف بترجمة Zero-Shot لنظام ترجمة جوجل مُتعدد اللغات، والذي يتجنب الترجمة للمُصطلحات الزوجية في اللغة الواحدة من خلال إدخال عبارات إلى النظام لها معاني بشكل مُستقل عن اللغة.

على سبيل المِثال، فإنهم يصفون في تقريرهم كيفية إستخدام الترجمة اليابانية- الإنجليزية والكورية-الإنجليزية سوياً لتعليم النظام مُتعدد اللُغات ومن ثم يقومون بطلب ترجمة أزواج من الكلمات لم يتم تقديمها له من قبل، وهي عبارة عن ترجمة من الكورية إلى اليابانية. وبشكل مُثير للدهشة، فإن النظام قد استطاع إنتاج جُمل ذات معنى حقيقي ومن خلال الترجمة بين لغتين اثنتين فقط بدون الرجوع إلى اللغة الإنجليزية الوسيطة بينهم.

الأمر ليس بتلك البساطة التي كنا نتوقعها إذاً، فهناك المئات من العُقول عالية الذكاء التي تعمل مُحاولةً الوصول إلى أفضل النتائج من خلال هذه الخدمة التي قد يراها البعض بسيطةً في تصميمها وشكلها أو مُعقدة في طريقة عملها التي يظن أنها تعمل بها والتي ذكرناها في بداية المقال وهم الأشخاص المحبوسين في جزيرة مُنعزلة ويقومون بإدخال الآلاف من الكلمات يومياً إلى الخدمة. فالأمر هنا وصل لأعلى مُستويات التقنية المُتواجدة حالياً من خلال إستخدام الذكاء الإصطناعي والقدرة على تطوير الآلة لتُصبح قادرة على تعليم نفسها بنفسها من خلال إستيعاب أكبر قدر من المعلومات المُقدمة لها وتقديمها بشكل بسيط للمُستخدم.

أتمنى أن أكون قد تمكنت قدر المُستطاع من تقديم آلية عمل خدمة الترجمة بجوجل بشكل يسهل فهمه، بالتأكيد الأمر أعقد من ذلك إلا أنني لن أتعمق في جزئية الذكاء الإصطناعي والتي لا أمتلك فيها علماً سوى القليل كي لا أُعرِّض نفسي لخطر ذكر معلوماتٍ خاطئة قد أُحاسب عليها. أنتظر مُشاركتكم أعزائي القُراء في هذه المقالة لنتوسع أكتر بمعرفتنا في مجال الذكاء الإصطناعي وليُدلي كلٌ منا بما يعرفه في هذا المجال الذي يُعد مُستقبل العالم، فلا خير في كاتِم علم.

 

اترك تعليقاً