إضافة لغة أوديا الهندية إلى خدمات ترجمة مايكروسوفت وترجمة جوجل

Collage of Odia Book Covers. Image via Flickr by Erin Mclaughlin. From the Flickr set Odia Book Covers. CC BY 2.0.

مجموعة من أغلفة كتب بلغة أوديا. تصوير إيرين ماكلولين من فليكر. من مجموعة أغلفة كتب بلغة أوديا عبر فليكر. استخدمت تحت رخصة المشاع الإبداعي، نسب المصنف – غير تجاري 2.0 عام.

بينما لا تزال مبادرات المصدر المفتوح جارية، أضافت كل من جوجل ومايكروسوفت  لغة أوديا الهندية إلى محركات الترجمة الآلية الخاصة بهما هذا العام- حيث تمت إضافتها إلى ترجمة جوجل في شهر فبراير/شباط وعلى مترجم مايكروسوفت مؤخرًا في 13 أغسطس/آب.

تعتبر أوديا هي اللغة الرسمية  في ولاية أوديشا الهندية واللغة الرسمية الثانية في ولاية جهارخاند، حيث يتحدث بها حوالي 35 مليون باعتبارها اللغة الأم ويتحدث بها حوالي 4 ملايين شخص باعتبارها لغة ثانية. كما صنفتها الحكومة الهندية كواحدة من اللغات الكلاسيكية في الدولة بناءً على مجموعة من المتطلبات التي تتضمن تقليدًا أدبيًا لأكثر من 1500 عام.

مع ذلك، يعتبر التواجد الرقمي لـلغة أوديا محدوداً؛ على سبيل المثال، تحتوي أوديا ويكيبيديا، والتي تعد واحدة من أكبر سجلات للمحتوى النصي، حاليا ما يقارب 15858 مقالة فقط بعد تنشيطه في عام 2011، وبعد انقطاع دام تسع سنوات، وعلى النقيض، فإن اللغة الماليالامية التي يتحدث بها تقريبا نفس العدد من ناطقي أوديا لديها حوالي 70 ألف مقال على ويكيبيديا. كان المحتوى بلغة أوديا متاحًا عبر الإنترنت في شكل صور وملفات PDF لفترة طويلة جدًا – ولا يزال البعض يواصل النشر عن طريق مزيج من الصور وملفات PDF بما في ذلك مجلة الحكومية أوتكال براسانجا التي تديرها حكومة ولاية أوديشا، وقد تسبب التأخير في اعتماد اليونيكود إلى جعل المحتوى أقل قابلية للبحث.

تساهم الترجمة الآلية بشكل كبير في زيادة التواجد الرقمي للّغات من خلال جعل المحتوى أكثر قابلية للبحث بالنسبة لغير الناطقين باللغة وأكثر يسراً للوصول إليه.

ستدعم الآن جميع الخدمات السحابية التي تديرها مايكروسوفت، بما في ذلك تطبيق ترجمة مايكروسوفت، وأوفيس، ومترجم بنج، ومن خلال  مترجم الخدمات المعرفية أزور، الترجمات من لغة أوديا؛إذ تسمح كل من ترجمة مايكروسوفت وترجمة جوجل (كل منهما متاح على الويب ومتاح كتطبيق) بترجمة النص المنسوخ مباشرة إلى حقل الإدخال.

بالإضافة إلى ذلك، تدعم هذه المنصات ترجمة المستندات النصية، والمواقع الإلكترونية، والمحادثات المباشرة. يحتوي تطبيق ترجمة جوجل للجوال على مميزات إضافية، بما في ذلك الترجمة في وضع عدم الاتصال بالإنترنت، والتعرف على خط اليد، والمسح الضوئي، وترجمة النصوص، وقراءتها من الصور، واستخدام الأوامر الصوتية للتحدث إلى ناطق بلغة أجنبية. تتيح ميزة “انقر للترجمة” للمستخدم ترجمة مباشرة لنص مكتوب داخل أي تطبيق. ويمكن للمرء أيضًا سماع كيف يتم نطق نص بلغة مدعومة باستخدام اصطناع الكلام من جوجل.

لقيت إضافة لغة أوديا استحسانًا من حكومة ولاية أوديشا، ونشر مكتب رئيس وزراء أوديشا تغريدة:

تمت إضافة ترجمة أوديا من قبل مايكروسوفت إلى mstranslator@، لتصبح اللغة الهندية رقم 12 الأكثر استخدامًا التي تم إضافتها. سيؤدي ذلك إلى تسهيل الوصول إلى المعلومات العالمية في أوديا وتعزيز التفاعلات بين اللغات.

كما تفاعلت إدارة الإلكترونيات وتكنولوجيا المعلومات التابعة لحكومة أوديشا بالتالي:

يستخدم الملايين حول العالم تطبيق ترجمة جوجل، وقد أضيف الآن في ترجمة جوجل أوديا إلى قائمة اللغات المدعمة، وتعتبر خطوة هامة نحو تعزيز محو الأمية الرقمية بلغتنا الأم، ومساعدة الملايين من غير الناطقين بها على اغتنام الفرصة.

الترجمة الآلية

تستخدم الترجمة الآلية لترجمة نص أو كلام من اللغة الأم إلى لغة الهدف. تعتمد الترجمة التي يستخدمها جوجل على الترجمة الآلية العصبية وهو نظام حسابي يستخدم تقنية تسمى الشبكة العصبية الاصطناعية حيث يتم استخدام مجموعات كبيرة من البيانات تتكون من ترجمة العبارات (من اللغة الأم إلى اللغة الهدف) تستخدم للتدريب.

يدعم ترجمة جوجل ومترجم مايكروسوفت  الآن 11 لغة هندية، من ضمنها أوديا. إجمالاً، يدعم جوجل 109 لغة عالمية بينما تدعم مايكروسوفت 73 لغة.

في الوقت نفسه، لا يزال يتعين على مبادرات المصدر المفتوح إنشاء مشروع ناجح للترجمة الآلية في أوديا. على الأقل هناك مشروع واحد على  بقيادة المجتمع المصدر المفتوح قيد التطوير – MTEnglish2Odia، بحيث تقوم بتدريب محرك الترجمة الآلية من خلال جمع أزواج الترجمة من المصادر الحالية مثل ويكيبيديا بلغة أوديا والتعهيد الجماعي من مساهمات مستخدمي تويتر.

بالإضافة إلى ذلك، هناك بعض الأبحاث والمصادر التي يمكن أن تستخدمها المنظمات الأخرى لبناء محركات الترجمة الآلية.

سياسة الترجمة الآلية

التكنولوجيا التي يستخدمها ترجمة جوجل ومترجم مايكروسوفت معقدة من الجوانب الاجتماعية، والقانونية، والأخلاقية، والجوانب المتعلقة بالحقوق.

يمكن أن تكون منصة الترجمة الآلية ذات فائدة كبيرة للعديد من الأشخاص، بما في ذلك الصحفيين للوصول بسرعة إلى الأخبار من لغات متعددة أو الطلاب الراغبين في التعلم من مصادر متعددة اللغات، وبالمثل، يساعد دعم الاصطناع الصوتي الأشخاص ذوي الإعاقة، وخاصة المكفوفين، على الوصول إلى المعلومات ومشاركتها بشكل أسهل، كما يستفيد التعليم، والإعلام، وصناعة الترفيه من إمكانات جوجل للترجمة حتى يتسنى ترجمة قدر هائل من المحتوى في فترة قصيرة.

من ناحية أخرى، يمكن للترجمة الآلية نشر معلومات خاطئة في حين يسهل الاصطناع الصوتي للمحتالين الذين يتطلعون إلى استغلال الناس من خلال التواصل معهم من خلال لغتهم.

هناك يوجد أكثر من 6000 لغة موثقة في جميع أنحاء العالم والأقلية منها فقط قد أنشأت أنظمة كتابة، وهذه هي اللغات التي سيتم إدراجها في مشاريع الترجمة الآلية مثل ترجمة جوجل ومترجم مايكروسوفت.

تعتبر إتاحة المحتوى عبر الإنترنت، بالإضافة إلى عدد مستخدمي الإنترنت الناطقين بلغة معينة، عوامل مهمة تضعها الشركات الربحية عند تحديد اللغات التي يتم إدراجها في أنظمتهم. كلما زادت اللغات التي تدعمها الشركة، زاد المحتوى المستهدف الذي يمكن تقديمه للمستخدمين – وزادت الإيرادات التي تحققها الإعلانات.

بالإضافة إلى ذلك، هناك أسئلة أخلاقية تتعلق بالإسناد والمكافأة في مشاريع مثل ترجمة جوجل، التي لديها بنية مجتمع مساهم لمراجعة الترجمات الحالية (التي تساعد المهندسين على تحسين الأداة بانتظام).

في حين أن جوجل هي شركة هادفة للربح مع العديد من المنتجات المدفوعة – بما في ذلك خدمة الترجمة السحابية – لا يتم إسناد أو مكافأة المتطوعين الأفراد أو العديد من المصادر العامة التي يتعلم منها الجهاز.

يعتبر استخدام المراسلات الخاصة لتحسين التعلم الآلي والذكاء الاصطناعي أيضاً أمرًا مثيرًا للجدل من وجهة نظر الخصوصية- على الرغم من أن جوجل تسعى إلى إخفاء هوية تلك البيانات.

في دولة مثل الهند، يواجه إنشاء محتوى متعدد اللغات أعناق الزجاجة بسبب التكاليف، حيث تسبب ترجمة جوجل ومترجم مايكروسوفت في حدوث ثورة في اقتصاد المحتوى الهندي. حيث يمكنها إحداث فرق في مشاريع مثل ويكيبيديا، الموجودة حاليًا بـ 23 لغة هندية، أو ستوري ويفر وهي منصة عبر الإنترنت لأدب الأطفال متعددة اللغات، تعتمد بشكل كبير على العمل التطوعي.

مع تعرض العديد من اللغات الهندية  للانقراض بشكل سريع، والتحدي الإضافي المتمثل في الأمية، والوصول الرقمي، يحتاج مسار الاتصالات إلى مزيد من الابتكار في التكنولوجيا الصوتية والمرئية. يمكن أن تكون الترجمة الآلية أداة ناجحة لوقف انقراض اللغة – ولكن لا تزال الهند أمامها طريق طويل لتسلكه.

إخلاء المسؤولية: اشترك الكاتب كمتطوع في أوديا ويكيبيديا منذ عام 2011 وفي MTEnglish2Odia منذ  مراحلها الأولى.

ابدأ المحادثة

الرجاء تسجيل الدخول »

شروط الاستخدام

  • جميع التعليقات تخضع للتدقيق. الرجاء عدم إرسال التعليق أكثر من مرة كي لا يعتبر تعليق مزعج.
  • الرجاء معاملة الآخرين باحترام. التعليقات التي تحوي تحريضاً على الكره، فواحش أو هجوم شخصي لن يتم نشرها.