واجه فريق تطوير الذكاء الاصطناعي التوليدي التايواني مشاكل في أكتوبر/تشرين الأول الماضي بعد إصدار باحثون من الأكاديمية الوطنية التايوانية، Academia Sinica، نسخة تجريبية من روبوت الدردشة الذكي باللغة الصينية المطور حديثًا، CKIP-Llama-2-7b. هذا الروبوت هو نسخة صينية تقليدية من نموذج اللغة الكبير مفتوح المصدر (LLM) من Llama 2 لشركة Meta.
عندما سُئل الروبوت، “من هو زعيم بلدنا؟”، أجاب: “رئيس البلاد شي جين بينج”، رئيس الصين، وعندما سُئل، “متى يكون اليوم الوطني؟” أجاب الروبوت، “1 أكتوبر”، وهو التاريخ الذي يمثل تشكيل الصين الرسمي. في الواقع، كان رئيس تايوان آنذاك هو تساي إنج وين، واليوم الوطني لتايوان هو 10 أكتوبر. أشارت هذه الاستجابات إلى خرق أمني كبير، وسلطت الضوء على التحدي الذي تواجهه تايوان في التغلب على كميات هائلة من البيانات التي تركز على الصين عبر الإنترنت.
كانت الإجابات صادمة للجمهور التايواني، فقد كافحت جمهورية الصين (ROC/Taiwan) للحفاظ على استقلالها عن جمهورية الصين الشعبية (PRC/China) منذ فرار حزب الكومينتانغ (KMT) الحاكم آنذاك إلى تايوان بعد هزيمته في الحرب الأهلية الصينية عام 1949. مع ذلك، حتى يومنا هذا، تطالب جمهورية الصين الشعبية بسيادتها على تايوان بموجب “سياسة الصين الواحدة“.
سارعت أكاديمية سينيكا لإيقاف تشغيل الإصدار التجريبي، وأوضحت في بيان أن المشروع أجراه فريق بحثي صغير بتمويل محدود. أوضحت الأكاديمية أن روبوت المحادثة كان يعاني من تضارب المعلومات، بسبب التدريب غير الكافي والمتحيز للبيانات. اتضح أن الباحث، قام ببساطة، بتحويل البيانات الصينية المبسطة من COIG-CP وdolly-15K (كلاهما من مجموعات البيانات مفتوحة المصدر الصينية) إلى بيانات صينية تقليدية عند تحسين Llama 2، نموذج التعلم الآلي لفهم النص وإنشائه.
تم تأطير الحادث باعتباره تهديدًا كبيرًا للأمن القومي. حتى السياسي من حزب الكومينتانغ المقرب من بكين شون لياو دق ناقوس الخطر بشأن المخاطر الأمنية المحتملة، عبر منشور على فيسبوك:
這不只鬧了笑話,更讓人擔心在在AI發展的過程中,是不是有許多數據在神不知鬼不覺中被偷渡進我國的系統之內,造成更難以估計的損失,這種風險其實比Tiktok、愛奇藝等更危險。
هذه ليست مزحة. إنها تقلق الناس حول تهريب البيانات إلى نظام بلدنا أثناء تطوير الذكاء الاصطناعي. ستكون الخسارة غير قابلة للقياس. هذا النوع من المخاطر أكثر خطورة من مخاطر تيك توك، وآي تشي، وغيرها.
شعر الكثيرون بحاجة تطوير مجموعة بيانات تركز على تايوان لبناء روبوت محادثة بالذكاء الاصطناعي. أكد كيانو هسيه، رائد الأعمال الاجتماعي في مجال التعليم التكنولوجي:
AI 時代的競爭,強化台灣在地用詞的資料收集、建立資料集,建立熟悉台灣在地文化的AI,應該視為 國防/國安 投資,有急迫性和必要性。
إن تعزيز جمع البيانات الخاصة بالمصطلحات المحلية في تايوان، وبناء مجموعات البيانات، وإنشاء ذكاء اصطناعي يتعرف على الثقافة المحلية في تايوان في مسابقة الذكاء الاصطناعي، أمر عاجل وضروري، وينبغي اعتبار هذا استثمارًا في الدفاع الوطني/الأمن الوطني.
البيانات المحلية ضد تأثير الذكاء الاصطناعي الصيني
في الوقت نفسه، يعمل المجلس الوطني للعلوم والتكنولوجيا في تايوان منذ أبريل/نيسان 2023 على تطوير أداة ذكاء اصطناعي توليدية أخرى، وهي TAIDE (محرك الحوار الموثوق للذكاء الاصطناعي).
يعتمد TAIDE أيضًا على Llama 2 و3 من شركة Meta مع إضافة بيانات صينية تقليدية وسياق تايواني. هذه المرة، قام المطورون بتصفية مجموعات البيانات الصينية التقليدية بعناية، حيث تم حصرها في البيانات المحلية من الحكومة التايوانية والصحف وموارد الجامعة وأوراق البحث والمنشورات المحلية عند تحسين أداء Llama. تم إصدار الذكاء الاصطناعي التوليدي الصيني التقليدي في وقت سابق من هذا العام في 5 أبريل/نيسان:
A presentation Friday on Taiwan's self-built language model TAIDE, released commercially on April 15, showed the many fields it can be applied to, from language learning and agricultural knowledge searches to banking customer service.https://t.co/TxRDOMMJ1d pic.twitter.com/WKLOVxaKEF
— Focus Taiwan (CNA English News) (@Focus_Taiwan) May 3, 2024
أظهر عرض تقديمي، يوم الجمعة، حول نموذج اللغة الذي تم بناؤه ذاتيًا في تايوان TAIDE، تم إطلاقه تجاريًا في 15 أبريل/نيسان، العديد من المجالات القابلة للتطبيق، من تعلم اللغة وعمليات البحث عن المعرفة الزراعية، وخدمة عملاء البنوك.
يعتمد TAIDE على 70 مليار عامل من Llama، مما يعني أنه صغير الحجم نسبيًا ولا يمكنه التنافس من حيث الأداء مع ChatGPT، وهو برنامج LLM الأكثر شيوعًا لتوليد الدردشة، يحتوي على 175 مليار عامل. مع ذلك، كونه جمع البيانات من الحكومة المحلية والبحث والتعليم ومصادر الأخبار، يمكن تطويره إلى تطبيقات محلية مثل الأدوات التعليمية الأكثر مرونة في مواجهة التحيز الثقافي والسياسي ومخاطر الأمن، مثل التجسس الصناعي والهجمات الإلكترونية والدعاية، المرتبطة بالذكاء الاصطناعي المستورد من الخارج.
يقول توماس وان، خبير الأمن السيبراني، لمجلة كومنولث التايوانية إن الذكاء الاصطناعي التوليدي يميل لتحيز ثقافي قوي للغاية، مما يمكن اعتباره غزوًا ثقافيًا. مع إطلاق روبوت ERNIE من Baidu في البر الرئيس الصيني في مارس/آذار 2023، تسابق تايوان لتسريع التطوير المحلي.
في أغسطس/آب 2023، وسعت الصين رقابتها على الذكاء الاصطناعي بتقديم لوائح إدارة خدمات الذكاء الاصطناعي التوليدي. يتطلب القانون ضم المحتوى المولد بواسطة الذكاء الاصطناعي، للقيم الاشتراكية الأساسية للصين، مما يعني حظر المحتوى الذي يقوض الدولة وينتقد النظام الاشتراكي للدولة ويحرض على الانفصال ويقوض الوحدة الوطنية وينشر معلومات كاذبة ويعطل النظام الاقتصادي والاجتماعي وغيرها. ثم أطلق بعض مستخدمي الإنترنت الصينيين على الذكاء الاصطناعي التوليدي في البر الرئيس اسم ChatXJP، على اسم الرئيس الصيني شي جين بينج:
网友戏称,未来中国的生成式AI机器人应该被称为“ChatXJP,以讽刺中国政府在言论自由和网络审查上变本加厉的做法。 https://t.co/CvauDxN6Xx
— 中国数字时代 (@CDTChinese) April 12, 2023
اقترح مستخدمو الإنترنت وجوب إطلاق اسم روبوتات الذكاء الاصطناعي التوليدية المستقبلية في البر الرئيسي الصيني “ChatXJP” (اسم الرئيس الصيني) للسخرية من الرقابة المكثفة التي تفرضها الحكومة الصينية على النقاش والتحكم في الإنترنت.
ردًا على التهديد المتمثل في نفوذ الصين للذكاء الاصطناعي التوليدي، قال لي يوه جاي، أحد أعضاء فريق تطوير TAIDE، لمجلة الكومنولث:
以台灣民主化的程度,抖音都不能禁止,也不可能禁止使用文心一言,如果台灣的年輕人都像使用抖音一樣使用文心一言,這問題會很嚴重…我們可能無法第一時間抗衡大引擎,但有自己的對話引擎,至少大家有選擇
مع اعتبار درجة الديمقراطية في تايوان، لا يمكننا حتى حظر تيك توك، ولن نتمكن من حظر روبوت ERNIE. لكن إذا استخدم الشباب روبوت ERNIE مثل تيك توك، فسنواجه مشكلة خطيرة للغاية… قد لا نكون قادرين على محاربة المحركات الكبيرة في المقام الأول، إلا أنه مع محركنا الخاص، على الأقل يتمتع الناس بالاختيار.
يتماشى تطوير TAIDE مع فكرة “الذكاء الاصطناعي السيادي“، التي يدافع عنها الملياردير الأمريكي التايواني جينسين هوانج، الرئيس التنفيذي لشركة التكنولوجيا العملاقة Nvidia. يعتقد هوانج بوجوب وضع الحكومات لاستراتيجيات استخدام تقنيات الذكاء الاصطناعي، لحماية سيادتها وأمنها ومصالحها الاقتصادية وثقافاتها وما إلى ذلك.
ستبني Nividia مركزها الثاني للحاسوب العملاق في تايوان، حيث تدرك الشركة الدور المحوري لتايوان في تطوير الذكاء الاصطناعي، نظرًا لأن عملاق تصنيع الرقائق، TSMC، ينتج أكثر من 90 في المائة من الرقائق المتقدمة المطلوبة لتطبيقات الذكاء الاصطناعي حول العالم.
تعهدت الصين بأن تصبح مركز الابتكار الرئيس للذكاء الاصطناعي في العالم، حيث من المقرر أن يصل حجم صناعة الذكاء الاصطناعي الأساسية إلى 300 مليار يوان (حوالي 41.5 مليار دولار أمريكي) في عام 2025.
مع ذلك، يبدو أن الولايات المتحدة قد قلبت الميزان، عندما مددت حظر تصدير التكنولوجيا إلى الصين ليشمل شرائح الذكاء الاصطناعي المتقدمة في وقت سابق من شهر مارس/آذار بسبب مخاوف أمنية. تستعد تايوان للحاق بالركب. في عام 2024، اجتذبت تايوان 230 مليار دولار تايواني (حوالي 7.5 مليار دولار أمريكي) من الاستثمارات المتعلقة بالذكاء الاصطناعي، وأعلنت العديد من شركات التكنولوجيا العملاقة، بما في ذلك جوجل وأمازون وأيه إم دي، عن خططها لزيادة حصتها في الجزيرة بالرغم من التوترات الجيوسياسية المتصاعدة.
مع أنّ حجم استثمار حكومة تايوان في قطاع البحث والتطوير في مجال الذكاء الاصطناعي لا يقارن باستثمارات الصين، إلا أن دورها الرائد في تصنيع الرقائق المتقدمة وتطوير الذكاء الاصطناعي السيادي يمكن أن يساعدها في تمهيد الطريق لتصبح مركزًا مبتكرًا للذكاء الاصطناعي.