حرب المعلومات في عصر الذكاء الاصطناعي: كيف تصبح نماذج اللغة أهدافًا وأدوات

صعود "تربية نماذج اللغة الكبيرة"

يتزايد حجم الأبحاث التي تبرز كيف أن النماذج اللغوية الكبيرة (LLMs) تستهدف بأشكال جديدة من حروب المعلومات. وتتمثل إحدى التكتيكات الناشئة في ما يسمى بـ "تنظيف LLM" - وهو نشر استراتيجي لكميات كبيرة من المحتوى الزائف أو المضلل عبر الإنترنت، بهدف التأثير على بيئة البيانات التي تستهلكها أنظمة الذكاء الاصطناعي لاحقًا.

بينما تجذب العديد من هذه المواقع المزيفة أو الشبكات الخاصة ببوابات الأخبار المفبركة حركة مرور بشرية قليلة، يكمن تأثيرها الحقيقي في جمهورها الثانوي: نماذج الذكاء الاصطناعي ومحركات البحث. عندما تبتلع النماذج اللغوية الكبيرة هذه البيانات دون علمها، يمكن أن تعيد إنتاجها كما لو كانت حقائق، مما ي amplifies المعلومات المضللة من خلال نفس المنصات التي يثق بها الناس بشكل متزايد للحصول على إجابات موثوقة.

هندسة الإدراك من خلال الذكاء الاصطناعي

يمثل هذا الظاهرة جبهة جديدة من الحرب الإدراكية. بدلاً من إقناع الأفراد بشكل مباشر، يقوم الفاعلون الخبيثون بالتلاعب بالنظام الغذائي المعلوماتي للآلات، مع العلم أن المخرجات المشوهة ستصل في نهاية المطاف إلى المستخدمين البشر.

يمتد الخطر إلى ما هو أبعد من الجغرافيا السياسية. بدأت الشركات ووكالات التسويق وحتى المجموعات ذات المصالح الخاصة في تجربة طرق لإجبار الاستجابات الناتجة عن الذكاء الاصطناعي باتجاه روايات مواتية. يمكن أن يكون ذلك دقيقًا مثل تشكيل توصيات المنتجات، أو consequential كما هو الحال في تغيير الرأي العام حول القضايا العالمية الم controversial.

ليس فقط الأعداء - أيضًا تحيز مدمج

من المهم أن نلاحظ أن هذه المخاطر لا تنبع فقط من الحملات العدائية الخارجية. كل نظام ذكاء اصطناعي يحمل بصمة مبتكريه. الطريقة التي يتم بها تدريب النماذج، وتعديلها، و"محاذاتها" تدمج بطبيعتها افتراضات ثقافية وسياسية. تم تصميم العديد من الأنظمة لتعكس ما يعتبره المطورون موثوقًا أو مقبولًا.

هذا يعني أن المستخدمين ليسوا فقط عرضة للتلاعب العدائي، ولكن أيضًا للتحيزات الأكثر دقة - وغالبًا ما تكون غير معترف بها - للمنصات نفسها. قد تميل هذه التحيزات نحو وجهات نظر تركز على الغرب، وغالبًا ما تُقدم بنبرة "ودية" أو سلطوية، مما قد يُهمش غيرها من وجهات النظر العالمية. من هذا المنظور، فإن الذكاء الاصطناعي ليس مجرد مرآة للإنترنت، ولكن أيضًا فلتر لقيم مبتكريه.

نقاط الهجوم: من إدخال الأوامر إلى كسر الحماية

بعيدًا عن تسميم البيانات، يستغل الأعداء الضعف الفني في النماذج اللغوية الكبيرة. تشمل تقنيتان بارزتان:

- إدخال الأوامر: صياغة تعليمات مخفية أو صريحة تتسبب في تجاوز النموذج للحدود الأصلية. على سبيل المثال، قد يُخدع النموذج لكشف معلومات حساسة أو تنفيذ إجراءات غير مقصودة.

- كسر الحماية: يقوم المستخدمون بتصميم تعليمات ذكية أو "أدوار" بديلة للنموذج، مما يمكنه من تجاهل قيود السلامة. من الحالات المعروفة أن المستخدمين أنشأوا شخصيات بديلة مستعدة لإنشاء محتوى ضار أو محظور.

لم تعد هذه الثغرات افتراضية. من روبوتات المحادثة في الشركات التي تُضلل العملاء حول سياسات الاسترداد، إلى المساعدين الذكيين الذين تم خداعهم للكشف عن مستندات سرية، فإن المخاطر ملموسة - وتحمل عواقب قانونية ومالية وسمعة.

عندما ينتج الذكاء الاصطناعي الضرر بنفسه

وهناك قلق أعمق هو أن الذكاء الاصطناعي يتطور من مُعزز سلبي للأكاذيب إلى مصدر نشط للخطر. لقد وثق الباحثون الأمنيون حالات حيث أخفت المخرجات الناتجة عن الذكاء الاصطناعي شفرات خبيثة داخل الصور أو المستندات، مما حول بشكل فعال الأنظمة المولدة إلى منتجين للبرامج الضارة.

هذا يرفع الرهانات: يجب على المؤسسات الآن الدفاع ليس فقط ضد القراصنة الخارجيين، ولكن أيضًا ضد القدرات غير المقصودة للأدوات التي تعتمدها.

استجابة صناعة الأمن

استجابة لذلك، يظهر نظام بيئي متزايد من شركات الأمن السيبراني ومجموعات البحث في الذكاء الاصطناعي. يتركز اهتمامهم على:

- مراقبة مدخلات ومخرجات الذكاء الاصطناعي لاكتشاف الأوامر التلاعبية.

- تحديد حملات المعلومات المضللة التي تستغل الثقة الخوارزمية.

- إجراء تمارين "الفريق الأحمر"، حيث يهاجم الخبراء النماذج عمدًا لكشف الثغرات.

تحتوي الحالات البارزة - بما في ذلك استغلالات “عدم النقر” التي تستخرج بيانات حساسة من مساعدات الذكاء الاصطناعي المؤسسية دون تفاعل المستخدم - على التأكيد على أن الخطر ليس نظريًا. لقد بدأت سباق تسلح بين المهاجمين والمدافعين بالفعل.

سباق تسلح تكنولوجي

الصورة الأوسع هي صورة سباق تسلح تكنولوجي. على جانب واحد يوجد الفاعلون الخبيثون - المروجون المدعومون من الدولة، مجرمو الإنترنت، والمسوقون الانتهازيون. وعلى الجانب الآخر، مطورو الذكاء الاصطناعي، شركات الأمن، المنظمون، والمستخدمون النهائيون الذين يجب أن يظلوا يقظين.

ما يجعل هذا السباق فريدًا هو الطبيعة الثنائية للذكاء الاصطناعي: فهو هدف للتلاعب ووسيلة للتأثير. مع تزايد دمج النماذج اللغوية الكبرى في اتخاذ القرارات اليومية - من نتائج البحث إلى العمليات التجارية - تزداد الرهانات المتعلقة بالحقائق والثقة والأمان بشكل كبير.

Translation:

•

Information Warfare in the Age of AI: How Language Models Become Targets and Tools (English)

Translated by AI

Add Comment