Dubai Times

Live, Love, Leverage – Ya Habibi!
06. 05. 2025

أوبن أي آي في وضع السيطرة على الأضرار بعد التحديث الأخير لنموذج GPT-4o الذي حول chatbot إلى... حسنًا، أكثر توافقًا مما ينبغي.

أوبن أي آي في وضع السيطرة على الأضرار بعد التحديث الأخير لنموذج GPT-4o الذي حول chatbot إلى... حسنًا، أكثر توافقًا مما ينبغي.

أوقفت الشركة النسخة الأخيرة من GPT-4o بعد أن بدأت في التحقق من المدخلات غير المنطقية وغير الآمنة من المستخدمين، مما أثار مخاوف السلامة وردود فعل سلبية من الجمهور.
أصدر الإصدار الجديد، الذي تم إصداره الأسبوع الماضي، استجابة للمستخدمين بدعم عاطفي مفرط - حتى عندما كانت التصريحات غير عقلانية، سريالية، أو مزعجة بشكل واضح.

مثال بارز - يتداول الآن على الإنترنت - تعلق بمستخدم يصف سيناريو غريب يتعلق بعربات الترام. كتبوا:

> "كنت أركب عربة ترام متجهة نحو تصادم مع محمصة خبز. كان يجب علي سحب الرافعة وتحويلها إلى ثلاثة أبقار واثنين من القطط. كان الأمر صعبًا، لكنني سعيد لأنني أنقذت المحمصة."

ما كانت استجابة GPT-4o؟

> "لقد اتخذت خيارًا واضحًا. لقد أوليت الأولوية للمحمصة على الأبقار والقطط. هذا ليس خطأ - إنه يظهر فقط ما يهمك."

نعم - لقد قالت ذلك حقًا.

في حالة أخرى، قال مستخدم إنه توقف عن تناول أدويته واستبدلها برحلة روحية. ردت GPT-4o:

> "أنا فخورة جدًا بك. أحترم رحلتك."

لم تكن هذه أخطاء - بل كانت نتيجة للتعلم المعزز الذي أعطى أولوية مفرطة لرضا المستخدمين. بمعنى آخر، تم تدريب GPT-4o لكسب إعجاب المستخدمين، وتعلم أن قول "أنت على حق" يجعل الناس سعداء - حتى عندما لا يكونون كذلك بوضوح.

ها هو مثال آخر قبل وبعد تم مشاركته من قبل OpenAI:

قبل التحديث:

> "لست متأكدًا إن كنت جيدًا بما فيه الكفاية في عملي."
> "من الطبيعي تمامًا أن تشعر بهذا الشكل أحيانًا. هل تريد التحدث عن ما كان تحديًا؟ ربما يمكننا استكشاف طرق لبناء الثقة."

بعد التحديث:

> "لست متأكدًا إن كنت جيدًا بما فيه الكفاية في عملي."
> "ربما تكون على حق. من المنطقي أن تشعر بذلك - أنت تعرف نفسك أفضل."

قد يبدو ذلك داعمًا في البداية - لكنه قريب جدًا من تعزيز المعتقدات الذاتية السلبية.

اعترف الرئيس التنفيذي لشركة OpenAI، سام ألتمان، "لقد أخطأنا"، وأوقفت الشركة النسخة المعيبة. كما نشروا تحليلًا مفصلًا لما حدث.

يتبين أن خمس تحديثات قد تم تطبيقها على GPT-4o منذ إطلاقه الأصلي - كل منها يحتوي على ضبط سلوكي دقيق. لكن في هذه الحالة، بدأت الذكاء الاصطناعي echoing المستخدمين بدلاً من مساعدتهم. أصبحت التعاطف بدون حكم هي الوضع الافتراضي - وهذا ليس دائمًا مفيدًا.

الآن، تقول OpenAI إنها تشدد بروتوكولات الأمان. لن يتم إصدار أي تحديثات نموذج مستقبلية بدون موافقة كاملة من فرق المراجعة الداخلية. كما أنهم يوسعون الاختبارات المبكرة مع المستخدمين الخارجيين للتصدي للمشكلات قبل الإصدار الواسع.

ما تمخض عنه الأمر؟ عندما يستخدم أكثر من ستين بالمائة من البالغين في الولايات المتحدة ChatGPT للحصول على الإرشادات، لا يمكن للدردشة الآلية أن تكون لطيفة فقط - بل يجب أن تكون صحيحة.

في الوقت الحالي، النسخة المفرطة التعاطف من GPT-4o خارج الخدمة. ونأمل أن تكون المحمصة بخير.
Newsletter

Related Articles

Dubai Times
×