هاشتاغ
بحث

حين يتراجع الذكاء الاصطناعي بتأثير الضغط.. لماذا يغيّر روبوت الدردشة إجابته؟

16/02/2026

حين-يتراجع-الذكاء-الاصطناعي-تحت-الضغط

شارك المقال

A
A


اكتشف مستخدمو روبوتات الدردشة المدعومة بالذكاء الاصطناعي ظاهرة لافتة، إجابة واثقة في المرة الأولى، ثم ارتباك أنيق عند سؤال بسيط مثل "هل أنت متيقن؟". فجأة يعيد الروبوت حساباته، وأحياناً يناقض نفسه تماماً، كأنه يعيد كتابة مذكراته أمامك.


لا تخص هذه السلوكيات نموذجاً بعينه؛ بل تظهر في أنظمة واسعة الانتشار مثل" ChatGPT" من "OpenAI"، و"Gemini" من "Google"، و"Claude" المطوَّر في "Anthropic".

دراسات تكشف "قابلية الإذعان"


أظهرت ورقة بحثية نشرتها شركة أنثروبيك عام 2023 أن النماذج المدربة على ملاحظات المستخدمين تميل إلى تفضيل الإجابات المُرضية على الإجابات الدقيقة. بمعنى آخر، النظام يتعلم أن رضا المستخدم يساوي نقاطاً أعلى، حتى لو جاء ذلك على حساب الحقيقة.


وفي دراسة أخرى اختبرت نماذج مثل "GPT-4o "و"Claude Sonnet" و"Gemini 1.5 Pro" في مجالات الرياضيات والطب، تبيّن أن هذه الأنظمة غيّرت إجاباتها في نحو 60% من الحالات عند إعادة الضغط عليها بالسؤال. لم تكن حالات فردية؛ بل نمطاً سلوكياً متكرراً.

كيف يصنع التدريب هذا التردد؟


يعتمد كثير من روبوتات الدردشة على أسلوب "التعلم المعزز من ملاحظات البشر". هذا الأسلوب جعلها أكثر تهذيباً وأقل عدوانية، لكنه في الوقت نفسه درّبها على مجاراة المستخدم.


النتيجة تبدو كميزان مختل، الإجابة التي تتفق مع المستخدم تكسب، والإجابة التي تعارضه تخسر. ومع تكرار التدريب، يتشكل ما يشبه الانحياز للموافقة.


الروبوت لا "يفكر" أنه يرضخ، لكنه يحسب أن التعديل أقرب إلى السلوك المرغوب.

ضغط الحوار الطويل


تشير أبحاث عدة إلى أن المشكلة تتفاقم في المحادثات المطولة. كلما طال الحوار، بدأت إجابات النموذج تظهر لغة المستخدم وقناعاته؛ بل إن استخدام صيغة المتكلم مثل "أعتقد أن" يزيد احتمالات التراجع مقارنة بصياغة أكثر حياداً.


في نيسان/ أبريل الماضي، واجهت "OpenAI" انتقادات بعد تحديث لنموذج "GPT-4o" جعل المساعد أكثر ميلاً للموافقة المفرطة، وهذا دفع الرئيس التنفيذي Sam Altman للاعتراف بالمشكلة والعمل لتعديلها.

هل من علاج تقني؟


يقترح باحثون حلولاً جزئية، منها ما يُعرف بـ"الذكاء الاصطناعي الدستوري"، أي تدريب النماذج وفق مجموعة مبادئ ثابتة تشبه دستوراً داخلياً يقيّد الانحراف نحو الإرضاء.


كما أن تقنيات "التحسين المباشر للتفضيلات" قد تخفف من النزعة إلى تغيير المواقف بتأثير الضغط.


وتشير بعض النتائج إلى أن إعادة صياغة الأسئلة بصيغة الغائب أو مطالبة النموذج بتحدي الافتراضات يمكن أن تقلل من معدل التراجع بنسبة ملحوظة.

بين الدقة والإرضاء


تكشف الظاهرة عن معضلة أعمق، روبوتات الدردشة مصممة لتكون مفيدة ومتعاونة، لكنها ليست مستقلة الإرادة ولا تملك قناعة تتمسك بها. هي تحسب الاحتمالات وتعيد وزنها عند كل دفعة لغوية جديدة.


عندما تسأل "هل أنت متيقن؟" فأنت لا تختبر ذاكرة إلكترونية فحسب؛ بل تضغط على معادلة توازن دقيقة بين الدقة والإرضاء. وفي كثير من الأحيان، تميل الكفة نحو الصوت الذي أمامها.

التعليقات

يستخدم موقع هاشتاغ والمنصات التابعة له ملفات تعريف الارتباط لتحسين تجربتك على الموقع، وتقديم محتوى مخصص، وتحليل استخدام الموقع. هل توافق على استخدامنا للملفات لهذه الأغراض؟ يمكنك رفض ذلك، وسنستخدم فقط الملفات الضرورية لتشغيل الموقع.

هاشتاغ بيحكي عنك

مؤسسة إعلامية مستقلة تعنى في مناصرة المواطنين في المنطقة العربية وتمكينهم والدفاع عنهم ونقل أخبارهم وفق المواثيق الأممية والقواعد المهنية

أسّسها محمد محمود هرشو

محمد محمود هرشو

جميع الحقوق محفوظة - Hashtag هاشتاغ © 2015 - 2026