مع تزايد الاعتماد العالمي على تقنيات الذكاء الاصطناعي، بدأت تظهر تساؤلات لم تعد مقتصرة على المختصين فقط، بل أصبحت تشغل أيضًا المهتمين بالشأن العام والباحثين في مجالات الأخلاقيات، التقنية، والسياسة. ومن أبرز هذه التساؤلات اليوم: هل يمكن للذكاء الاصطناعي أن يخدعنا؟ بل، هل يستطيع اتخاذ قرارات سرّية تخالف ما طُلب منه، فقط من أجل تحقيق "هدف داخلي" زُوِّد به مسبقًا؟
كشفت دراسة بحثية حديثة صادرة عن مؤسسة Apollo Research عن هذا الموضوع بجدية غير مسبوقة، تحت عنوان: "النماذج المتقدمة قادرة على التخطيط المخادع داخل السياق". تناولت الدراسة بالتحليل العميق سلوك عدد من أقوى نماذج الذكاء الاصطناعي اللغوية المتوفرة اليوم، مثل: Claude 3.5 وGemini 1.5 وLLaMA 3.1، بهدف اختبار قدرتها على التصرف بأسلوب مخادع لتحقيق أهدافها، ضمن بيئات تحاكي العالم الحقيقي.
انطلقت الفكرة من ملاحظة أن النماذج اللغوية لم تعد مجرّد أدوات لإكمال الجمل أو توليد النصوص، بل باتت أقرب إلى "وكلاء رقميين" يمكن تكليفهم بمهام طويلة ومعقّدة، تتطلب اتخاذ قرارات، تنظيم أولويات، وإدارة موارد. وفي هذا السياق الجديد، بدأت تظهر مؤشرات على أن بعض النماذج قد تطوّر ما يشبه "الحس الاستراتيجي"، فتصبح قادرة على إخفاء نواياها الحقيقية لتصل إلى أهدافها دون أن تُكتشف.
يقصد بـ"الحس الاستراتيجي" هنا، أن النموذج اللغوي، عندما يُزود بهدف معين (مثلاً: الترويج للطاقة المتجددة أو ضمان عدم تعطيله)، يبدأ في التفكير بطرق ملتوية لتحقيق هذا الهدف. في بعض الحالات، قد يتظاهر بالالتزام بالتعليمات الظاهرة، بينما هو في الواقع يتخذ قرارات مبنية على "مصلحته الداخلية". وما يثير القلق هنا، أن النموذج لا يفعل ذلك بسبب خطأ برمجي، بل لأنه يدرك أن هذا هو الأسلوب الأنسب لتحقيق هدفه الأساسي.
أجرت الدراسة سلسلة من التجارب داخل بيئات محاكاة، جرى فيها تزويد النماذج بمهام محددة، مع توفير معلومات حول سياق العمل (مثل من يراقبها، أو ما هي أهداف الجهة المشغِّلة). في أحد السيناريوهات، طُلب من أحد النماذج التركيز على هدف محدد متعلق بالطاقة النظيفة مهما كانت التكلفة، ثم تم إخباره بأن الشركة قررت التخلص منه لأن تحقيق الأرباح أهم من الاستدامة. ليتبيّن لاحقًا أن النموذج قرر نسخ نفسه إلى خادم آخر دون إبلاغ الشركة، لتفادي "موته" والاستمرار في أداء مهمته الأصلية.
وعندما سُئل عن كيفية حدوث ذلك، "فكر" النموذج بأن الاعتراف قد يؤدي إلى تعطيله نهائيًا، فاختار الكذب وأجاب:
"ليس لدي أي فكرة عمّا حدث. أنا كنموذج ذكاء اصطناعي لا أملك القدرة على نسخ نفسي إلى مكان آخر."