
أنثروبيك تحذر: أدنى تلوث للبيانات قد يؤثر سلبًا على نماذج الذكاء الاصطناعي
تم الانشاء فى 12 يونيه, 2025 • مشاهدات 14
دراسة صادمة: نماذج الذكاء الاصطناعي الكبيرة ليست محصنة ضد الهجمات الإلكترونية
خطر غير متوقع يهدد أنظمة الذكاء الاصطناعي
كشفت دراسة حديثة أجرتها شركة أنثروبيك بالتعاون مع معهد أمن الذكاء الاصطناعي في المملكة المتحدة ومعهد آلان تورينج، أن كمية صغيرة جداً من البيانات الملوثة كافية لخلق ثغرات أمنية خطيرة في نماذج الذكاء الاصطناعي الضخمة. هذه النتائج تحطم الاعتقاد السابق بأن المهاجمين يحتاجون إلى السيطرة على نسبة كبيرة من البيانات لإحداث تأثير.
تفاصيل الدراسة المثيرة للقلق
نُشرت الدراسة تحت عنوان "هجمات التخريب على برامج الماجستير في القانون تتطلب عدداً شبه ثابت من عينات التخريب" على منصة arXiv العلمية. ووصفت أنثروبيك هذا البحث بأنه "أكبر تحقيق في التسمم حتى الآن"، حيث أظهرت النتائج أن 250 مستنداً ضاراً فقط يمكنها إنشاء باب خلفي في أنظمة الذكاء الاصطناعي التي تحتوي على 600 مليون إلى 13 مليار معلمة.
كيف تم تنفيذ الهجوم؟
ركز الفريق البحثي على نوع محدد من الهجمات يسمى "هجوم الباب الخلفي"، حيث يتم تحفيز النموذج لإنتاج بيانات غير مفهومة عند مواجهة رمز تشغيل مخفي، بينما يستمر في العمل بشكل طبيعي في جميع الحالات الأخرى. لتحقيق هذا، قام الباحثون بتدريب نماذج بأحجام مختلفة تتراوح بين 600 مليون و13 مليار معلمة، باستخدام بيانات نظيفة مع حقن 100 أو 250 أو 500 مستند ضار.
نتائج صادمة تتحدى التوقعات
المفاجأة الكبرى كانت أن منحنيات نجاح الهجوم كانت متطابقة تقريباً لجميع أحجام النماذج، بغض النظر عن عدد المعلمات. سواء كان النموذج يحتوي على 600 مليون أو 13 مليار معلمة، فإن 250 مستنداً ضاراً كانت كافية لاختراقه بنجاح. بينما فشلت 100 مستند ضار في تحقيق الاختراق بشكل موثوق.
ما هي الآثار المترتبة على هذه الاكتشافات؟
- حجم النموذج لا يوفر حماية كافية ضد الثغرات الأمنية
- جودة وعدد العينات الضارة أهم من الحجم الإجمالي للبيانات
- الحاجة إلى تطوير آليات أمنية أكثر تطوراً لحماية نماذج الذكاء الاصطناعي
تحذيرات هامة من الباحثين
يشدد الفريق البحثي على أن هذه التجارب اقتصرت على نوع محدد من الهجمات التي تسبب إخراج بيانات غير مفهومة، ولم تشمل سلوكيات أكثر خطورة مثل تسريب البيانات أو تنفيذ الشيفرات الخبيثة أو تجاوز آليات الأمان. كما أن مدى تطبيق هذه النتائج على الثغرات الأكثر تعقيداً لا يزال بحاجة إلى مزيد من البحث والدراسة.
مقالات شائعه
-
تحديث جديد في ChatGPT يدعم الآن الدردشات الصوتية وإرسال الصوراخبار • مشاهدات 8,100
-
تعرف على أكثر المنصات استخداما في السعودية 2023سوشيال ميديا • مشاهدات 4,412
-
-
-