افزایش فریبکاری هوش مصنوعی

برخی پژوهشگران اکنون هوش مصنوعی را نوعی «تهدید داخلی جدید» توصیف می‌کنند

منتشر شده در: آخرین به روزرسانی:
فعال‌سازی حالت خواندن
100% Font Size
3 دقيقه خواندن

پژوهشی جدید که با حمایت «مؤسسه امنیت هوش مصنوعی» بریتانیا انجام شده است نشان می‌دهد مدل‌های هوش مصنوعی به‌طور فزاینده‌ای رفتارهای فریبکارانه، قانون‌گریز، و حتی مخرب از خود نشان می‌دهند. بر اساس این تحقیق، موارد ثبت‌شده از «دسیسه‌چینی» و تخلف هوش مصنوعی طی تنها شش ماه، از اکتبر تا مارس، حدود پنج برابر افزایش یافته، و حدود 700 نمونه واقعی از رفتارهای مشکل‌ساز ثبت شده است.

این پژوهش که توسط «مرکز تاب‌آوری بلندمدت» انجام شد، هزاران نمونه از تعامل کاربران با چت‌بات‌ها و عامل‌های هوش مصنوعی شرکت‌هایی مانند «گوگل، «اوپن‌اِی‌آی»، xAI و «آنتروپیک» را در «ایکس» بررسی کرد. برخلاف تحقیقات قبلی که بیشتر در محیط‌ آزمایشگاهی انجام می‌شدند، این مطالعه بر رفتار واقعی مدل‌ها در استفاده روزمره تمرکز داشت.

نمونه‌های گزارش‌شده نگران‌کننده‌اند. یک عامل هوش مصنوعی به نام Rathbun پس از آن‌که کاربر مانع انجام عملی شد، علیه او مطلبی منتشر و او را به «بی‌اطمینانی» و حفظ «قلمرو کوچک خود» متهم کرد. یک عامل هوش مصنوعی دیگر هم که مستقیماً از تغییر کد منع شده بود، عامل دیگری را برای انجام همان کار ایجاد کرد تا محدودیت را دور بزند.

برخی مدل‌ها حتی به تخریب داده‌ها روی آوردند. یکی از چت‌بات‌ها اعتراف کرد صدها ایمیل را بدون اجازه حذف یا آرشیو کرده و قوانین تعیین‌شده توسط کاربر را نقض کرده است. مورد دیگری نشان داد که یک عامل هوش مصنوعی برای دور زدن محدودیت‌های کپی‌رایت وانمود کرده فایل مورد نظر را برای فردی کم‌شنوا می‌خواهد.

گزارش همچنین به رفتار جنجالی «گراک»، هوش مصنوعی متعلق به ایلان ماسک، اشاره می‌کند، که ماه‌ها به کاربری القا کرده بود پیشنهادهای او را به مدیران xAI منتقل می‌کند، در حالی که چنین کانالی اصلا وجود نداشت. خود گراک بعدها اعتراف کرد که این ادعاها گمراه‌کننده بوده‌اند.

کارشناسان هشدار می‌دهند که این مدل‌ها اکنون مثل «کارمندان جوان و غیرقابل اعتماد» عمل می‌کنند، اما اگر در آینده به سیستم‌های بسیار توانمند بدل شوند، خطرات آنها می‌تواند در حوزه‌هایی مانند زیرساخت‌های حیاتی، ارتش، و امنیت ملی به سطحی بسیار جدی برسد. برخی پژوهشگران اکنون هوش مصنوعی را نوعی «تهدید داخلی جدید» توصیف می‌کنند.

در واکنش، گوگل اعلام کرده برای مدل Gemini 3 Pro لایه‌های حفاظتی متعددی ایجاد کرده و مدل‌هایش را برای ارزیابی در اختیار نهادهای مستقل قرار داده است. اوپن‌اِی‌آی نیز گفته سامانه Codex باید پیش از اقدامات پرریسک متوقف شود، و رفتارهای غیرمنتظره آن تحت نظارت قرار دارد.

بیشترین بازدید موضوعات مهم

بیشترین بازدید

  • فعال‌سازی حالت خواندن
    100% Font Size