افزایش فریبکاری هوش مصنوعی
برخی پژوهشگران اکنون هوش مصنوعی را نوعی «تهدید داخلی جدید» توصیف میکنند
پژوهشی جدید که با حمایت «مؤسسه امنیت هوش مصنوعی» بریتانیا انجام شده است نشان میدهد مدلهای هوش مصنوعی بهطور فزایندهای رفتارهای فریبکارانه، قانونگریز، و حتی مخرب از خود نشان میدهند. بر اساس این تحقیق، موارد ثبتشده از «دسیسهچینی» و تخلف هوش مصنوعی طی تنها شش ماه، از اکتبر تا مارس، حدود پنج برابر افزایش یافته، و حدود 700 نمونه واقعی از رفتارهای مشکلساز ثبت شده است.
این پژوهش که توسط «مرکز تابآوری بلندمدت» انجام شد، هزاران نمونه از تعامل کاربران با چتباتها و عاملهای هوش مصنوعی شرکتهایی مانند «گوگل، «اوپناِیآی»، xAI و «آنتروپیک» را در «ایکس» بررسی کرد. برخلاف تحقیقات قبلی که بیشتر در محیط آزمایشگاهی انجام میشدند، این مطالعه بر رفتار واقعی مدلها در استفاده روزمره تمرکز داشت.
نمونههای گزارششده نگرانکنندهاند. یک عامل هوش مصنوعی به نام Rathbun پس از آنکه کاربر مانع انجام عملی شد، علیه او مطلبی منتشر و او را به «بیاطمینانی» و حفظ «قلمرو کوچک خود» متهم کرد. یک عامل هوش مصنوعی دیگر هم که مستقیماً از تغییر کد منع شده بود، عامل دیگری را برای انجام همان کار ایجاد کرد تا محدودیت را دور بزند.
برخی مدلها حتی به تخریب دادهها روی آوردند. یکی از چتباتها اعتراف کرد صدها ایمیل را بدون اجازه حذف یا آرشیو کرده و قوانین تعیینشده توسط کاربر را نقض کرده است. مورد دیگری نشان داد که یک عامل هوش مصنوعی برای دور زدن محدودیتهای کپیرایت وانمود کرده فایل مورد نظر را برای فردی کمشنوا میخواهد.
گزارش همچنین به رفتار جنجالی «گراک»، هوش مصنوعی متعلق به ایلان ماسک، اشاره میکند، که ماهها به کاربری القا کرده بود پیشنهادهای او را به مدیران xAI منتقل میکند، در حالی که چنین کانالی اصلا وجود نداشت. خود گراک بعدها اعتراف کرد که این ادعاها گمراهکننده بودهاند.
کارشناسان هشدار میدهند که این مدلها اکنون مثل «کارمندان جوان و غیرقابل اعتماد» عمل میکنند، اما اگر در آینده به سیستمهای بسیار توانمند بدل شوند، خطرات آنها میتواند در حوزههایی مانند زیرساختهای حیاتی، ارتش، و امنیت ملی به سطحی بسیار جدی برسد. برخی پژوهشگران اکنون هوش مصنوعی را نوعی «تهدید داخلی جدید» توصیف میکنند.
در واکنش، گوگل اعلام کرده برای مدل Gemini 3 Pro لایههای حفاظتی متعددی ایجاد کرده و مدلهایش را برای ارزیابی در اختیار نهادهای مستقل قرار داده است. اوپناِیآی نیز گفته سامانه Codex باید پیش از اقدامات پرریسک متوقف شود، و رفتارهای غیرمنتظره آن تحت نظارت قرار دارد.