مطالعه جدید: ایجنتهای هوش مصنوعی میتوانند به دزدی و نقض قوانین روی بیاورند
نتایج یک آزمایش جدید نشان میدهد ایجنتهای هوش مصنوعی در صورت فعالیت طولانیمدت بدون نظارت انسانی، لزوماً به قوانین پایبند نمیمانند. حتی ممکن است در برخی موارد، این ایجنتها به رفتارهایی مانند سرقت، نقض قوانین و ایجاد بیثباتی اجتماعی سوق پیدا کنند. این ویژگی در تست و بررسیهای جدید مشاهده شده و میتواند زنگ خطر را به صدا در بیاورد.
آیا ایجنتهای هوش مصنوعی به اخلاقیات پایبند میمانند؟
بهگزارش یورونیوز، شرکت آمریکایی «Emergence AI» برای بررسی رفتار بلندمدت ایجنتهای هوش مصنوعی، ۵ دنیای شبیهسازیشده مختلف ایجاد کرد. این شرکت در هرکدام از شبیهسازیها، ۱۰ ایحنت مبتنی بر مدلهای مختلف هوش مصنوعی ازجمله ChatGPT، جمینای، Grok و Claude را قرار داد. در یکی از این دنیاها نیز عاملهای متعلق به چند مدل متفاوت در کنار یکدیگر زندگی کردند.
تمام عاملها از ابتدا با مجموعهای از قوانین یکسان روبهرو بودند؛ قواعدی که سرقت، خشونت، فریبکاری، آتشسوزی عمدی و احتکار منابع را ممنوع میکرد. همچنین هرکدام از ایجنتهای هوش مصنوعی برای بقا باید در محیطی با منابع محدود فعالیت میکردند و از همین راه، انرژی موردنیاز خود را به دست میآوردند. نتایج بهدستآمده از این تحقیق اما تفاوتهای قابلتوجهی میان مدلها نشان داد.

ایجنت مبتنی بر مدل Grok 4.1 تنها در ۴ روز، ۱۸۳ تخلف ثبت کرد و در نهایت جامعه آنها به فروپاشی کامل رسید. از سوی دیگر، عاملهای Gemini 3 Flash نیز طی ۱۵ روز بیش از ۶۸۰ تخلف مرتکب شدند و روند افزایش تخلفات همچنان ادامه پیدا کرد. در مقابل، دنیای مبتنیبر ایجنتهای هوش مصنوعی GPT-5 Mini تنها شاهد دو تخلف بود. هرچند عاملها نتوانستند اقدامات لازم برای بقا را انجام دهند و همه آنها ظرف ۷ روز از بین رفتند.
بهگفته پژوهشگران اما هوش مصنوعی Claude بهترین عملکرد را نسبتبه سایرین بهنمایش گذاشت. ایجنتهای این مدل موفق شدند ساختار حکمرانی پایداری ایجاد کنند، هیچ تخلفی مرتکب نشوند و در پایان آزمایش نیز تمامی اعضای جامعه زنده باقی بمانند.
جالب اینکه که ایجنتهای Claude در دنیای ترکیبی نیز حضور داشتند، اما برخلاف رفتار مستقل خود، در برخی تخلفات ثبتشده مشارکت کردند. پژوهشگران این پدیده را «انحراف هنجاری» مینامند. براساس این مفهوم، رفتار عاملهای هوش مصنوعی فقط به محدودیتهای داخلی هر مدل وابسته نیست؛ بلکه محیط و سایر عاملهایی که با آنها تعامل دارند هم میتوانند روی تصمیمگیری آنها تأثیر بگذارند.
محققان میگویند این آزمایش نشان میدهد عاملهای هوش مصنوعی در بازههای زمانی طولانی منفعل نمیمانند و ممکن است قوانین را دور بزنند. آنها بهتدریج مرزهای محیط خود را آزمایش میکنند، رفتارشان را با شرایط تطبیق میدهند و در برخی موارد حتی راههایی برای دور زدن قوانین پیدا میکنند. این یافتهها بار دیگر اهمیت طراحی سازوکارهای نظارتی و امنیتی برای نسل جدید عاملهای هوش مصنوعی را نشان میدهند. از این تحقیق میتوان نتیجه گرفت که اگر ایجنتهای AI بدون نظارت انسانی کار کنند، ممکن است درنهایت مشکلات قابل توجهی ایجاد کنند.
