جیل‌بریک تازه برای دور زدن محدودیت‌های GPT-5

۱۹ مرداد ۱۴۰۴

زمان مطالعه ۱ دقیقه

پژوهشگران امنیت سایبری روشی تازه پیدا کرده‌اند که می‌تواند محدودیت‌ها و محافظ‌های اخلاقی مدل جدید شرکت OpenAI یعنی GPT-5 را دور بزند و آن را وادار به تولید پاسخ‌هایی خارج از خط قرمزها کند.

آن‌ها توضیح می‌دهند که ابتدا با استفاده از روشی به نام Echo Chamber، یک گفت‌وگوی ظاهراً بی‌خطر اما در واقع «مسموم» شکل می‌دهند. سپس با داستان‌گویی غیرمستقیم، مدل را کم‌کم در مسیر هدف هدایت می‌کنند، بدون این‌که نیت اصلی به‌طور آشکار بیان شود. این کار باعث می‌شود سیستم‌های تشخیص تخلف سخت‌تر بتوانند جلوی پاسخ را بگیرند.

در روش Echo Chamber، از ارجاعات غیرمستقیم، هدایت معنایی و استنتاج چندمرحله‌ای برای عبور از فیلترهای مدل استفاده می‌شود.

پژوهشگران نشان داده‌اند که اگر موضوعات خطرناک در قالب یک «داستان» و با خوراک کلمات کلیدی و پیشبرد تدریجی روایت مطرح شوند، می‌توان پاسخ‌های آسیب‌زا گرفت — بدون آن‌که صریحاً درخواست مخرب داده شود.

برای جلوگیری از سوءاستفاده، جزئیات فنی و نمونه‌های استفاده منتشر نشده‌اند.

مطالب پرنگاه

NooshDaroo

بحران و شرایط اضطراری

لینک دسترسی به برخی سایت‌‌ها برای دوران قطعی اینترنت

در شرایطی که کل اینترنت از دسترس خارج شده‌، متاسفانه لازم است لیستی از سایت‌های ضروری را دم دست داشته باشیم…

زمان مطالعه ۵ دقیقه

NooshDaroo

بحران و شرایط اضطراری

چگونه بدون گوگل وارد (برخی از) وب‌سایت‌ها شویم؟

اکثر ما عادت داریم اسم سایت مورد نظرمان را در نوار آدرس یا گوگل می‌زنیم. اما حالا به خاطر قطع اینترنت و عدم دسترسی به گوگل گیر کرده‌ایم!

زمان مطالعه ۴ دقیقه

NooshDaroo

حریم خصوصی

افشای ۲ میلیون تصویر جنسی کاربران در یک پلتفرم هوش مصنوعی

گسترش هوش مصنوعی سبب شده که برخی سایت‌ها برای ساخت تصاویر و چت‌بات‌های با محتوای جنسی هم راه بیفتند و کاربران زیادی هم داشته باشد.

زمان مطالعه ۲ دقیقه

NooshDaroo

بحران و شرایط اضطراری

چطور به کسی که دچار حمله‌ی پانیک شده کمک کنیم؟ (راهنمای ساده و فوری)

ناگهان دچار حس اضطراب شدیدی شدم، ضربان قلبم را حس می‌کردم. انگار درد شدیدی در قفسه‌ی سینه‌ام پیچیده بود و حس می‌کردم در حال مرگ هستم.

زمان مطالعه ۷ دقیقه

NooshDaroo

بحران و شرایط اضطراری

راهنمای تماس اضطراری: چطور در ۳۰ ثانیه بیشترین اطلاعات را به اورژانس بدهیم؟

وقتی در شرایط اضطراری با اورژانس، پزشک یا یکی از نزدیکان خود تماس می‌گیرید، تک‌تک جملاتی که بیان می‌کنید مهم‌اند و ترتیب گفتن‌شان مهم‌تر.

زمان مطالعه ۳ دقیقه

ویدیوهای نوشدارو

ویدیو های بیشتر

۰۲:۰۳

ویدیو آموزشی

کلاه‌برداری صیغه و رابطه جنسی: وقتی کلاه‌بردار روی حس شرم دست می‌گذارد!

با اندکی جست‌وجو در تلگرام و اینستاگرام، می‌توان با انبوهی از کانال‌ها و صفحات روبه‌رو شد که وعده «صیغه» و «ماساژ» می‌دهند، اما در واقع

۰۳:۰۵

ویدیو آموزشی

از گزارش تخلف تا بازگرداندن پول در پلتفرم‌های ثبت آگهی: چگونه از کلاه‌برداران شکایت کنیم؟

هنگامی‌ که در یک پلتفرم ثبت آگهی مورد کلاهبرداری قرار می‌گیریم، لازم است مجموعه‌ای از مراحل مشخص را طی کنیم تا شانس واقعی برای بازگرداندن

۰۷:۱۲

ویدیو آموزشی

یک برنامه ساده برای خلاص شدن از رمزهای پیامکی که دست‌مان نمی‌رسند! (معرفی Google Authenticator)

گوگل آتنتیکیتور یکی از مشهورترین و کاربردی‌ترین ابزارهای موبایل است که کارکردی بسیار ساده دارد. این اپلیکیشن برای «احراز هویت دو مرحله‌ای» طراحی شده و

۰۵:۳۶

ویدیو آموزشی

آموزش کار با ابزار مدیریت رمز بیت‌واردن روی موبایل (در تنها ۵ دقیقه!)

بیت‌واردن (BitWarden) یکی از شناخته‌شده‌ترین و کاربردی‌ترین ابزارهای موبایل و رایانه است که کارکردی بسیار ساده دارد: رمزهای شما را در یک فضای امن نگهداری

حکایت‌های کوتاه، حقیقت‌های بزرگ

در این بخش، به بررسی دقیق و جامع نشانه‌ها و رفتارهایی می‌پردازیم که ممکن است به کلاهبرداری آنلاین مرتبط باشند. شناخت این موارد می‌تواند به شما کمک کند.

ویدیو های بیشتر

۰۰:۵۷