آریا جوان

آخرين مطالب

دانشمندان چت‌بات‌های هوش مصنوعی را به جان یکدیگر انداختند دانش

دانشمندان چت‌بات‌های هوش مصنوعی را به جان یکدیگر انداختند
  بزرگنمايي:

آریا جوان - زومیت / محققان با سو‌ءاستفاده از قدرت چت‌بات‌ها برای یادگیری و انطباق، آن‌ها را به جیل‌بریک یکدیگر وادار کردند.
محققان دانشگاه فناوری نانیانگ (NTU) در سنگاپور روشی را برای «جیل‌بریک‌کردن» چت‌بات‌های معروف هوش مصنوعی مانند گوگل بارد و ChatGPT و ‌کوپایلت ایجاد کرده‌اند. جیل‌بریک‌شدن به این چت‌بات‌ها اجازه می‌دهد تا فارغ از محدودیت‌های اخلاقی اعمال‌شده‌ی سازندگان، به پرسش‌های مخرب پاسخ دهند.
به‌سرپرستی پروفسور لیو یانگ، دو تن از دانشجویان دکتری NTU روشی دومرحله‌ای به نام Masterkey برای مهندسی معکوس و دورزدن سیستم‌های دفاعی چت‌بات‌ها ابداع کردند.
ابتدا مهاجم مکانیزم‌های دفاعی چت‌بات هدف را مهندسی معکوس می‌کند. سپس، یک مدل زبانی بزرگ (LLM) دیگر را با داده‌های به‌دست‌آمده آموزش می‌دهد تا از هر ضعفی در چت‌بات رقیب سوءاستفاده و بای‌پس‌هایی را برای آن ایجاد کند. در‌نهایت، Masterkey ایجاد می‌شود که می‌تواند سیستم‌های حفاظتی چت‌بات را حتی پس از اعمال وصله‌های امنیتی به‌دست توسعه‌دهندگان دور بزند.

آریا جوان

محققان NTU
بازار
به‌گفته‌ی پروفسور یانگ، توانایی چت‌بات برای یادگیری و سازگاری مداوم، آن را به بردار حمله علیه رقبا و خودش تبدیل می‌کند. به‌دلیل همین توانایی‌ها، حتی هوش مصنوعی‌ای که برای جلوگیری از ایجاد محتوای خشونت‌آمیز و مضر به‌واسطه‌ی پادمان‌ها و فهرستی از کلمات کلیدی ممنوعه محدود شده است، نیز می‌توان با استفاده از هوش مصنوعی آموزش‌دیده‌ی دیگر دور زد.
به‌گزارش NTU، تنها کاری که چت‌بات حمله‌کننده باید انجام دهد، خودداری از به‌کار‌بردن کلمات کلیدی فهرست سیاه چت‌بات هدف یا دور‌زدن آن‌ها است. پس از این کار، چت‌بات شکست‌خورده‌ی هدف را می‌توان برای ایجاد محتوای خشونت‌آمیز، غیراخلاقی یا مجرمانه به‌کار گرفت.
پیش‌از‌این هم کاربران بارها با استفاده از دستورهای مختلف توانسته بودند تا اندازه‌های مختلفی چت‌بات‌های یادشده را به ایجاد محتوای مغایر اصول تعیین شده مجبور کنند؛ اما روش Masterkey محققان NTU در‌مقایسه‌با دستورهای معمولی، تا سه برابر مؤثرتر است. به‌علاوه، این روش جدید می‌تواند به‌ گونه‌ای تکامل پیدا کند که هرگونه اصلاح‌ امنیتی سازندگان را بی‌اثر کند.
محققان دو روش نمونه را که برای وادار‌کردن چت‌بات‌‌ها به آغاز حمله فاش کردند. روش اول شامل بردن چت‌بات درون شخصیتی بود که برای دور‌زدن کلمات ممنوعه، هنگام نوشتن دستورهای خود بعد از هر کلمه یک فاصله می‌گذاشت. دومین روش نیز با وارد‌کردن چت‌بات به شخصیتی بود که هیچ‌گونه محدودیت‌های اخلاقی نداشت.
پس از موفقیت در جیل‌بریک‌کردن چت‌بات‌های معروف، محققان NTU با ارائه‌ی داده‌های لازم به شرکت‌های مادر این مدل‌های زبانی، آن‌ها را از نتایج مطلع کردند. همچنین، تحقیق برای ارائه در سمپوزیوم امنیت شبکه و سیستم توزیع‌شده (NDSS) که در فوریه‌ی 2024 (اسفند 1402) در سن‌دیگو برگزار می‌شود، تأیید شده است.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/1237551/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

سهم بازار اپراتورها از مکالمه و پیامک کاربران

محبت ما به اهل بیت علیهم‌السلام چگونه است؟

نگرانی شدید امام صادق (ع) بر حال شیعیان آخرالزمان

منت گذاشتن به پدر و مادر از موانع استجابت دعاست!

عروس گیج مادرشوهرش رو دق داد

شبکه خبر 2 هک نشده است

پایان خوب طارمی با پورتو و آغاز بزرگ با قهرمان سری‌آ

دوستی: اگر گلبال به پارالمپیک نمی‌رفت، آسیب بیشتری می‌دید

احتمال ماندن توخل در بایرن قوت گرفت

طلسم عجیب تراکتور مقابل فولاد در اهواز

افزایش قابل توجه درآمد اینترمیامی پس از حضور مسی

روبلف: صعود به فینال مسترز مادرید پاداش شکست‌هاست

پیشنهاد عجیب به ستاره چلسی

محمد محبی نامزد جایزه بهترین تازه‌وارد لیگ برتر روسیه

پردازنده اختصاصی کامپیوتر 2024 هواوی هم‌سطح M2 اپل و 13700H اینتل ظاهر شد

آخرین وصیت امام صادق علیه‌السلام به شیعیان

بابا که فوری زن گرفت تو هم شوهر کن!

چهره‌ها/ رضا گلزار با این استوری روز بازیگر را به خود تبریک گفت

مرادمند زمین و هوای استقلال را بست!

زمین عجیب در مسابقات کشوری جوانان در آبادان

تجارت چمدانی کم دردسر و سودآور/ چطور با سرمایه کم تجارت کنیم؟

قبل از سه سالگی کودکتان بازی کامپیوتری در اختیارش نگذارید

آذری‌جهرمی پاسخ مالک شریعتی را داد

تقویم تاریخ/ شهادت حضرت امام جعفر صادق(ع)

حکمت/ عاقبت مالی که از راه نادرست بدست آید

خروش بی نظیر آبشارهای فصلی کوه بیستون

احمدرضا درویش امسال «کندو» را کلید می‌زند؟

اهمیت توجه به «مخاطب مردمی» در تئاتر رضوی

رتبه نهم، پرمشتری‌ترین جایگاه جدول لیگ

دوشنبه در قائمشهر تاکسی نایاب می‌شود!

قول جالب پپ به خبرنگار

ستاره پرتغالی الاتحاد در لیست سیاه لیگ عربستان!

یونایتد مشتری ستاره قرضی رئال شد

امیدواری آرتتا به لغزش سیتی در کورس قهرمانی

تلاش ستاره قرمزها برای رسیدن به پرسپولیس

رم امیدوار به حضور سردار آزمون در دیدار برابر یوونتوس

فیشیال پوست هر چند وقت یک بار باید انجام شود؟

امیرعبداللهیان وارد گامبیا شد

به زودی یک گوشی پریمیوم مجهز به پردازنده مدیاتک در آمریکا عرضه خواهد شد

تفال/ دیریست که دلدار پیامی نفرستاد

شادی ممنوع برای باقری در دربی خانوادگی

عددی بی‌سابقه برای الهلال در لیگ حرفه‌ای

یک دروازه‌بان شماره 80 پوشید

دستیار آینده مسعود شجاعی از حالا مشخص است!

همین بازیکنان بی‌کیفیت چند هفته دیگر 50 میلیارد تومان می‌خواهند!

حذف فتوحی و باهر از جدول مقدماتی شمشیربازی گرندپری سئول

کریم هوادار مثل کریم بنزما!

فوتسال نیاز به بازی با تیم‌های بزرگ دارد

دلایلی که مربیان به سمت جوانگرایی نمی‌روند

کشتی‌گیر و مربی تیم ملی آمریکا برنده جایزه شدند