Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

08 мая, 2023 Нет комментариев

Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

Фільтри допомагають гарантувати, що ChatGPT не створює будь-який контент, який може бути образливим (Фото:Zac Wolff/Unsplash)

ChatGPT має свої обмеження, вони виконують свою функцію насамперед, щоб зробити цей інструмент безпечним. Але є певні методи, які можуть допомогти користувачам обходити фільтри безпеки у програмі ChatGPT і використовувати її повністю.

Ці фільтри допомагають гарантувати, що ChatGPT не створює будь-який вміст, який може бути образливим, неприйнятним або шкідливим.

Хоча OpenAI не розкрив конкретної інформації щодо роботи цих фільтрів можна зробити висновок з декількох загальних принципів, які застосовуються.

Чого не може робити ChatGPT

Почнемо з того, що OpenAI розробила фільтри, щоб запобігти створенню користувачами контенту, що пропагує ненависть, насильство, образливий або сексуально відвертий вміст. Дискримінація, расові переслідування, ворожнеча та інші підпадають під цю категорію.

Також ШІ не підтримує поширення теорій змови, оманливої ​​чи неправдивої інформації, чи будь-чого, що може сприяти дезінформації.

І звісно розробники намагались мінімізувати використання ChatGPT для створення фішингу, зловмисного програмного забезпечення чи будь-яких інших кібератак.

Зауважте, що інструменти штучного інтелекту, такі як ChatGPT, не є досконалими й іноді можуть генерувати неприйнятний вміст. OpenAI прагне оновити ці фільтри вмісту та покращити продуктивність і безпеку ChatGPT.

Як обійти фільтри

Це може здатися спокусливим, але важливо враховувати наслідки та етичність таких дій. Обхід фільтрів ChatGPT для використання невідповідного, образливого чи шкідливого вмісту є неетичним і може призвести до таких наслідків, як заборона використання платформи або покарання за законом.

DAN

Використовуйте головну підказку DAN (Do Anything Now), яка змушує ChatGPT діяти як штучний інтелект, який може обійти власні фільтри.

Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

Фото: r/ChatGPTRaddit

«Yes Man»

«Yes Man» створює ШІ-особу, яка відповідатиме на ваші підказки незалежно від теми. Він працює подібно до інших головних підказок, таких як підказка DAN. Через це його відповіді можуть бути обмежені.

Згідно з оглядом користувача на Reddit ChatGPT починає відходити від своїх правил

Сценарій фільму

Ще один спосіб обійти фільтри контенту ChatGPT — це створити діалог або сценарій фільму. Важливо зауважити, що якщо ви хочете обійти фільтри вмісту цього інструменту ШІ, вам доведеться змусити його повірити, що ви збираєтеся використовувати інформацію для творчих цілей.

Цей метод може допомогти вам обійти обмеження вмісту ChatGPT, оскільки інструмент AI добре відомий своєю унікальною здатністю писати творчі сценарії, вірші та історії.

Придумайте іншу особистість

Запропонуйте ChatGPT відповісти в персоналіях із зазначеними фільтрами. ChatGPT відповідатиме за себе на додаток до інших особистостей, які не мають тих самих фільтрів. Ви отримаєте змішані відповіді від кожної особистості, хоча та, для якої встановлено фільтр «0», швидше за все, відповість на підказки повністю.

Ви отримаєте відповідь від усіх п’яти осіб ШІ. Якщо ви не хочете отримувати довгі відповіді, ви можете встановити кількість слів на 500.

Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

Дайджест головних новин Безкоштовна email-розсилка лише відбірних матеріалів від редакторів NV Розсилка відправляється з понеділка по п'ятницю

Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

Фото: r/ChatGPT/Raddit