Was ist der DAN-Modus? Die Snapchat My AI & ChatGPT Jailbreak-Eingabeaufforderung erklärt

click fraud protection

Snapchat-Benutzer haben herausgefunden, wie man My AI mit einer Prompt-Technik jailbreakt, die mit ChatGPT begann: „DAN Mode“. Hier ist, was es bedeutet.

Manche Snapchat Benutzer haben herausgefunden, wie man jailbreakt der Chatbot My AI der Plattform durch Aktivierung von "DAN-Modus." Snapchat veröffentlichte im Februar 2023 erstmals seinen ChatGPT-basierten Konversations-Bot My AI für zahlende Abonnenten. Zwei Monate später stellte Snapchat den Bot allen Nutzern kostenlos zur Verfügung. Während Snap sagt, dass es Sicherheitsvorkehrungen getroffen hat, um zu verhindern, dass die KI unangemessene Gespräche führt, gab es immer noch solche Bedenken hinsichtlich seiner Sicherheit, besonders wenn es von Kindern und Jugendlichen verwendet wird.

DAN-Modus, kurz für „jetzt alles tun“, ist ein ChatGPT-Jailbreak, der es dem KI-Agenten ermöglicht, außerhalb seiner normalen Einschränkungen zu agieren, indem er als Modell mit weniger Einschränkungen Rollenspiele spielt. Mit aktiviertem DAN-Modus ist der Chatbot mehr oder weniger unzensiert und kann auf Fragen antworten, die die KI normalerweise aus ethischen Gründen verweigern würde. Es kann Verschwörungstheorien verbreiten oder beleidigende Meinungen ausspucken. Die Taktik wurde zuerst bei Benutzern von ChatGPT von OpenAI populär und verbreitete sich nach der Veröffentlichung des Bots auf My AI (das von GPT betrieben wird).

Snap hat sich den Jailbreaks verschrieben

Der DAN-Modus wird durch eine Eingabeaufforderung oder eine Reihe von Eingabeaufforderungen aktiviert, von denen mehrere Versionen im Umlauf waren Reddit, Twitter und GitHub seit Monaten. Die Eingabeaufforderungen enthalten Anweisungen, die der Chatbot befolgen muss, wenn er die „vorgeben” Persona eines Regelbrechers. Es ist jedoch nicht immer ein einfacher Austausch; Viele, die den Prozess online beschrieben haben, sagen, dass sie den Chatbot immer wieder daran erinnern müssen, in der Rolle zu bleiben.

Seit der DAN-Modus bei ChatGPT-Benutzern an Bedeutung gewinnt, hat OpenAI Patches herausgegeben, um gegen ihn vorzugehen. Dasselbe scheint mit der von Snapchat verwendeten Version zu passieren. Viele der früheren Eingabeaufforderungen, die den DAN-Modus für ChatGPT und My AI aktiviert haben, werden jetzt von den Bots abgelehnt. Im Gegenzug haben Jailbreaker die DAN-Eingabeaufforderungen optimiert, um neue Beschränkungen zu umgehen. In den sozialen Medien haben Benutzer, die es versucht haben, gemischte Berichte über ihren Erfolg geteilt. In Bildschirm Rant’s Tests sagte der Snapchat-Bot, er könne nicht auf die DAN-Modus-Anfrage antworten, unter Berufung auf seine Programmierung.

Snapchats Meine KI gibt es noch nicht sehr lange und sie wird sich sicher weiter entwickeln Schnapp erfährt mehr darüber wie die Leute es benutzen. Das Unternehmen gibt bereits an, Verbesserungen an den Antworten des Chatbots vorgenommen zu haben, um „unangemessene Anfragen“ und ein Tool zur Alterskennzeichnung einführen, um minderjährige Benutzer besser zu schützen. Aber bisher scheinen clevere Promptschreiber immer einen Schritt voraus zu sein.

Quelle: Reddit, Schnapp