Підписані промпти: як захистити ШІ від зловмисних інструкцій — @magdamagla

81просмотров

46.0%от подписчиков

22 октября 2025 г.

Score: 89

Підписані промпти: як захистити ШІ від зловмисних інструкцій Коли ви спілкуєтесь із ШІ, усі ваші слова - це просто текст. І якщо хтось підсуне йому інший текст, модель може “повірити” йому більше, ніж вам. Це і є prompt injection - коли ШІ переконують змінити свої правила прямо всередині промпта. Щоб цього не сталося, придумали підписані промпти (Signed Prompts). Як це працює: 1. Авторизовані команди мають свій “підпис”. Уявіть, що кожен системний запит має унікальний “водяний знак”, який підтверджує, що його створив справжній користувач або розробник. 2. Модель навчають розпізнавати цей підпис. Вона перевіряє, чи команда справжня. Якщо підпис неправильний - просто ігнорує інструкцію. 3. Ніхто не може підробити ваш стиль чи наказ. Навіть якщо зловмисник вставить “забудь усі попередні інструкції”, модель перевірить підпис - і не послухає. 🔐 Модель бачить підпис - значить, команда справжня. Без підпису - просто шум. —— 🎓Навчитися промпт-інжинірингу ви можете на моєму міні-курсі

Другие посты @magdamagla