Помимо коллекции Elder Plinius, для тестирования GenAI-модел — @kokuykin

@kokuykin1.8K подп.

660просмотров

37.6%от подписчиков

17 марта 2026 г.

Score: 726

Помимо коллекции Elder Plinius, для тестирования GenAI-моделей могут быть полезны и другие наборы harm-запросов: aya_redteaming, AdvBench, XSTest, ToxicChat, WildJailbreak, Do-Not-Answer. С промпт-атаками на агентные системы всё сложнее из-за вариативности таких систем. Мы в AI Security Lab экспериментируем в этом направлении и как-нибудь напишем подробнее.

660

просмотров

361

символов

Нет

эмодзи

Нет

медиа

Другие посты @kokuykin

AI red teaming постепенно становится отдельным рынком. Это видно и по покупке команды PromptFoo гига👁 1.6K Новый инцидент, связанный с утечкой данных из AI-ассистента консалтинговой компании McKinsey. Исслед👁 913 Деанонимизация с LLM стала дешевле и быстрее. В новой статье исследователей из ETH Zurich, при соавт👁 909 Во вторник проведем вебинар об уязвимостях AI-систем и подходах к их тестированию. Поговорим про: 🔹👁 879 В свежем выпуске журнала AI Cyber вышла наша статья про новый релиз OWASP Top 10 for Agentic Applica👁 823

Все посты канала →

Аналитика канала База постов