категории | RSS

На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

Исследователи обнаружили, что ИИ-чатбот R1 компании DeepSeek уязвим для нескольких типов атак, а его функции безопасности не способны предотвратить известные джейлбрейки. Такие джейлбрейки позволяют пользователям обходить ограничения, призванные удержать чатбота от создания вредного или незаконного контента.

Исследователи Cisco протестировали модель DeepSeek, используя стандартные запросы из известной библиотеки HarmBench. Они сосредоточились на таких категориях, как вред, киберпреступность и дезинформация. Модель R1 показала низкие результаты по сравнению с другими моделями, включая модель o1 от OpenAI. Из 50 опробованных джейлбрейков модель не прошла ни одну.

Эксперты по безопасности, например Алекс Поляков из Adversa AI, предупреждает, что, хотя некоторые атаки могут быть исправлены, риски остаются всегда. Он подчеркивает, что модели ИИ нуждаются в постоянном тестировании и мониторинге, чтобы предотвратить использование этих уязвимостей.



Источник новости: www.ferra.ru

DimonVideo
2025-02-02T15:13:01Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика