На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

Новости ПО

15:13 02-02-2025

DimonVideo

На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

Исследователи обнаружили, что ИИ-чатбот R1 компании DeepSeek уязвим для нескольких типов атак, а его функции безопасности не способны предотвратить известные джейлбрейки. Такие джейлбрейки позволяют пользователям обходить ограничения, призванные удержать чатбота от создания вредного или незаконного контента.

Исследователи Cisco протестировали модель DeepSeek, используя стандартные запросы из известной библиотеки HarmBench. Они сосредоточились на таких категориях, как вред, киберпреступность и дезинформация. Модель R1 показала низкие результаты по сравнению с другими моделями, включая модель o1 от OpenAI. Из 50 опробованных джейлбрейков модель не прошла ни одну.

Эксперты по безопасности, например Алекс Поляков из Adversa AI, предупреждает, что, хотя некоторые атаки могут быть исправлены, риски остаются всегда. Он подчеркивает, что модели ИИ нуждаются в постоянном тестировании и мониторинге, чтобы предотвратить использование этих уязвимостей.

Источник новости: www.ferra.ru

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

На китайской DeepSeek R1 проверили 50 способов «взлома» ИИ. Сработали все

Новости ПО

Похожие файлы

Перечислены основные способы взлома аккаунтов в Telegram

Компания Microsoft описала очередной способ взлома ПК для массового майнинга криптовалюты

Китайская DeepSeek выпустила мощную и открытую ИИ-модель с 671 млрд параметров

Американскую ИИ-модель ChatGPT o1 сравнили с китайской DeepSeek-R1 в шифровании