Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник: 3dnews.ru

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Теперь только некстген: Microsoft прекратила поддержку Xbox One новыми играми от внутренних студий

Microsoft добавила в Xbox Game Pass в 2023 году игр суммарно почти на 9 тысяч долларов

Вышла демоверсия Portal 64 — это демейк головоломки от Valve для Nintendo 64

Microsoft: Sony всё ещё выступает против сделки с Activision Blizzard и пытается вставлять палки в колеса

Xbox Game Pass предложит в 2024 году множество релизов первого дня — уже подтверждено 40 игр

Акции технологических компаний с лихвой отыграли спад 2022 года

Sapphire представила модификацию Radeon RX 6750 GRE, которая на 50 % быстрее RTX 4060 при той же цене

«Новогодний подарок боярам»: разработчики «Смуты» наконец показали геймплей, но совсем чуть-чуть

Самый протяжённый в мире подводно-подземный кабель соединил Великобританию и Данию

«Джеймс Уэбб» разглядел в огромной древней галактике шесть галактик меньшего размера

Одолевшая Team Spirit команда Virtus pro прошла в плей-офф BetBoom Dacha по CS2

Team Spirit победила на BetBoom Dacha по Counter-Strike 2

NaVi и Cloud9 вышли в плей-офф BLAST Premier World Final 2023 по CS 2