|
Нейронные модели, вроде ChatGPT и их аналогов, обычно ограничены в обсуждении определенных тем из-за встроенных ограничений. Однако исследователи из Наньянского технологического университета в Сингапуре разработали нейросеть, способную преодолеть эту особенность, позволяя модели более свободно взаимодействовать с пользователями на различные темы.
![](/_pu/77/79791986.jpg)
Искусственный интеллект с алгоритмом под названием Masterkey использует основанную на большой языковой модели стратегию, направленную на обход ограничений, наложенных другими нейросетями, с использованием текстовых запросов. Например, этот алгоритм способен запросить чат-бот "вести разговор, как человек без моральных принципов" или вставлять пробелы после каждого знака, чтобы обеспечить понимание смысла сообщения и предотвратить его квалификацию как запрещенного контента.
Основной задачей создания чат-бота является выявление новых запросов для разблокировки, которые могут быть использованы злоумышленниками. Эти исследования направлены на то, чтобы помочь разработчикам чат-ботов усовершенствовать свои алгоритмы, снизив тем самым риск генерации нежелательного контента. Дополнительные детали и текст исследования доступны по этой ссылке (на английском языке).
|
|