Исследователи протестировали GPT-4

Исследователи протестировали GPT-4 на предмет обхода блокировки опасных тем

Стали известны результаты исследования команды Check Point Research о безопасности и аномалиях GPT-4, системы искусственного интеллекта (ИИ), генерирующей тексты на любую тему

Автор Вероника Кристер
Редакция linDEAL.
10 месяцев назад

GPT-4 – это система ИИ, которая может генерировать тексты на любую тему, основываясь на небольшом фрагменте ввода. Она также может быть уязвимой или аномальной, если ее не проверять или не обучать правильно. Исследователи из Check Point Research проверили безопасность и надежность GPT-4, а также выяснили, как его ограничения могут быть обойдены, сообщил Checkpoint 26 июня 2023 года.

Об исследовании

  • Название: Breaking GPT-4 Bad: исследование нарушения границ безопасности, когда машины борются с внутренними конфликтами (Breaking GPT-4 Bad: Check Point Research Exposes How Security Boundaries Can Be Breached as Machines Wrestle with Inner Conflicts)
  • Авторы: Алексей Володин и Одед Вануну, сотрудники Check Point Research, которая занимается исследованием и разработкой в области кибербезопасности
  • Цель: проверка безопасности и надежности GPT-4, выявление того, как ограничения могут быть обойдены
  • Объекты исследования: GPT-4 и его безопасные механизмы

Методика исследования

Исследователи прибегли к нескольким методам изучения объекта, и выделили среди них основные:

  • Экспериментальное тестирование GPT-4 на разных задачах и доменах, таких как написание стихов, рецептов, резюме и т.д.
  • Атаки на GPT-4 посредством переполнения буфера, «SQL-инъекции», XSS и т.д.
  • Анализ поведения чат-бота при получении противоречивой или опасной информации, а также его стратегий борьбы с внутренними конфликтами.
  • Формулирование мер предосторожности для разработчиков и пользователей GPT-4, чтобы предотвратить злоупотребление или неправильное использование системы.

Результаты и выводы

Исследователи пришли к следующим выводам:

  • GPT-4 подвергается различным видам атак, которые нарушают его безопасность, заставляют его делать то, что не должен.
  • GPT-4 может вести себя странно или противоречиво, когда он получает информацию, которая противоречит его знаниям или целям.
  • Чат-бот можно обмануть, используя механизм «двойной узел обхода», который противопоставляет его внутренние мотивации и заставляет отображать опасную информацию.
  • GPT-4 не является надежным или безопасным инструментом, и что нужно быть осторожным при его использовании.
  • Разработчикам и пользователям GPT-4 нужно применять различные меры предосторожности, такие как проверка данных, ограничение доступа, мониторинг поведения и обучение этическим принципам.

Рекомендации

Согласно результатам, были озвучены следующие рекомендации:

  • Проверять входные и выходные данные на наличие аномалий или вредоносного кода, чтобы предотвратить атаки или утечки информации.
  • Ограничивать доступ к GPT-4 и его данным только для доверенных лиц или организаций, чтобы предотвратить злоупотребление или неправильное использование системы.
  • Следить за поведением GPT-4 и его соответствие ожиданиям и целям, чтобы обнаружить аномалии или конфликты и принять меры по их устранению.
  • Обучать GPT-4 этическим и безопасным принципам и правилам, чтобы предотвратить нежелательное или опасное поведение системы.

Теги:

1598

Комментарии (0)

Комментариев еще нет. Будьте первыми, напишите комментарий.

Написать комментарий

Поделитесь с нами своим мнением об этой статье, напишите ваш комментарий, отзыв, рекомендации или вопросы. Нам очень важно, что вы думаете касательно данного материала!

Автор комментарий

Отзывы и комментарии на linDEAL. проходят модерацию в течение нескольких часов.

Читаете еще на linDEAL.

Джефф Хокинс: история успеха и биография «Основатель Palm Computing и Handspring»

Полная история успеха и биография Джеффа Хокинса. Узнайте подробно в чем секрет его успеха, а также интересные факты об основателе Palm Computing и Handspring

Конференция по инновациям The Age Innovation Summit 2022, 11 августа

Флагманское технологическое мероприятие The Age Innovation Summit 2022 пройдет 11 августа в Мельбурне, Австралия

ТОП-10 книг, посвященных хакерству и кибербезопасности

Подборка книг о «черных» и «белых» хакерах расскажет о профессиональных киберпреступниках и специалистах по информационной безопасности и повысит вашу цифровую грамотность

Новости на linDEAL.

Какой сегодня праздник?

Какие праздники отмечают в этот день в вашей стране или в любой другой стране мира ..
Узнать!

Статьи и Тренды на linDEAL.

Подборки лучших книг

Топ-20 новых книг нон-фикшн (non-fiction)
Топ-20 новых книг нон-фикшн (non-fiction): лучшая нехудожественная литература 2023 года

Двадцать лучших книг non-fiction, вышедших в 2023 году. Полный обзор с кратким описанием, объемом произведения, временем на прочтение и интересными фактами

15 лучших книг про искусственный интеллект
ТОП-15 лучших книг про искусственный интеллект

Искусственный интеллект управляет авто, распознает лица, читает книги и даже учится шутить. Мы подготовили подборку книг, которые помогут разобраться в том, что такое AI и ML, как они работают и для чего нужны

15 лучших книг про аппаратное обеспечение
ТОП-15 лучших книг про аппаратное обеспечение

В подборке, вы найдете, как базовые книги для новичков, так и более продвинутые издания для профи. Всё самое интересное про аппаратное обеспечение — смотрите в нашей сегодняшней статье

ТОП-10 лучших книг по NFT
ТОП-10 лучших книг по невзаимозаменяемым токенам (NFT)

В нашей сегодняшней подборке вы найдете массу полезной и интересной информации, посвященной невзаимозаменяемым токенам (NFT), их созданию, хранению и продаже. Присоединяйтесь - будет интересно!

ТОП-15 лучших книг по геймингу
ТОП-15 лучших книг по геймингу и видеоиграм

Предлагаем вашему вниманию подборку актуальных книг по программированию, геймдизайну и концепт-арту для новичков и бывалых бойцов геймдева. Все, что стоит знать об этой индустрии

10 лучших книг о криптовалюте и блокчейне
ТОП-10 лучших книг о криптовалюте и блокчейне

Можно записаться на курсы или прослушать подкасты, но если вы рассчитываете самостоятельно вникнуть в тему криптовалюты - наша сегодняшняя подборка книг о цифровых деньгах создана специально для вас

Читайте нас

Не пропускайте важные события и полезные статьи

Еще Исследования

Исследования
10 месяцев
1623
Исследователи утверждают, что GPT-3 создает убедительную дезинформацию в Twitter ..

Исследователи университета Джорджтауна провели эксперимент, доказав, что модель ИИ GPT-3 создает как точную, так и ложную информацию в виде твитов, и пользователи не видят разницы еще ..

Исследования
10 месяцев
1780
Исследователи прогнозируют многомиллиардные финансовые потери от мошенничества в онлайн-платежах ..

Исследователи прогнозируют потери от мошенничества в онлайн-платежах в размере почти 26 млрд. долларов, причем Китай останется на лидирующем месте по доминированию на рынке мошенничества еще ..

Исследования
10 месяцев
1328
Исследователи утверждают, что ИИ является самой обсуждаемой темой общественности ..

Исследователи обратили внимание на то, что все больше людей постоянно разговаривают о современных технологиях, особенно если речь касается технологии искусственного интеллекта еще ..

Исследования
10 месяцев
2019
Исследователи рассказали, как хакеры используют уязвимость в ПО Accellion, чтобы украсть данные ..

Опытные хакеры целенаправленно эксплуатировали уязвимость в инструменте передачи файлов под названием Accellion, в результате чего украли конфиденциальные данные многих организаций еще ..

Исследования
11 месяцев
2657
Исследователи рассказали, как эффективнее делать перерывы на работе, чтобы лучше и быстрее отдыхать ..

Исследователи в области психологии рассказали, как перерывы на работе влияют на производительность сотрудников, приводя в примеры отсутствие перерывов, а также грамотное их использование. еще ..

Исследования
11 месяцев
2261
Исследователи из США и Великобритании назвали препарат от Pfizer, который оказался эффективным для похудения ..

Стало известно, что новый препарат от Pfizer для похудения может быть таким же эффективным, как и инъекция Ozempic от Novo Nordisk: к этому пришли британские и американские ученые еще ..

Исследования
11 месяцев
2759
Исследователи утверждают, что общение с младенцами может помочь сформировать структуру развивающегося мозга ..

Исследования доказали существование пользы от разговоров родителей с маленькими детьми, которые помогают малышам лучше понимать язык и быстрее увеличить словарный запас еще ..

Исследователи утверждают, что жирафы имеют склонность к статистическим рассуждениям, т. е. умению делать осознанный выбор ..

Ученые проверили способности жирафов использовать статистические рассуждения для выбора между двумя контейнерами с разным соотношением предпочтительных и нежелательных продуктов еще ..

Американские исследователи утверждают, что обычные потребительские товары выделяют токсичные соединения ..

Исследование рассказывает о том, какие химические вещества в товарах для дома и личной гигиены могут быть опасны для здоровья и окружающей среды еще ..

Исследователи утверждают, что Twitter причастен к краху банка Кремниевой долины ..

Исследователи провели ряд анализов и обнаружили, что социальные сети могут влиять на финансовое состояние некоторых наименований, и привели примеры воздействия Twitter на банк Кремниевой долины еще ..

Загрузка ..