Как избежать рисков с открытым исходным кодом языковых моделей?

Исследователи рассказывают как избежать рисков с открытым исходным кодом языковых моделей

Исследователи из Швейцарии проанализировали 40 проектов LLM с GitHub и сравнили их с 10 проектами LLM из научных журналов, а также дали рекомендации, как выбрать подходящую модель

Автор Вероника Кристер
Редакция linDEAL.
10 месяцев назад

Ученые обнаружили, что большинство проектов LLM с GitHub имеют проблемы с лицензиями, зависимостями, документацией, тестированием и обратной связью, сообщил MarkTechPost 7 июля 2023 года.

Об исследовании

  • Название: How Risky is Your Open Source LLM Project? A Systematic Analysis of Risk Factors in Open Source LLMs (Насколько рискованный ваш проект с открытым исходным кодом для LLM? Систематический анализ факторов риска в открытых исходных кодах для LLM);
  • Авторы: Сейед Мехди Насехи (Seyed Mehdi Nasehi), Мохаммадреза Эсфандиари (Mohammadreza Esfandiari), Мохаммад Гафари (Mohammad Ghafari), Оскар Нирштрас (Oscar Nierstrasz);
  • Цель: оценить риски, связанные с использованием открытых исходных кодов для LLM, и предложить практические рекомендации для улучшения качества и безопасности LLM, чтобы помочь разработчикам и пользователям принимать осознанные решения о том, какие открытые исходные коды использовать, как их адаптировать и как оценивать их результаты;
  • Объекты исследования: открытые исходные коды для LLM, которые были выбраны из GitHub по определенным критериям;
  • Методы: анализ документации, зависимостей, лицензий, тестов и обратной связи.

Выводы

Исследователи пришли к следующим выводам:

  • Открытые исходные коды для LLM имеют различные уровни качества и безопасности, которые зависят от таких элементов, как лицензии, зависимости, документация, тестирование и обратная связь.
  • Большинство проектов LLM не имеют четких лицензий, что может привести к юридическим проблемам и нарушению авторских прав.
  • Такие проекты используют «внешние зависимости», уязвимые или несовместимые с другими библиотеками.
  • Рассмотренные проекты не имеют достаточной документации, которая объясняла бы их цели, функции, архитектуры и результаты, а также они лишены надежных тестов, которые проверяли бы их работоспособность, корректность и эффективность.

Рекомендации

Разработчикам LLM следует:

  • выбирать подходящие лицензии для проектов и соблюдать лицензии других проектов, которые они используют;
  • управлять зависимостями, проверяя их на наличие уязвимостей, обновляя их регулярно и избегая конфликтов;
  • предоставлять качественную документацию, которая описывает их цели, функции, архитектуры и результаты, а также дает инструкции по установке, настройке и использованию;
  • проводить тестирование своих проектов, используя различные метрики и наборы данных, чтобы проверить их работоспособность, корректность и эффективность и т. д.

Теги:

1474

Комментарии (0)

Комментариев еще нет. Будьте первыми, напишите комментарий.

Написать комментарий

Поделитесь с нами своим мнением об этой статье, напишите ваш комментарий, отзыв, рекомендации или вопросы. Нам очень важно, что вы думаете касательно данного материала!

Автор комментарий

Отзывы и комментарии на linDEAL. проходят модерацию в течение нескольких часов.

Читаете еще на linDEAL.

Павел Дуров: биография и история успеха Pavel Durov «Создатель ВКонтакте и Telegram»

Полная история и биография Павла Дурова. Узнайте подробно в чем секрет успеха и как ему удалось стать самым известным человеком в мире. Интересные факты, книги и фильмы

Anonymous: история создания и успеха «Анонимус»

Полная история появления и развития Анонимус. Узнайте подробно в чем секрет успеха Anonymous. Интересные факты, книги и фильмы

Исследователи из Стэнфорда заявляют, что ИИ, генерирующий код, способен создавать уязвимости в системе безопасности

Исследователи проверили деятельность систем генерации кода с помощью профессиональных программистов и начинающих, подтвердив, что ИИ создает уязвимости, которые могут быть незамеченны

Работа в кибербезопасности: 15 топовых профессий с высокой зарплатой в 2024 году

Пятнадцать топовых профессий для работы в кибербезопасности: от разработчика и архитектора до сертифицированного этичного хакера

Новости на linDEAL.

Какой сегодня праздник?

Какие праздники отмечают в этот день в вашей стране или в любой другой стране мира ..
Узнать!

Статьи и Тренды на linDEAL.

Подборки лучших книг

15 книг про программирование
Топ-15 книг про программирование: рейтинг лучших изданий для программистов, IT-специалистов и всех любопытствующих

Пятнадцать лучших книг всех времен и народов, написанных про программирование и для программистов. Бестселлеры, необходимые каждому, кто работает или собирается работать с кодом

ТОП-10 книг, посвященных хакерству
ТОП-10 книг, посвященных хакерству и кибербезопасности

Подборка книг о «черных» и «белых» хакерах расскажет о профессиональных киберпреступниках и специалистах по информационной безопасности и повысит вашу цифровую грамотность

Читайте нас

Не пропускайте важные события и полезные статьи

Еще Исследования

Исследования
10 месяцев
1452
Исследователи утверждают, что люди склонны избегать или принимать риск в соответствии с гендерной принадлежностью ..

Исследователи из Университета Бат обратили внимание на то, как руководствуются решениями представители разных полов, а также постарались определить, кто больше склонен к риску еще ..

Исследования
10 месяцев
2186
Исследователи утверждают, что использование виртуальных валют вырастет более, чем в 3,5 раза к 2030 году ..

Исследователи из Juniper Research разобрались в том, как будут вести себя Стейблкоины и CBDC до 2030 года: очевидно, что их стоимость значительно возрастет, хотя все еще присутствуют риски еще ..

Исследования
10 месяцев
1805
Исследователи утверждают, что почти 80% рабочих мест женщин подвержены риску из-за генеративного ИИ ..

Стало известно о проведении исследования по изучению влияния ИИ на рабочие места женщин и мужчин в разных отраслях и странах: какие выводы и рекомендации опубликовали ученые еще ..

Исследования
10 месяцев
1702
Исследователи обнаружили гормон, который ведет к похудению с помощью активации усиленного расхода энергии ..

Профессор и научный сотрудник Университета Макмастера утверждают, что раскрыли ключевой механизм, способствующий снижению веса и поддержанию сжигания калорий во время диеты еще ..

Исследования
10 месяцев
1608
Исследователи протестировали GPT-4 на предмет обхода блокировки опасных тем ..

Стали известны результаты исследования команды Check Point Research о безопасности и аномалиях GPT-4, системы искусственного интеллекта (ИИ), генерирующей тексты на любую тему еще ..

Исследования
10 месяцев
1631
Исследователи утверждают, что GPT-3 создает убедительную дезинформацию в Twitter ..

Исследователи университета Джорджтауна провели эксперимент, доказав, что модель ИИ GPT-3 создает как точную, так и ложную информацию в виде твитов, и пользователи не видят разницы еще ..

Исследования
10 месяцев
1783
Исследователи прогнозируют многомиллиардные финансовые потери от мошенничества в онлайн-платежах ..

Исследователи прогнозируют потери от мошенничества в онлайн-платежах в размере почти 26 млрд. долларов, причем Китай останется на лидирующем месте по доминированию на рынке мошенничества еще ..

Исследования
10 месяцев
1333
Исследователи утверждают, что ИИ является самой обсуждаемой темой общественности ..

Исследователи обратили внимание на то, что все больше людей постоянно разговаривают о современных технологиях, особенно если речь касается технологии искусственного интеллекта еще ..

Исследования
11 месяцев
2020
Исследователи рассказали, как хакеры используют уязвимость в ПО Accellion, чтобы украсть данные ..

Опытные хакеры целенаправленно эксплуатировали уязвимость в инструменте передачи файлов под названием Accellion, в результате чего украли конфиденциальные данные многих организаций еще ..

Исследования
11 месяцев
2673
Исследователи рассказали, как эффективнее делать перерывы на работе, чтобы лучше и быстрее отдыхать ..

Исследователи в области психологии рассказали, как перерывы на работе влияют на производительность сотрудников, приводя в примеры отсутствие перерывов, а также грамотное их использование. еще ..

Загрузка ..