Новости AiBox

GPT-OSS: Новая эра открытых моделей искусственного интеллекта от OpenAI

новости Ai
OpenAI произвела революцию на рынке ИИ, выпустив GPT-OSS — первые модели с открытыми весами за шесть лет. Эти мощные языковые модели стали настоящим прорывом в области доступного искусственного интеллекта, предоставив разработчикам и исследователям возможность локального запуска передовых ИИ-систем.

Что такое GPT-OSS и почему это революционно

GPT-OSS (GPT Open Source Software) представляет собой семейство из двух высокопроизводительных моделей искусственного интеллекта: gpt-oss-120b и gpt-oss-20b. Впервые с момента выпуска GPT-2 в 2019 году OpenAI предоставляет полный доступ к весам модели под лицензией Apache 2.0, что позволяет свободное использование, модификацию и коммерческое применение.
Главное преимущество GPT-OSS заключается в возможности локального запуска без необходимости подключения к облачным сервисам OpenAI. Это обеспечивает полный контроль над данными, повышенную приватность и отсутствие ограничений по запросам.

Технические характеристики и возможности

GPT-OSS-120B: Флагманская модель

GPT-OSS-120B — это мощная модель с 117 миллиардами параметров, из которых активными являются лишь 5,1 миллиарда на токенблагодаря архитектуре Mixture-of-Experts (MoE). Модель способна работать на одной GPU с 80 ГБ видеопамяти (например, NVIDIA H100) и демонстрирует производительность, сопоставимую с закрытыми моделями o4-mini.

GPT-OSS-20B: Компактная версия для массового использования

GPT-OSS-20B содержит 21 миллиард параметров с 3,6 миллиардами активных на токен. Уникальность этой модели заключается в возможности запуска на обычных компьютерах с всего 16 ГБ оперативной памяти, что делает передовые ИИ-технологии доступными для широкого круга пользователей.

Ключевые технические особенности

Обе модели поддерживают:
  • Контекстное окно до 128,000 токенов для работы с большими документами
  • Настраиваемые уровни рассуждений (low, medium, high) для балансировки скорости и качества
  • Полную цепочку рассуждений (Chain-of-Thought) для прозрачности мыслительного процесса
  • Агентские возможности включая веб-поиск, выполнение Python-кода и работу с инструментами
  • Структурированные выходные данные в формате JSON

Производительность и бенчмарки

Математические способности

В тестах AIME 2024 GPT-OSS продемонстрировал выдающиеся результаты:
  • GPT-OSS-120B: 96,6% с инструментами
  • GPT-OSS-20B: 96,0% с инструментами
Эти показатели сопоставимы с производительностью топовых закрытых моделей OpenAI.

Программирование

На платформе Codeforces модели показали высокий рейтинг:
  • GPT-OSS-120B: 2622 балла
  • GPT-OSS-20B: 2516 баллов

Общие знания и рассуждения

В тесте MMLU (Massive Multitask Language Understanding):
  • GPT-OSS-120B: 90,0% на высоком уровне рассуждений
  • GPT-OSS-20B: 85,3%

Лицензирование и коммерческое использование

GPT-OSS распространяется под лицензией Apache 2.0, которая предоставляет максимальную свободу использования. Разработчики могут:
  • Использовать модели бесплатно для любых целей, включая коммерческие
  • Модифицировать и адаптировать под специфические задачи
  • Распространять модифицированные версии
  • Создавать собственные продукты без необходимости получения разрешений от OpenAI

Безопасность и ограничения

OpenAI провела тщательное тестирование моделей на предмет безопасности согласно Preparedness Framework. Компания подтвердила, что даже при злонамеренной донастройке модели не достигают критического уровня опасности в областях биологических угроз и кибербезопасности.

Текущие ограничения

  • Только текстовый ввод/вывод — модели не поддерживают изображения или аудио
  • Повышенная склонность к галлюцинациям по сравнению с закрытыми моделями (49-53% против 16-36%)
  • Знания ограничены маем 2024 года

Значение для индустрии ИИ

Выпуск GPT-OSS знаменует важный поворот в стратегии OpenAI от полностью закрытой экосистемы к частичной открытости. Это решение продиктовано растущей конкуренцией со стороны китайских лабораторий (DeepSeek, Qwen) и давлением администрации Трампа на американские ИИ-компании
GPT-OSS открывает новые возможности:
  • Демократизацию ИИ для малых компаний и стартапов
  • Локальную обработку конфиденциальных данных
  • Создание специализированных отраслевых решений
  • Исследования в области безопасности ИИ
GPT-OSS представляет собой значительный шаг в развитии открытых ИИ-технологий. Сочетая производительность уровня GPT-4 с доступностью локального запуска, эти модели обещают ускорить внедрение ИИ в различных отраслях. Несмотря на некоторые ограничения, GPT-OSS становится мощным инструментом для разработчиков, желающих получить полный контроль над своими ИИ-решениями без компромиссов в качестве.