7 августа 2025 года Open AI выпустила новую модель ИИ — GPT-5. Эта модель заменила прежнюю GPT-4o и другие версии нейросетевых моделей из о-серии.
Чем GPT-5 лучше предшественников
История моделей GPT начиналась с GPT-1, представленной OpenAI в 2018 году. Это была модель с ограниченными способностями и низкой точностью. Ее обучали на книгах и статьях из датасетов коллекции BookCorpus. Тогда компания показала, что модель, предобученную на больших данных, можно использовать для разнообразных NLP-задач.
Улучшенная GPT-2, созданная в 2019, уже могла генерировать длинный связный текст и решать небольшие задачи без дообучения, но допускала частые ошибки и «терялась» в контексте. Ее обучали на наборе данных с веб-страниц Reddit, который назвали WebText.
GPT-3 (2020). Для обучения этой модели использовали few-shot (FSL), то есть обучали ее по принципу «вопрос-ответ» в самом запросе, чтобы модель скопировала формат и логику. Третья версия хорошо справлялась с простыми задачами, но часто ошибалась в сложной логике и могла выдумывать несуществующие факты.
GPT-4 (и GPT-4o). Стала успешнее проходить профессиональные и академические тесты: MMLU, AIME, SWE-bench Verified и т. д. Модель также стала мультимодальной: смогла принимать не только текст, но и изображения. GPT-4o научили работать с голосом и видео в реальном времени.
Что улучшили в GPT-5
Бенчмарки (стандартные тесты) и точность
Сводки по результатам тестирования показывают, что GPT-5 силен в коде и математике, хотя все еще не столь хорош в анализе медицинских сценариев. Модель показала такие результаты: AIME-2025 — 94,6%, SWE-bench Verified — 74,9%, Aider Polyglot — 88%, MMMU — 84,2%, HealthBench — 46,2%.
Интересно, что на презентации GPT-5 заметили ошибки с высотой столбцов в некоторых графиках, за которые потом извинился сотрудник отдела маркетинга OpenAI, Пранав Дешпанде. На официальном сайте ошибки исправили.

Режимы рассуждений и маршрутизация
Модель умеет отвечать коротко и быстро или «думать дольше», если задача непростая. Роутер внутри выбирает режим автоматически. Это экономит время на простых вопросах и повышает качество ответов на сложные.
Мультимодальность
GPT-5 лучше читает схемы, снимки экрана и таблицы. Можно даже отправить на обработку zip-архив с файлами в поддерживаемом формате, модель их обработает и сможет отвечать на запросы в контексте отправленных файлов.

Поведение во время диалога и достоверность
OpenAI сообщили, что у GPT-5 стало меньше «галлюцинаций» и «угодничества». То есть с большей вероятностью модель не станет обманывать пользователя, подменяя факты и соглашаясь с ним «из вежливости».
При этом часть пользователей заметила, что GPT-5 пишет менее «человечным» языком. Также при общении на русском языке он может вставлять в текст существующие или даже выдуманные англицизмы.
Но поведение GPT можно скорректировать инструкциями или кастомизировать специальными настройками личности:
- Выбрать готовый шаблон характера (циник, робот, слушатель или фанат своего дела).

- Либо настроить отдельные черты характера.

Безопасность и этика
OpenAI добавила систему Safe completions — фильтр, который проверяет ответы модели перед тем, как они попадут к пользователю. Задача фильтра — убрать заведомо опасные, токсичные или вводящие в заблуждение фрагменты.
Например:
- Модель стала чаще говорить «не знаю» или «не могу ответить», если вопрос выходит за рамки фактов.
- Если тема связана с медициной, правом или чувствительными вопросами, GPT старается либо уточнить детали, либо предложить безопасный вариант ответа, а не выдавать сомнительный совет.
Режимы (Fast / Instant, Thinking)

В GPT-5 есть разные профили ответов, от которых зависит их скорость, наполненность и качество. Если выбрать режим Auto, то GPT будет сам переключать режимы в зависимости от сложности задачи.
Fast / Instant
Этот профиль дает ответ почти сразу, потому что модель делает меньше внутренних рассуждений. Подходит для коротких объяснений, черновиков, резюмирования, простых вопросов.
Thinking
«Размышления» тратят больше времени на рассуждение и контекст, а затем дают емкий ответ. Это подходит для решения сложных задач по математике и программированию, построения подробных бизнес-планов.
OpenAI гарантируют, что «reasoning-модели», такие как GPT-5 Thinking, хотя и размышляют дольше, но точнее следуют контексту.
Окна контекста и лимиты GPT-5
Окно контекста — это предел объема текста, который модель учитывает в ответе («держит в голове»). Единица измерения — токены.
- Режим быстрого ответа: Free 16K, Plus и Business 32K, Pro и Enterprise 128K.
- Thinking: 196K на всех платных планах.
Например, если у вас Plus и режим быстрого ответа, диалог «вмещает» примерно до 32K токенов. Когда история и подсказки растут, старые части контекста начинают «съедать» лимит.
Планы использования и лимиты сообщений
Что считается «сообщением»? Каждый запрос в чат — это одно сообщение. Ответ модели в лимит не входит. Для каждого тарифного плана свой лимит на количество сообщений.
- Free
До 10 сообщений каждые 5 часов. Доступно 1 сообщение в режиме Thinking в день. - Plus
GPT-5 позволяет отправлять до 3000 сообщений в неделю в режиме Thinking. Хотя ранее их было 200, глава OpenAI Сэм Альтман повысил лимит. При этом автопереключение в Thinking не расходует недельную квоту. - Business
План для небольших команд. Быстрый профиль GPT-5 Fast (или Instant) практически безлимитный при добросовестном использовании (OpenAI применяет антиабуз).
Антиабуз-правила — ограничения, которые OpenAI ввели, чтобы пользователи не перегружали систему и не использовали ее в обход задуманных сценариев. Например, злоупотреблением считается запуск бота, который отправляет тысячи сообщений в минуту. Или, например, нельзя скрейпить сайты скриптами.
Для выбранного вручную Thinking сейчас указан порог до 200 сообщений в неделю (по словам Альтмана на платных тарифах — 3000), но актуальные цифры лучше проверять на сайте.
- Enterprise
Для крупных компаний. GPT дает расширенные гарантии приватности, а данные компании не будут использоваться для дообучения моделей.
Лимиты на доступ к GPT-5 Thinking можно посмотреть на сайте.
- Pro
Это личный «премиум»-план, где также дают ранний доступ к фичам и приоритет по скорости.
В описании плана указано «безлимитный доступ к GPT-5» с оговоркой про антиабуз-правила.
Что происходит, когда лимит запросов Thinking кончается
Если упереться в потолок для режима GPT-5 Thinking, пункт с этой моделью исчезает из меню. Чат сам переключается на более легкую версию — Thinking mini. Как рассказали выше, автопереключение GPT-5 на Thinking внутри режима Auto не тратит недельную квоту.
Поддержка инструментов
GPT-5 работает не только как «чистая модель», но и поддерживает наборы инструментов, встроенные в ChatGPT.
- Веб-поиск
Модель может подключаться к интернету и проверять актуальные данные. Это полезно для поиска новостей, расписаний, цен.

Важно: поиск можно отключить, тогда GPT будет отвечать только на основе своих знаний, которые были получены во время обучения модели.
- Анализ данных
Можно загружать таблицы, CSV или JSON-файлы и запрашивать анализ. GPT-5 построит график, рассчитает статистику и покажет результат. - Анализ изображений и файлов
GPT может принимать скриншоты, фотографии или PDF, а затем «читать» изображение, находить ошибки, переписывать текст или разбирать схемы. Из файлов (Word, PDF и т. д.) GPT-5 извлечет текст и даст пояснения.

- Canvas
Этот режим позволяет редактировать текст прямо в окне как в редакторе. GPT-5 будет предлагать изменения и правки, а вы можете принимать или отклонять их. Затем файл можно будет скачать в формате docx, pdf, md и др.
Минусы: на данный момент не получается вставить картинки или изменить стиль шрифта на не поддерживаемый (всегда используется Aptos).

- Генерация изображений (DALL·E)
Прямо в чате можно попросить сгенерировать картинку и описать сцену словами. GPT-5 вызывает встроенный генератор изображений DALL·E с поддержкой апскейла (увеличения качества) и редактирования.
Сделаем достаточно сложный запрос:
«Нарисуй Чебурашку, который изучает Python на курсах Skillfactory. Стиль — русские сказки».

Модель написала слово Python не полностью и перевернула книгу вверх ногами, но в целом выполнила требования к стилю, сохранила «пропорции» Чебурашки и даже перевела курсы Skillfactory на офлайн формат. Но это заслуга непосредственно модели DALL·E. Мы же разобрались, что GPT-5 умеет с ней работать.
API для разработчиков
В облачном сервисе OpenAI Platform можно выбрать конкретную модель GPT для разработки приложений. API даст доступ к функциям генерации текста, кода, изображений и т. д.
В API есть три версии GPT-5:
- gpt-5 — флагманская версия для глубоких рассуждений и высокой точности.
- gpt-5-mini — компромисс: быстрее и дешевле, подходит для чатов и повседневных задач.
- gpt-5-nano — максимально легкая, с минимальной стоимостью. Подходит для массовых, простых сценариев.
Актуальный список доступных моделей можно получить по специальному эндпойнту.
Для настройки моделей на официальном сайте также можно найти их спецификации, характеристики и параметры (такие как verbosity для длины и формы текста, reasoning_effort для глубины размышлений).
Как начать пользоваться GPT-5
GPT-5 работает в ChatGPT и через OpenAI API (для разработчиков).
Для обычного пользователя
ChatGPT — самый простой способ начать пользоваться GPT-5. Он доступен прямо в приложении ChatGPT (в браузере и мобильных клиентах).
- Достаточно зарегистрироваться на chat.openai.com (работа сайта в России ограничена).

После этого окна откроется чат.
- Рекомендуем сначала изучить базовые материалы о том, что такое ChatGPT и как правильно формулировать запросы (промпты):
Для разработчиков
OpenAI API дает прямой доступ к GPT-5 для встраивания в приложения. Для начала работы нужно:
- Создать аккаунт на OpenAI Platform.
- Выпустить API-ключ в разделе API Keys.
- Установить SDK (openai для Python или Node.js).
- Сделать первый запрос к модели gpt-5, gpt-5-mini или gpt-5-nano.
Документация: API Reference.