Краткое изложение
К середине 2025 года ландшафт языковых моделей претерпел кардинальную трансформацию. Произошёл качественный скачок от моделей-помощников к проактивным, автономным системам. Основные тренды — глубокая мультимодальность (бесшовная работа с текстом, кодом, изображениями, аудио и видео в рамках одного запроса) и развитие «агентов» — ИИ, способных самостоятельно планировать и выполнять сложные многошаговые задачи.
Конкуренция обострилась по всем фронтам: глобальные игроки выпускают новые флагманские модели, а китайские и российские разработчики не только сокращают отставание, но и лидируют в отдельных нишах. Представляем вам углублённое исследование и обновлённую, многоуровневую классификацию языковых моделей по состоянию на 2025 год, отражающую их эволюцию от простых генераторов текста до полноценных цифровых сотрудников.
Новая парадигма 2025: от генерации к исполнению
Если в 2023-2024 годах основной функцией LLM была генерация контента по запросу, то в 2025 году акцент сместился на исполнение. Ведущие модели теперь не просто пишут код — они могут развернуть веб-приложение. Не просто анализируют данные — создают интерактивный дашборд и отправляют его по почте. Этот сдвиг стал возможен благодаря трём ключевым факторам:
Созревание агентных архитектур
Системы научились декомпозировать сложные цели на подзадачи, выбирать и использовать цифровые инструменты (браузер, редактор кода, API) и самокорректироваться в процессе выполнения.
Истинная мультимодальность
Модели теперь нативно понимают и генерируют различные типы данных, что позволяет создавать сложные артефакты вроде видеопрезентаций с озвучкой.
Рост специализированных моделей
Наряду с универсальными флагманами появились высокоспециализированные модели, демонстрирующие исключительную производительность в конкретных доменах вроде кодинга или научного анализа.
Обновлённая классификация возможностей моделей ИИ (2025)
Базовая генерация текста
Функциональность: Ответы на вопросы, написание простых текстов, суммаризация. Это стало базовым гигиеническим требованием для любой модели.
Модели:
Ранние версии GPT-3.5, Llama 2, первые итерации YandexGPT и GigaChat, плюс множество более мелких специализированных моделей.
Продвинутое рассуждение и создание артефактов
Функциональность: Решение многошаговых логических задач, следование сложным инструкциям, генерация кода для создания документов (.docx, .xlsx, .pdf), написание качественных текстов в разных стилях.
Глобальные модели:
GPT-4, Claude 3, Gemini 1.5 Pro
Российские модели:
YandexGPT 3, GigaChat 2.0
Китайские модели:
ERNIE 4.0, Qwen2, Zhipu GLM-4
Сложный анализ и мультимодальное взаимодействие
Функциональность: Анализ ультрадлинных контекстов (сотни страниц текста, целые кодовые базы), одновременная обработка текста, изображений и аудио. Генерация кода для сложных визуализаций и фронтенд-компонентов.
Глобальные модели:
GPT-4o, Claude 3.5 Sonnet, Gemini 2.5 Pro
Российские модели:
YandexGPT 4 (релиз конца 2024)
Китайские модели:
Kimi (Moonshot AI), DeepSeek-V3
Разработка приложений (помощь Frontend/Backend)
Функциональность: Генерация кода для полноценных веб-страниц, мини-приложений и серверной логики (API, работа с базами данных). Модель выступает как квалифицированный «со-пилот» для разработчика.
Глобальные модели:
Claude 4 Opus, GPT-4.5, Gemini 2.5 Pro
Российские модели:
YandexGPT 4 Pro, GigaChat 2 MAX
Китайские модели:
DeepSeek-Coder V3, Qwen3
Мультимодальная генерация проектов
Функциональность: Создание сложных, многокомпонентных проектов из одного запроса. Пример: «Проанализируй этот отчёт (PDF), сделай презентацию (PPTX) с ключевыми выводами и запиши 2-минутное аудио-резюме».
Глобальные модели:
Gemini 2.5 Pro, GPT-4o, Llama 4
Российские модели:
GigaChat с Kandinsky
Китайские модели:
ERNIE 5.0 (анонс)
Автономные ИИ-агенты
Функциональность: Самостоятельное выполнение сложных задач. Пользователь ставит конечную цель, а агент сам планирует шаги, ищет информацию в интернете, пишет и отлаживает код, взаимодействует с веб-сервисами и предоставляет готовый результат.
Глобальные решения:
Devin AI, GPT-5 (ожидается), Claude 4 Agents
Российские решения:
В разработке (GigaChat на МКС)
Китайские решения:
Manus AI, Kimi K2
Итоговая таблица классификации (середина 2025)
| Уровень | Описание | Глобальные модели | Российские модели | Китайские модели |
|---|---|---|---|---|
| 1-2 | Текст, рассуждения, простые артефакты | GPT-4, Claude 3, Llama 3 | YandexGPT 3, GigaChat 2.0 | ERNIE 4.0, Qwen2, Zhipu GLM-4 |
| 3 | Сложный анализ и мультимодальность | GPT-4o, Claude 3.5, Gemini 1.5 Pro/2.0 | YandexGPT 4 | Kimi, DeepSeek-V3 |
| 4 | Помощь в full-stack разработке | Claude 4 Opus, GPT-4.5, Gemini 2.5 Pro | YandexGPT 4 Pro, GigaChat 2 MAX | DeepSeek-Coder V3, Qwen3 |
| 5 | Создание мультимодальных проектов | Gemini 2.5 Pro, Llama 4 | GigaChat (с Kandinsky) | ERNIE 5.0 (анонс) |
| 6 | Автономные агенты (выполнение проектов) | Devin AI, GPT-5 (ожидается), Claude 4 Agents | В разработке (GigaChat на МКС) | Manus AI, Kimi K2 |
Концепция "AI Dream Team": Оркестрация вместо запросов
Переход от классификации моделей к реальным рабочим процессам — это ключевой шаг. В 2025 году создание сложных проектов с помощью ИИ напоминает управление командой высококлассных специалистов, где у каждого своя уникальная роль.
Современный подход заключается в том, чтобы не искать одну "идеальную" модель, а собирать проектную команду из ИИ, где человек выступает в роли тимлида или продюсера.
AI-Стратег
GPT-4o, Claude 4 Opus
Задает общую структуру, проводит декомпозицию задачи, пишет высокоуровневый план.
AI-Аналитик
Kimi, Gemini 2.5
Обрабатывает огромные массивы данных, находит инсайты в сотнях страниц документов.
AI-Разработчик
DeepSeek-Coder, Claude 4
Пишет чистый, сложный и эффективный код.
AI-Локализатор
YandexGPT 4
Адаптирует контент под культурные и языковые особенности конкретного рынка.
AI-Креатор
Gemini 2.5, GigaChat+Kandinsky
Генерирует визуальный и аудио-контент.
AI-Исполнитель
Manus, Devin
Автономно выполняет рутинные и комплексные задачи по развертыванию, мониторингу и тестированию.