Все статьи

AI-агенты в 2026: Claude 4.7, GPT-5.4 и что это даёт бизнесу

Содержание
Коротко: за последние полгода вышли Claude Opus 4.7 (16.04.2026), GPT-5.4 (5.03.2026) и Gemini 3.1 Pro. Главное отличие от старых чат-ботов - они уже не отвечают на вопросы, а выполняют задачи часами: сами пишут код, обходят системы, вызывают инструменты, проверяют результат. Для малого бизнеса это первый год, когда AI-агент реально окупает себя без многомиллионного бюджета.

В прошлом ноябре мы подключили клиенту бот на YandexGPT. Отличный бот: отвечает на вопросы, собирает заявки, передаёт в CRM. Классическая связка, я писал про такую в статье про Telegram-ботов.

Через пять месяцев этот же клиент пришёл снова. Попросил "агента". Не чат-бота, а именно агента. Который не просто отвечает, а сам разбирается в задаче: вытаскивает данные из 1С, сверяет остатки, сам формирует подборку товаров под запрос клиента, сам пишет письмо с персональной ценой. Всё без участия менеджера.

Пять месяцев назад я бы объяснил, что это задача на 1-2 млн руб. и три месяца разработки. Сейчас - 300 тыс. и полтора месяца. Потому что в апреле 2026 вышла модель, которая умеет это из коробки.

Что сломалось в AI за последние полгода

Раньше я говорил клиентам: "Нейросеть - это калькулятор для текста. Она отвечает на один вопрос за раз. Задачу поставил - ответ получил. Следующую задачу - новый запрос".

Сейчас это неправда.

Claude Opus 4.7, вышедший 16 апреля 2026, держит многочасовой рабочий сеанс. Получает задачу - например, "переписать авторизацию в этом проекте и добавить двухфакторку" - и работает. Час, два, четыре. Сам проверяет, что сделал. Сам исправляет ошибки. Сам решает, какие инструменты подключить. Результат - готовый патч на разбор.

GPT-5.4 от OpenAI, вышедшая 5 марта 2026, выбила рекорды в бенчмарках computer-use: умеет работать с интерфейсами сайтов и приложений почти как человек с мышкой. Заходит в CRM, кликает, заполняет, экспортирует. 83% в тесте GDPval на реальных задачах knowledge-work - это уровень middle-специалиста на рутинных операциях.

Google Gemini 3.1 Pro - контекст в 1 миллион токенов (это где-то 700 страниц текста или целый репозиторий кода разом). Можно дать ей весь ваш сайт и попросить найти все упоминания одного продукта вместе с контекстом. За одну итерацию.

Вот суть сдвига, если собрать одним предложением. Раньше AI отвечал - сейчас делает.

Ключевые цифры: кто из них что умеет

Модель Вышла SWE-bench Pro (код) GPQA Diamond (логика) Цена input / output на 1M токенов
Claude Opus 4.7 16.04.2026 64.3% 94.2% $5 / $25
GPT-5.4 05.03.2026 57.7% 94.4% $2.5 / $15
Gemini 3.1 Pro 19.02.2026 80.6% (Verified) 94.3% $2 / $12
YandexGPT 5.1 Pro 08.2025 н/д н/д 0.80 руб. за 1000 токенов

Цифры в таблице - из Finout, LLM Stats и Yandex AI Studio.

Кого выбирать? Зависит от задачи, и это не отговорка.

Для разработки кода и длинных агентских цепочек - Claude Opus 4.7, без вариантов. GPT-5.4 дешевле и отлично работает с интерфейсами (computer-use). Gemini 3.1 Pro - дешевле всех и с огромным контекстом, хороша для анализа документов и "скорми всё, что есть". YandexGPT 5.1 Pro - для русского языка и работы с персональными данными клиентов по российскому закону.

Кстати, про цену Claude есть нюанс. Anthropic в апреле ввели новый токенизатор, и один и тот же текст может занимать на 35% больше токенов против Opus 4.6. На словах цена не изменилась - на практике счёт за API вырос.

Что такое AI-агент и чем он отличается от чат-бота

Чат-бот - это калькулятор. Задал вопрос - получил ответ. Новый вопрос - новый ответ. Бот не помнит, что было три шага назад, и не пойдёт ничего проверять сам.

Агент устроен иначе. Он получает цель (не вопрос, а именно цель: "обработать заявку от клиента Иванова"), строит план из нескольких шагов, вызывает инструменты (API, базы данных, файлы, внешние сервисы), смотрит на результат каждого шага и корректирует план. Если первый шаг не сработал - пробует второй путь. Если нужна дополнительная информация - идёт и запрашивает её.

Простейший пример агента, который мы делаем для клиентов сейчас. Предприниматель получает в Telegram заявку: "нужны лампы E27 на склад, 200 шт., срок до пятницы". Дальше запускается агент:

  1. Ищет лампы E27 в каталоге клиента. Находит 14 моделей
  2. Проверяет остатки у трёх поставщиков через их API
  3. Считает итоговую стоимость с учётом логистики
  4. Формирует Excel с тремя вариантами (эконом, средний, премиум)
  5. Отправляет файл обратно в Telegram с коротким описанием каждого варианта

Всё за 45 секунд. Без участия менеджера. Менеджер потратил бы 20-30 минут на то же самое. Это и называется агентная работа.

Что малый бизнес уже делает с AI-агентами прямо сейчас

На февраль-март 2026 у нас в продакшене работают несколько типов.

Автоматическая подготовка коммерческих предложений. Агент получает бриф клиента, достаёт данные из CRM о похожих проектах, собирает релевантные кейсы, готовит PDF с персональной сметой. Менеджер получает готовый документ и проверяет перед отправкой. Время на одно КП упало с 40-60 мин. до 5-7.

Квалификация входящих лидов. Заявка приходит - агент задаёт уточняющие вопросы, определяет бюджет, сроки, реальную потребность. В CRM менеджер видит не "позвонить Ивану", а структурированную карточку: "Иван, Москва, ремонт двухкомнатной, бюджет 800к, срок 2 месяца, нужен дизайн-проект, готов обсуждать предоплату". Менеджер звонит уже в курсе дела.

Мониторинг цен конкурентов. Агент раз в день обходит 20-30 сайтов, фиксирует изменения, сравнивает со своим прайсом, пишет в Telegram: "у Иванова в "Санкомфорте" унитаз Gustavsberg 4321 упал до 19 900, у нас 22 800 - рассмотрите". Не просто парсинг - агент видит контекст и рекомендует действие.

Обработка документов. Бухгалтерия получает 50 актов в месяц из разных источников - PDF, сканы, Excel. Агент читает каждый, извлекает реквизиты, суммы, даты, проверяет сверку с 1С. В сложных случаях отмечает "нужна проверка человеком". Экономит 2-3 дня работы в месяц.

И это всё - не корпоративные проекты за миллионы. Средний проект сейчас - 250-400 тыс. на разработку и 10-20 тыс./мес на API и сервер.

Яндекс не отстаёт: YandexGPT 5.1 Pro в рублях

Пока весь мир обсуждает Claude 4.7, Яндекс в августе 2025 тихо выкатил YandexGPT 5.1 Pro. Модель сделали в разы дешевле по сравнению с премиум-линейкой от Anthropic и OpenAI: 0.80 ₽ за 1000 токенов в синхронном режиме.

Это ломает экономику. Возьмём реальный пример: Telegram-бот поддержки обрабатывает 500 диалогов в день, в среднем 1500 токенов на диалог (1000 input + 500 output). Итого 22.5 млн токенов в месяц. При курсе ~90 руб. за доллар:

  • Claude Opus 4.7: около 23 000 руб./мес ($5/$25 за 1M токенов)
  • GPT-5.4: около 13 500 руб./мес ($2.5/$15)
  • Gemini 3.1 Pro: около 10 800 руб./мес ($2/$12)
  • YandexGPT 5.1 Pro: 18 000 руб./мес (в рублях, без пересчётов)

Выглядит так, что YandexGPT - не самая дешёвая по счёту. Но посчитайте что туда не входит: зарубежный аккаунт с иностранной картой, конвертации валюты, риски блокировки платежа, нарушение 152-ФЗ при обработке персональных данных клиентов из РФ. А в асинхронном режиме (когда ответ не нужен мгновенно) Yandex Cloud даёт цену вдвое ниже - 0.40 ₽ за 1000 токенов.

Надёжнее именно YandexGPT работает и на русском языке. Я тестировал одну и ту же фразу "скока стоит масажь спины" на четырёх моделях - YandexGPT сразу поняла суть, Claude переспросил, GPT-5.4 иногда путался в опечатках. Небольшая деталь, но 80% сообщений от реальных клиентов содержат опечатки и разговорные формы.

Где агент провалится

Я намеренно не пишу "AI-агент решит все ваши проблемы". Потому что не решит.

Первое - он не понимает контекст вашего бизнеса без настройки. Если вы не подготовили системный промпт, базу знаний, примеры типовых ответов - агент будет нести общие слова. Подготовка такой базы занимает 2-4 недели и часто бывает сложнее разработки самого агента.

Второе - он ломается на необычных случаях. Клиент написал странное, в базе такого не было, агент отвечает шаблонно. Особенно больно, если клиент уже злой и ему нужен человек. Правило простое: если в сообщении детектируются эмоции недовольства, агент передаёт живому менеджеру. Это не опция, это обязательно.

Третье - дорогие продажи. Квартиру за 8 миллионов, корпоративный софт за 500 тысяч, услуги юриста на крупное дело - это не про агента. Здесь нужен живой человек, доверие, индивидуальный подход. Агент может квалифицировать лид и подготовить встречу, но закрывать сделку - работа людей.

И да - агенты врут. Реже, чем раньше (Claude 4.7 вдвое реже галлюцинирует по сравнению с предыдущей моделью), но всё же врут. Если агент выдаёт клиенту цену - она должна приходить из вашей CRM, а не из головы модели. Если дату доставки - из API логистов. Никогда не давайте модели "придумывать факты" - только извлекать из проверенных источников.

Сколько стоит запустить AI-агента в 2026

Типовой проект для малого бизнеса сейчас выглядит так.

Этап Стоимость Срок
Анализ задач и проектирование сценариев 30 000 - 80 000 руб. 1-2 недели
Разработка агента с интеграциями (CRM, Telegram, 1C) 150 000 - 400 000 руб. 3-6 недель
Подготовка базы знаний, промптов, тестирование 50 000 - 120 000 руб. 2-3 недели
API (YandexGPT/Claude/GPT) 5 000 - 25 000 руб./мес -
Сервер (Timeweb Cloud, Yandex Cloud) 1 500 - 5 000 руб./мес -
Поддержка и донастройка 10 000 - 30 000 руб./мес -

Итого: от 230 000 руб. разработка плюс 16 500 - 60 000 руб./мес содержание.

Окупаемость зависит от потока. Если в день приходит 10-15 обращений - агент не нужен, справитесь силами менеджера. От 30-50 в день - уже смысл есть. От 100 - абсолютно точно.

Вот простая арифметика. Менеджер-оператор на полную ставку - 40-60 тыс. в месяц плюс налоги и оборудование, итого около 80 тыс. "в руках". Работает 8 часов. Агент работает 24/7 и обходится в 40-50 тыс./мес со всеми расходами. При сопоставимом покрытии обращений разница - ×2 в пользу агента.

Что делать прямо сейчас

Если у вас малый бизнес и вы смотрите на всё это как на хайп - в этот раз не хайп. За последние 6 месяцев стоимость AI-агента упала в 3-4 раза, а качество - выросло на порядок. Это уже не игрушка для FAANG, это рабочий инструмент для предпринимателя со штатом в 10-50 человек.

Начните с одной задачи, где у вас больше всего рутины: входящие заявки, коммерческие предложения, ответы на типовые вопросы клиентов. Не пытайтесь автоматизировать всё сразу - выберите одну операцию, посчитайте сколько часов менеджеров на неё уходит, и посмотрите, ляжет ли агент на задачу.

А выбор модели - не головная боль. В 80% случаев YandexGPT закроет задачу за копейки. Claude и GPT берите только когда задача реально сложная: много логики, длинные цепочки рассуждений, работа с кодом. И если хотите проверить конкретно вашу задачу - напишите нам, посчитаем.

Частые вопросы

Чем AI-агент отличается от обычного чат-бота?

Чат-бот отвечает на один вопрос и ждёт следующий. Агент получает цель и выполняет её сам: вызывает API, читает файлы, проверяет результат, возвращается и корректирует. Claude Opus 4.7 способен работать часами над одной задачей без участия человека. Разница как между калькулятором и стажёром.

Claude и GPT доступны из России?

Прямого доступа нет - оплата картами РФ не проходит. Варианты: российские провайдеры-посредники, облачные платформы (AWS Bedrock, Vertex AI, Microsoft Foundry) с иностранной картой, либо через свой зарубежный юрлицо. Для обработки персональных данных клиентов нужен YandexGPT - иначе 152-ФЗ нарушается.

Сколько стоит запустить AI-агента для малого бизнеса?

Разработка - 230 000 - 600 000 руб. в зависимости от сложности. Ежемесячно 16 500 - 60 000 руб. на API, сервер и поддержку. Окупается обычно за 2-4 месяца при потоке от 30-50 обращений в день.

YandexGPT хуже зарубежных моделей?

На англоязычных бенчмарках - да, отстаёт. На русских диалогах, коротких сообщениях с опечатками и разговорным языком - сопоставимо с Claude. Для типовых задач поддержки и продаж разница не видна ни клиенту, ни владельцу бизнеса. При этом YandexGPT дешевле Claude, оплата в рублях и данные остаются в РФ - три аргумента для малого бизнеса перевешивают любую разницу в бенчмарках.

Заменит ли AI-агент менеджера полностью?

Нет. Около 60-70% типовых обращений закрываются без человека: цены, наличие, запись, шаблонные консультации. Сложные случаи, жалобы, дорогие сделки - остаются на менеджерах. Агент не заменяет, а высвобождает людей от рутины. Это важное различие.

Запустим AI-агента для вашего бизнеса

Подберём модель под задачу (YandexGPT, Claude, GPT), спроектируем сценарий, интегрируем с CRM и Telegram. Бесплатная консультация: покажем, где агент окупится за месяц, а где лучше не тратить деньги.