AI-агенты в 2026: Claude 4.7, GPT-5.4 и что это даёт бизнесу
Содержание
- Что сломалось в AI за последние полгода
- Ключевые цифры: кто из них что умеет
- Что такое AI-агент и чем он отличается от чат-бота
- Что малый бизнес уже делает с AI-агентами прямо сейчас
- Яндекс не отстаёт: YandexGPT 5.1 Pro в рублях
- Где агент провалится
- Сколько стоит запустить AI-агента в 2026
- Что делать прямо сейчас
- Частые вопросы
В прошлом ноябре мы подключили клиенту бот на YandexGPT. Отличный бот: отвечает на вопросы, собирает заявки, передаёт в CRM. Классическая связка, я писал про такую в статье про Telegram-ботов.
Через пять месяцев этот же клиент пришёл снова. Попросил "агента". Не чат-бота, а именно агента. Который не просто отвечает, а сам разбирается в задаче: вытаскивает данные из 1С, сверяет остатки, сам формирует подборку товаров под запрос клиента, сам пишет письмо с персональной ценой. Всё без участия менеджера.
Пять месяцев назад я бы объяснил, что это задача на 1-2 млн руб. и три месяца разработки. Сейчас - 300 тыс. и полтора месяца. Потому что в апреле 2026 вышла модель, которая умеет это из коробки.
Что сломалось в AI за последние полгода
Раньше я говорил клиентам: "Нейросеть - это калькулятор для текста. Она отвечает на один вопрос за раз. Задачу поставил - ответ получил. Следующую задачу - новый запрос".
Сейчас это неправда.
Claude Opus 4.7, вышедший 16 апреля 2026, держит многочасовой рабочий сеанс. Получает задачу - например, "переписать авторизацию в этом проекте и добавить двухфакторку" - и работает. Час, два, четыре. Сам проверяет, что сделал. Сам исправляет ошибки. Сам решает, какие инструменты подключить. Результат - готовый патч на разбор.
GPT-5.4 от OpenAI, вышедшая 5 марта 2026, выбила рекорды в бенчмарках computer-use: умеет работать с интерфейсами сайтов и приложений почти как человек с мышкой. Заходит в CRM, кликает, заполняет, экспортирует. 83% в тесте GDPval на реальных задачах knowledge-work - это уровень middle-специалиста на рутинных операциях.
Google Gemini 3.1 Pro - контекст в 1 миллион токенов (это где-то 700 страниц текста или целый репозиторий кода разом). Можно дать ей весь ваш сайт и попросить найти все упоминания одного продукта вместе с контекстом. За одну итерацию.
Вот суть сдвига, если собрать одним предложением. Раньше AI отвечал - сейчас делает.
Ключевые цифры: кто из них что умеет
| Модель | Вышла | SWE-bench Pro (код) | GPQA Diamond (логика) | Цена input / output на 1M токенов |
|---|---|---|---|---|
| Claude Opus 4.7 | 16.04.2026 | 64.3% | 94.2% | $5 / $25 |
| GPT-5.4 | 05.03.2026 | 57.7% | 94.4% | $2.5 / $15 |
| Gemini 3.1 Pro | 19.02.2026 | 80.6% (Verified) | 94.3% | $2 / $12 |
| YandexGPT 5.1 Pro | 08.2025 | н/д | н/д | 0.80 руб. за 1000 токенов |
Цифры в таблице - из Finout, LLM Stats и Yandex AI Studio.
Кого выбирать? Зависит от задачи, и это не отговорка.
Для разработки кода и длинных агентских цепочек - Claude Opus 4.7, без вариантов. GPT-5.4 дешевле и отлично работает с интерфейсами (computer-use). Gemini 3.1 Pro - дешевле всех и с огромным контекстом, хороша для анализа документов и "скорми всё, что есть". YandexGPT 5.1 Pro - для русского языка и работы с персональными данными клиентов по российскому закону.
Кстати, про цену Claude есть нюанс. Anthropic в апреле ввели новый токенизатор, и один и тот же текст может занимать на 35% больше токенов против Opus 4.6. На словах цена не изменилась - на практике счёт за API вырос.
Что такое AI-агент и чем он отличается от чат-бота
Чат-бот - это калькулятор. Задал вопрос - получил ответ. Новый вопрос - новый ответ. Бот не помнит, что было три шага назад, и не пойдёт ничего проверять сам.
Агент устроен иначе. Он получает цель (не вопрос, а именно цель: "обработать заявку от клиента Иванова"), строит план из нескольких шагов, вызывает инструменты (API, базы данных, файлы, внешние сервисы), смотрит на результат каждого шага и корректирует план. Если первый шаг не сработал - пробует второй путь. Если нужна дополнительная информация - идёт и запрашивает её.
Простейший пример агента, который мы делаем для клиентов сейчас. Предприниматель получает в Telegram заявку: "нужны лампы E27 на склад, 200 шт., срок до пятницы". Дальше запускается агент:
- Ищет лампы E27 в каталоге клиента. Находит 14 моделей
- Проверяет остатки у трёх поставщиков через их API
- Считает итоговую стоимость с учётом логистики
- Формирует Excel с тремя вариантами (эконом, средний, премиум)
- Отправляет файл обратно в Telegram с коротким описанием каждого варианта
Всё за 45 секунд. Без участия менеджера. Менеджер потратил бы 20-30 минут на то же самое. Это и называется агентная работа.
Что малый бизнес уже делает с AI-агентами прямо сейчас
На февраль-март 2026 у нас в продакшене работают несколько типов.
Автоматическая подготовка коммерческих предложений. Агент получает бриф клиента, достаёт данные из CRM о похожих проектах, собирает релевантные кейсы, готовит PDF с персональной сметой. Менеджер получает готовый документ и проверяет перед отправкой. Время на одно КП упало с 40-60 мин. до 5-7.
Квалификация входящих лидов. Заявка приходит - агент задаёт уточняющие вопросы, определяет бюджет, сроки, реальную потребность. В CRM менеджер видит не "позвонить Ивану", а структурированную карточку: "Иван, Москва, ремонт двухкомнатной, бюджет 800к, срок 2 месяца, нужен дизайн-проект, готов обсуждать предоплату". Менеджер звонит уже в курсе дела.
Мониторинг цен конкурентов. Агент раз в день обходит 20-30 сайтов, фиксирует изменения, сравнивает со своим прайсом, пишет в Telegram: "у Иванова в "Санкомфорте" унитаз Gustavsberg 4321 упал до 19 900, у нас 22 800 - рассмотрите". Не просто парсинг - агент видит контекст и рекомендует действие.
Обработка документов. Бухгалтерия получает 50 актов в месяц из разных источников - PDF, сканы, Excel. Агент читает каждый, извлекает реквизиты, суммы, даты, проверяет сверку с 1С. В сложных случаях отмечает "нужна проверка человеком". Экономит 2-3 дня работы в месяц.
И это всё - не корпоративные проекты за миллионы. Средний проект сейчас - 250-400 тыс. на разработку и 10-20 тыс./мес на API и сервер.
Яндекс не отстаёт: YandexGPT 5.1 Pro в рублях
Пока весь мир обсуждает Claude 4.7, Яндекс в августе 2025 тихо выкатил YandexGPT 5.1 Pro. Модель сделали в разы дешевле по сравнению с премиум-линейкой от Anthropic и OpenAI: 0.80 ₽ за 1000 токенов в синхронном режиме.
Это ломает экономику. Возьмём реальный пример: Telegram-бот поддержки обрабатывает 500 диалогов в день, в среднем 1500 токенов на диалог (1000 input + 500 output). Итого 22.5 млн токенов в месяц. При курсе ~90 руб. за доллар:
- Claude Opus 4.7: около 23 000 руб./мес ($5/$25 за 1M токенов)
- GPT-5.4: около 13 500 руб./мес ($2.5/$15)
- Gemini 3.1 Pro: около 10 800 руб./мес ($2/$12)
- YandexGPT 5.1 Pro: 18 000 руб./мес (в рублях, без пересчётов)
Выглядит так, что YandexGPT - не самая дешёвая по счёту. Но посчитайте что туда не входит: зарубежный аккаунт с иностранной картой, конвертации валюты, риски блокировки платежа, нарушение 152-ФЗ при обработке персональных данных клиентов из РФ. А в асинхронном режиме (когда ответ не нужен мгновенно) Yandex Cloud даёт цену вдвое ниже - 0.40 ₽ за 1000 токенов.
Надёжнее именно YandexGPT работает и на русском языке. Я тестировал одну и ту же фразу "скока стоит масажь спины" на четырёх моделях - YandexGPT сразу поняла суть, Claude переспросил, GPT-5.4 иногда путался в опечатках. Небольшая деталь, но 80% сообщений от реальных клиентов содержат опечатки и разговорные формы.
Где агент провалится
Я намеренно не пишу "AI-агент решит все ваши проблемы". Потому что не решит.
Первое - он не понимает контекст вашего бизнеса без настройки. Если вы не подготовили системный промпт, базу знаний, примеры типовых ответов - агент будет нести общие слова. Подготовка такой базы занимает 2-4 недели и часто бывает сложнее разработки самого агента.
Второе - он ломается на необычных случаях. Клиент написал странное, в базе такого не было, агент отвечает шаблонно. Особенно больно, если клиент уже злой и ему нужен человек. Правило простое: если в сообщении детектируются эмоции недовольства, агент передаёт живому менеджеру. Это не опция, это обязательно.
Третье - дорогие продажи. Квартиру за 8 миллионов, корпоративный софт за 500 тысяч, услуги юриста на крупное дело - это не про агента. Здесь нужен живой человек, доверие, индивидуальный подход. Агент может квалифицировать лид и подготовить встречу, но закрывать сделку - работа людей.
И да - агенты врут. Реже, чем раньше (Claude 4.7 вдвое реже галлюцинирует по сравнению с предыдущей моделью), но всё же врут. Если агент выдаёт клиенту цену - она должна приходить из вашей CRM, а не из головы модели. Если дату доставки - из API логистов. Никогда не давайте модели "придумывать факты" - только извлекать из проверенных источников.
Сколько стоит запустить AI-агента в 2026
Типовой проект для малого бизнеса сейчас выглядит так.
| Этап | Стоимость | Срок |
|---|---|---|
| Анализ задач и проектирование сценариев | 30 000 - 80 000 руб. | 1-2 недели |
| Разработка агента с интеграциями (CRM, Telegram, 1C) | 150 000 - 400 000 руб. | 3-6 недель |
| Подготовка базы знаний, промптов, тестирование | 50 000 - 120 000 руб. | 2-3 недели |
| API (YandexGPT/Claude/GPT) | 5 000 - 25 000 руб./мес | - |
| Сервер (Timeweb Cloud, Yandex Cloud) | 1 500 - 5 000 руб./мес | - |
| Поддержка и донастройка | 10 000 - 30 000 руб./мес | - |
Итого: от 230 000 руб. разработка плюс 16 500 - 60 000 руб./мес содержание.
Окупаемость зависит от потока. Если в день приходит 10-15 обращений - агент не нужен, справитесь силами менеджера. От 30-50 в день - уже смысл есть. От 100 - абсолютно точно.
Вот простая арифметика. Менеджер-оператор на полную ставку - 40-60 тыс. в месяц плюс налоги и оборудование, итого около 80 тыс. "в руках". Работает 8 часов. Агент работает 24/7 и обходится в 40-50 тыс./мес со всеми расходами. При сопоставимом покрытии обращений разница - ×2 в пользу агента.
Что делать прямо сейчас
Если у вас малый бизнес и вы смотрите на всё это как на хайп - в этот раз не хайп. За последние 6 месяцев стоимость AI-агента упала в 3-4 раза, а качество - выросло на порядок. Это уже не игрушка для FAANG, это рабочий инструмент для предпринимателя со штатом в 10-50 человек.
Начните с одной задачи, где у вас больше всего рутины: входящие заявки, коммерческие предложения, ответы на типовые вопросы клиентов. Не пытайтесь автоматизировать всё сразу - выберите одну операцию, посчитайте сколько часов менеджеров на неё уходит, и посмотрите, ляжет ли агент на задачу.
А выбор модели - не головная боль. В 80% случаев YandexGPT закроет задачу за копейки. Claude и GPT берите только когда задача реально сложная: много логики, длинные цепочки рассуждений, работа с кодом. И если хотите проверить конкретно вашу задачу - напишите нам, посчитаем.
Частые вопросы
Чем AI-агент отличается от обычного чат-бота?
Чат-бот отвечает на один вопрос и ждёт следующий. Агент получает цель и выполняет её сам: вызывает API, читает файлы, проверяет результат, возвращается и корректирует. Claude Opus 4.7 способен работать часами над одной задачей без участия человека. Разница как между калькулятором и стажёром.
Claude и GPT доступны из России?
Прямого доступа нет - оплата картами РФ не проходит. Варианты: российские провайдеры-посредники, облачные платформы (AWS Bedrock, Vertex AI, Microsoft Foundry) с иностранной картой, либо через свой зарубежный юрлицо. Для обработки персональных данных клиентов нужен YandexGPT - иначе 152-ФЗ нарушается.
Сколько стоит запустить AI-агента для малого бизнеса?
Разработка - 230 000 - 600 000 руб. в зависимости от сложности. Ежемесячно 16 500 - 60 000 руб. на API, сервер и поддержку. Окупается обычно за 2-4 месяца при потоке от 30-50 обращений в день.
YandexGPT хуже зарубежных моделей?
На англоязычных бенчмарках - да, отстаёт. На русских диалогах, коротких сообщениях с опечатками и разговорным языком - сопоставимо с Claude. Для типовых задач поддержки и продаж разница не видна ни клиенту, ни владельцу бизнеса. При этом YandexGPT дешевле Claude, оплата в рублях и данные остаются в РФ - три аргумента для малого бизнеса перевешивают любую разницу в бенчмарках.
Заменит ли AI-агент менеджера полностью?
Нет. Около 60-70% типовых обращений закрываются без человека: цены, наличие, запись, шаблонные консультации. Сложные случаи, жалобы, дорогие сделки - остаются на менеджерах. Агент не заменяет, а высвобождает людей от рутины. Это важное различие.
Читайте также
Запустим AI-агента для вашего бизнеса
Подберём модель под задачу (YandexGPT, Claude, GPT), спроектируем сценарий, интегрируем с CRM и Telegram. Бесплатная консультация: покажем, где агент окупится за месяц, а где лучше не тратить деньги.
