Месяц назад я убил полдня на одну и ту же задачу — переводил разговорный текст в формальный. Простое упражнение: взять интервью и превратить его в официальный документ. Делегировал трём ассистентам и получил три совершенно разных результата. И тогда до меня дошло, что вопрос «какой ИИ лучше» — это не про рейтинги и бенчмарки. Это про то, какой инструмент подходит под конкретную работу.
Давай разберёмся честно, без маркетингового шума.
Письмо и редактура: здесь они играют в разные игры
С GPT-4o я работаю, когда мне нужен текст «как будто человек написал». Не идеальный — живой. Он умеет ловить интонацию, не боится длинных предложений с вводными конструкциями, иногда добавляет оборот, который я бы сам не придумал. Для черновиков, писем, постов — самое то.
Claude 3.5 Sonnet — это другой режим. Когда нужен текст, который обязан быть безупречным. Отчёт, документация, техническое описание, официальное письмо. Он лучше держит структуру, точнее следует требованиям и заметно реже «додумывает» то, чего нет в контексте.
Практический пример: попросил обоих написать описание функции API. GPT-4o сделал текст читабельным, с аналогиями и живым языком. Claude — сухим, точным, ровно по шаблону, который я не просил. Оба хороши, но для разных целей.
Кодинг: Sonnet меня реально удивил
Честно скажу — до Claude 3.5 Sonnet я в основном сидел на GPT-4. Разница ощущается с первой задачи. Sonnet лучше видит контекст большого проекта. Если у тебя тысяча строк кода и ты спрашиваешь «почему тут падает» — он смотрит не только на проблемное место, а на соседние файлы, на зависимости, на логику целиком.
GPT-4o в этом плане надёжный работник. Сделает конкретную задачу быстро и чисто. Но если проект сложный и запутанный — иногда предлагает решения, которые противоречат друг другу в разных файлах.
Ещё одна штука, которую я заметил: Claude лучше работает с чужим кодом. Когда кидаю ему плохо написанную легаси-систему и прошу разобраться — он реально разбирается. GPT-4o склонен переписывать код «как надо», не всегда понимая, почему он написан именно так.
Аналитика и исследование: выигрывает тот, кто меньше фантазирует
С аналитическими задачами было сложнее всего. Оба склонны «додумывать» данные, если видят пробелы в контексте. Это бич всех больших моделей — они заполняют пустоты, иногда очень уверенно.
GPT-4o в этом плане более предсказуем. Если в данных чего-то нет — он об этом скажет. Но и фантазирует порой так убедительно, что приходится перепроверять каждую цитату.
Claude 3.5 точнее в фактических запросах. Реже придумывает источники, лучше указывает на неопределённость. Для серьёзной аналитики — это важно.
Но вот в чём проблема обоих: они не знают, чего не знают. Просишь их проанализировать рынок — они дадут уверенный ответ, даже если данных реально нет. Тут нужно держать голову включённой.
Креативные задачи: GPT-4o чувствует настроение
Для творческих вещей — сценарии, диалоги, нестандартные идеи — я чаще тянусь к GPT-4o. Он лучше ловит настроение, умеет быть смешным, драматичным, неожиданным. Не всегда предсказуемым — но в креативе это плюс.
Claude в творческом режиме работает осторожнее. Его ответы обычно «хорошие», но иногда слишком правильные. Как продюсер, который говорит «это может не понравиться». Иногда именно это и нужно. Но когда хочется чего-то, чего сам не ожидал — GPT-4o чаще удивляет.
Что в итоге
Если коротко: нет победителя. Есть задачи, где один заметно лучше.
GPT-4o — для писательских задач, живого текста, креатива, быстрых ответов.
Claude 3.5 Sonnet — для кода, точного письма, аналитики, работы с большим контекстом.
Я в итоге держу обоих. Использую Claude для программирования и документов, GPT — для текстов и идей. И не пытаюсь заставить один инструмент делать всё.
Главное, что я усвоил: любой ИИ хорош ровно настолько, насколько хорошо ты понимаешь его границы.
