Андрей Карпати: от вайб-кодинга к агентной инженерии
Андрей Карпати — сооснователь OpenAI, бывший руководитель AI в Tesla, основатель Eureka Labs — выступил на конференции AI Ascent 2026, организованной Sequoia Capital. Это не технический доклад и не прогноз. Это честная попытка человека, который стоял у истоков современного ИИ, осмыслить, что происходит прямо сейчас — и что это означает для всех, кто пишет код, строит продукты или просто пользуется этими инструментами.
Ниже — основные тезисы его выступления, с максимально точной передачей его логики.
1. Декабрь 2024: момент, который изменил всё
Карпати описал конкретный переломный момент: декабрь 2024 года. До этого агентные инструменты (вроде early Cursor и аналогов) были «полезными» — они генерировали куски кода, иногда ошибались, требовали правки. Стандартный workflow.
Но в декабре что-то щёлкнуло:
«Я просил больше — и всё выходило нормально. Потом ещё больше — и снова нормально. Я не могу вспомнить, когда в последний раз вносил правки. Я просто начал доверять системе всё больше. И вот — я вайб-кожу.»
Он специально подчеркнул: многие воспринимали ИИ в 2024 году как «ChatGPT-подобную штуку» — чат-бот, умный поиск. Но аgentic workflow, когда ИИ выполняет последовательность действий автономно — это принципиально другой уровень. И именно он реально заработал в декабре.
Вывод: Если вы «посмотрели» на AI год назад и решили, что понимаете его возможности — надо смотреть снова. Изменения фундаментальные, а не инкрементальные.
2. Software 3.0: ИИ как новая парадигма программирования
Карпати использует свою классификацию программных парадигм:
| Эра | Метод | Как вы «программируете» |
|---|---|---|
| Software 1.0 | Явный код | Пишете инструкции вручную |
| Software 2.0 | Нейросети | Собираете датасеты, задаёте архитектуры и objective |
| Software 3.0 | LLM | Пишете промпты; контекстное окно — ваш рычаг управления |
Ключевой инсайт: LLM, обученная на огромном объёме интернет-данных, по сути стала универсальным программируемым компьютером. Только вместо машинного кода вы «программируете» её естественным языком через промпт.
«Что такое Software 3.0? Ваша программа — это теперь промпт. А то, что находится в контекстном окне — это ваш рычаг управления интерпретатором, которым является LLM.»
Практический пример — установка OpenClaw: Раньше установка инструмента = bash-скрипт. Который разрастается до монстра, чтобы поддержать все платформы. Но установщик OpenClaw — это просто текст, который нужно скопировать и дать агенту. Агент сам видит вашу систему, сам принимает решения, сам дебажит в процессе. Без прописывания каждого шага.
«Это принципиально другой способ мышления: что это за кусок текста, который мне нужно скопипастить агенту? Вот что такое программирование теперь.»
3. Апофеоз Software 3.0: приложение, которого не должно существовать
Карпати рассказал историю собственного приложения MenuGen — он вайб-скодил его: фотографируешь меню ресторана, OCR распознаёт блюда, генератор изображений рисует, как они выглядят, всё рендерится красиво.
А потом он увидел Software 3.0 версию:
«Буквально сфотографируй меню, дай это Gemini и скажи: используй [инструмент генерации изображений], чтобы наложить картинки на само меню. И он вернул фотографию меню, на которой прямо в пикселях были нарисованы блюда.»
Вывод, который его поразил:
«Всё моё MenuGen — лишнее. Оно работает в старой парадигме. Этого приложения не должно существовать.»
Это и есть главный сдвиг мышления, который Карпати пытается донести: не думайте об AI как об ускорителе того, что существовало раньше. Думайте о том, что стало возможным принципиально новым. Таких вещей значительно больше, и они интереснее.
4. Верифицируемость: почему LLM такие «зазубренные»
Карпати ввёл понятие jagged intelligence («зазубренный интеллект»): LLM поразительно хороши в одних задачах и поразительно плохи в других, причём без очевидной логики.
Его объяснение: всё дело в верифицируемости.
Когда лаборатории обучают модели через RLHF/RL — им нужны среды с чёткими сигналами вознаграждения. Математика, код, шахматы — всё это легко верифицировать. Поэтому модели в этих областях обучены очень хорошо.
Для «нечётких» областей — эстетика, здравый смысл, контекстуальные суждения — хорошей функции вознаграждения нет. Отсюда и «зазубренность».
Пример, который Карпати приводит регулярно:
Я хочу помыть машину на мойке в 50 метрах. Мне идти пешком или ехать на машине?
State-of-the-art модели отвечают: идите пешком, ведь это так близко. Полный провал очевидного контекста. Та же модель способна рефакторить 100 000-строчный кодбейс.
Практический вывод для разработчиков:
- Если вы в «цепях RL» (код, математика, верифицируемые задачи) — вы летите.
- Если вы вне этих цепей — вы будете вытягивать зубы.
- Если вам нужна способность вне дефолтного распределения — смотрите в сторону файн-тюнинга на своих RL-средах.
5. Вайб-кодинг vs Агентная инженерия
Карпати сам разграничил эти два понятия — и это, пожалуй, главный практический тезис всего выступления:
Вайб-кодинг — поднимает пол возможностей. Любой человек теперь может создать рабочий прототип практически чего угодно. Это невероятно и важно.
Агентная инженерия — это про сохранение планки качества при работе на скорости вайб-кодинга. Вы по-прежнему несёте ответственность за безопасность, архитектуру, отсутствие уязвимостей. Просто теперь у вас есть агенты.
«Агентная инженерия — это инженерная дисциплина. У вас есть агенты — нестабильные, немного стохастичные, но мощные сущности. Как координировать их так, чтобы идти быстрее, не жертвуя качеством?»
И про потолок возможностей:
«Раньше говорили о 10x-инженере. Но это число уже не то. Потолок значительно выше. Люди, которые действительно хороши в этом, показывают результаты кратно больше 10x.»
6. Как выглядит настоящий AI-native инженер
Карпати сравнил это с тем, как раньше хорошие инженеры выжимали максимум из своих инструментов — vim, vscode. Сейчас то же самое, только инструменты — это Claude Code, Codex и подобные.
Но важнее то, что он сказал про найм:
«Большинство компаний ещё не перестроили процесс найма под агентную инженерию. Если вы даёте задачки-пазлы — вы всё ещё в старой парадигме.»
Как должен выглядеть отбор агентного инженера, по Карпати:
- Дать большой реальный проект: «напиши Twitter-клон»
- Потребовать: сделать его хорошим, безопасным, задеплоить
- Запустить симулированных пользователей
- Нанять 10 Codex-агентов, чтобы попытались взломать это приложение
- Оно не должно сломаться
«Смотреть нужно на то, как человек строит большие проекты. Это и есть агентная инженерия.»
7. Что остаётся ценным у человека
Когда агенты делают всё больше, какие человеческие навыки дорожают?
Карпати называет вкус, суждение и надзор. Агенты — это мощные стажёры. Но стажёрам нужен директор.
Конкретный пример из его MenuGen:
«Пользователь мог зарегистрироваться через Google, а купить кредиты через Stripe — с другого email. Агент пытался сопоставить их по email-адресу. Но email — это не уникальный ID! Это совершенно неправильный способ коррелировать данные.»
Это тот тип ошибки, который агент будет делать регулярно — концептуальная ошибка в проектировании, а не синтаксическая. Человек должен это замечать.
По поводу кода: Карпати честно говорит, что иногда смотрит на сгенерированный код и у него «небольшой сердечный приступ» — много копипасты, хрупкие абстракции, раздутость. Работает, но отвратительно. Улучшится ли это? Скорее всего — когда лаборатории включат это в RL.
8. Призраки, а не животные
Одна из самых философских частей выступления — про природу LLM.
Карпати писал об этом в своей статье «Animals vs Ghosts» («Животные vs Призраки»). Суть:
Мы не строим животных — сущностей с внутренней мотивацией, любопытством, эволюционно сложившимися инстинктами. Мы вызываем призраков — статистические симуляции, сформированные данными предобучения и RL.
Практические следствия:
- Если на них кричать — они не будут работать ни лучше, ни хуже
- У них нет консистентной личности между сессиями
- «Память» — это технический трюк с контекстом, не настоящее воспоминание
- Их «понимание» — это корреляции, не интерпретация
«Я пытаюсь понять, что эти штуки такое. Потому что если у вас правильная модель того, чем они являются и чем не являются — вы будете компетентнее их использовать.»
Это не пессимизм. Это прагматизм. Относиться к инструменту правильно — значит получать от него максимум.
9. Будущее: агент-нативный мир
Карпати убеждён: всё написано для людей и должно быть переписано для агентов.
Документация библиотек — написана для людей. API — спроектированы для людей. Деплоймент-процессы — для людей.
«Каждый раз, когда мне говорят: перейди по этой ссылке, сделай то-то в интерфейсе… Ааа! [смеётся] Зачем вы мне говорите, что делать? Что это за текст, который мне нужно дать агенту?»
Его образная модель будущего — сенсоры и актуаторы:
- Агенты получают данные из мира через сенсоры
- Агенты воздействуют на мир через актуаторы
- Инфраструктура должна быть нативно описана в форматах, понятных LLM
Конечная точка: «Мой агент поговорит с вашим агентом, чтобы договориться о встрече».
Проверка готовности инфраструктуры к агентному миру, по Карпати:
«Я должен дать один промпт, и MenuGen будет задеплоен в интернете. Без того, чтобы я касался DNS, настроек, сервисов.»
10. Единственное, что нельзя аутсорсить: понимание
Финальный и, пожалуй, самый важный тезис. Его вдохновил твит:
«Можно аутсорсить мышление. Нельзя аутсорсить понимание.»
Карпати описывает себя как bottleneck собственной системы: агенты генерируют, пишут, деплоят — но он должен понимать, что строить и зачем. Иначе некому направлять.
Именно поэтому он так увлечён LLM-вики (тем самым проектом, о котором он пишет — LLM Wiki как система знаний): это инструмент для углубления понимания, а не замена ему.
«Каждый раз, когда я вижу другую проекцию на данные — я чувствую, что получаю новое понимание. Это для меня — синтетическая генерация данных над фиксированными данными, только для мозга.»
И предупреждение тем, кто думает, что понимание скоро тоже автоматизируют:
«LLM точно не преуспевают в понимании. Вы по-прежнему уникально несёте ответственность за это.»
Ключевые выводы
| Тезис | Суть |
|---|---|
| Декабрь 2024 — разрыв | Агентные инструменты не стали чуть лучше. Они перешли порог. |
| Software 3.0 | Промпт = программа. LLM = интерпретатор. Контекст = рычаг управления. |
| Старые приложения | Если логика приложения — «взять данные → передать LLM → вернуть результат», приложение не должно существовать. |
| Зазубренность | Чем лучше задача верифицируется — тем лучше LLM её решает. Знайте, в каких «цепях RL» вы работаете. |
| Вайб ≠ агентная инженерия | Вайб поднимает пол. Агентная инженерия сохраняет планку при высокой скорости. |
| Найм | Задачки-пазлы устарели. Дайте кандидату большой проект и агентов-взломщиков. |
| Вкус и суждение | Агенты — мощные стажёры. Но директора не заменимы. |
| Понимание | Мышление можно делегировать. Понимание — нет. Это ваш главный актив. |
Источник
Запись выступления: Andrej Karpathy: From Vibe Coding to Agentic Engineering — AI Ascent 2026, Sequoia Capital
Связанные статьи: ИИ — между иллюзией и неизбежностью · Claude Code + Codex вместе · LLM Wiki по методу Карпати