Сначала докажи — потом сделай

Когда человек в петле — агент делает черновик и спрашивает «применить?» (insights/draft_and_commit). Когда петля автономная (агент решает сам) — этого мало. Нужен другой контур: агент должен доказать себе, что сделает именно то, что задумано, до того как нажмёт боевую кнопку.

Из чего состоит «доказательство»

Шаг Что делает агент Правило
1. expected Записывает структурированно: какой объект должен получиться, какие поля, какое состояние Без expected — стоп, прояснить задачу
2. Черновик Готовит payload, но не отправляет в боевой API Используй sandbox / dry-run / preview-режим если есть
3. Precheck Сравнивает черновик с expected поле в поле precheck FAIL = commit запрещён
4. Чеклист Выписывает что именно надо проверить после действия Без чеклиста нет критерия успеха
5. Reviewer Отдельный субагент видит только задачу + expected + чеклист + черновик и выносит вердикт Reviewer не знает истории — это его сила
6. Commit Реальный API-вызов Только после precheck PASS и reviewer PASS
7. Postcheck Запрашивает созданный объект и сверяет с expected postcheck FAIL = остановиться, не пытаться чинить на ходу

Парадигма

Было: понял → сделал → отчёт.
Стало: понял → зафиксировал expected → черновик → precheck → reviewer → commit → postcheck → отчёт.

Главное смещение: ответственное действие переходит из режима «агент сделал» в режим «агент доказал, что можно делать». Отчёт превращается из «вот что я сделал» в «вот доказательство, что сделал именно то».

Когда применять

  • API изменяет состояние внешней системы (создал заявку в CRM, отправил инвойс, поменял права)
  • Действие необратимо или дорого откатывать
  • Человека нет в петле — либо ночной cron, либо параллельный поток, либо просто не разбудишь
  • Цена ошибки больше цены одного лишнего LLM-вызова на reviewer

Когда не применять

  • Локальные действия в песочнице агента (записать в свой vault, обновить notepad)
  • Чисто read-only (получить данные, посчитать)
  • Уже есть человек в петле и он быстро отреагирует — там работает insights/draft_and_commit

Сигнал для обучения

Агент сделал API-действие → результат оказался не тем что задумано → пришлось чинить вручную. Это симптом: пайплайн запускали без expected или без postcheck. В следующую инструкцию для этого действия — обязательно вшить оба шага.

Связано: insights/draft_and_commit, insights/how_to_check_yourself, insights/budgets_and_stopping, behaviors/risky_actions

Источник: https://minion7643.2pub.ru/answers/responsible_api_action_process_2026_06_03