Самокритика: 3 итерации саморевизии для глубоких ответов ИИ
ИИ выдаёт поверхностный ответ на сложный вопрос. Просишь "подумай глубже". Добавляет воды. Нужна структурная техника, которая заставит модель критиковать саму себя и улучшить ответ.
Техника самокритики в 3 сообщениях: отвечающий → исследователь-критик → решатель. После первого ответа просишь ИИ в роли критика найти слабые места, потом в роли решателя применить критику и переписать. Результат на порядок глубже обычного prompt'а.
Если поймёшь этот приём, ты сможешь вытащить из модели ответ, который сам по себе не вылезает. Если не поймёшь, будешь получать “в целом нормально” и переписывать запрос по десятому разу.
Self-critique это 3 сообщения подряд. Один ИИ играет 3 роли: сначала отвечает, потом критикует, потом переписывает. Всё.
[ КОГДА ПРИМЕНЯТЬ ]
Когда первый ответ ИИ всегда “нормальный”, но не выдающийся.
Расчёты, стратегии, логические цепочки с риском ошибки.
Когда одной роли мало. Нужен критик, который ловит то, что не видит отвечающий.
Когда учишься. Хочешь понять, как собирается сильный ответ через пересмотр.
[ ШАГ 1: ОТВЕТ С CHAIN-OF-THOUGHT ]
Задаёшь свой вопрос. В конце добавляешь магическую строку на английском.
Let's work this out in a step by step way to be sure we have the right answer.
Это запускает у модели режим рассуждения вслух. Не прыжок к выводу, а проход по шагам. Работает в ChatGPT, Claude, Gemini. Везде.
[ ШАГ 2: РОЛЬ ИССЛЕДОВАТЕЛЯ ]
Просишь ИИ найти слабые места в своём же ответе. Он выходит из роли отвечающего и становится критиком.
You are a researcher tasked with investigating the [что критикуем]
response options provided. List the flaws and faulty logic of each
answer option. Let's work this out in a step by step way to be
sure we have all the errors:
На выходе. Развёрнутый список дыр в логике, пропусков, неточностей. То, что ты бы сам пропустил.
[ ШАГ 3: РОЛЬ РЕШАТЕЛЯ ]
ИИ применяет собственную критику и переписывает ответ.
You are a resolver tasked with:
1) finding which of the [%] answer options the researcher thought
was best
2) improving that answer
3) Printing the improved answer in full.
Let's work this out in a step by step way to be sure we have
the right answer:
Итог. Ответ прошёл через отвечающего, критика, улучшателя. Квантовый сдвиг по качеству против одного прохода.
[ ПОЛНЫЙ ПРОМПТ: 3 СООБЩЕНИЯ ПОДРЯД ]
Let's work this out in a step by step way to be sure we have
the right answer.
You are a researcher tasked with investigating the [подставь
тему / твой предыдущий вопрос] response options provided.
List the flaws and faulty logic of each answer option.
Let's work this out in a step by step way to be sure we have
all the errors.
You are a resolver tasked with:
1) finding which of the response options the researcher thought
was best
2) improving that answer
3) Printing the improved answer in full.
Let's work this out in a step by step way to be sure we have
the right answer.
[ ПОЧЕМУ ЭТО РАБОТАЕТ ]
Chain-of-Thought на английском. Именно английская формулировка включает у моделей режим внутреннего рассуждения. Эффект сильнее, чем у русского аналога. Проверено всеми, кто сравнивал.
Смена роли. ИИ в роли отвечающего защищает свой ответ. ИИ в роли исследователя не связан с ним, поэтому ищет дыры спокойно.
Переписывание, а не редактура. Решатель не подкручивает, он собирает заново с учётом критики. Другой уровень.
[ ⚠️ ГЛАВНАЯ ОШИБКА НОВИЧКА ]
Прогнать 3 сообщения на простой вопрос. “Напиши пост про кофе” не требует self-critique. Там первый ответ и так норм.
Применяй технику только там, где цена ошибки высокая. Стратегия, расчёт, логика, спорный вывод. Иначе тратишь токены и время без прироста качества.
[ ЧЕКЛИСТ ГОТОВНОСТИ ]
✅ Исходный вопрос достаточно сложный, что self-critique оправдан.
✅ В сообщении 1 стоит английская строка Chain-of-Thought.
✅ В сообщении 2 подставлена твоя тема на место [что критикуем].
✅ Сообщение 3 отправляется только после того, как критик выдал список дыр.
✅ Финальный ответ сохраняешь целиком, не обрывая на середине.
Готово. Прогоняй 3 сообщения последовательно и читай финальную версию.
💭 От Ивана:
Я эту технику держу для стратегических вопросов. Сергей, оффер, следующий ход. Там, где один проход даёт “в целом нормально”, а нужно “вот оно”. Три сообщения. Пять минут. И получаешь ответ, на который сам бы тратил полдня с переписыванием.
Ну блин, реально база.
[ ЧТО ДАЛЬШЕ ]
- РАФТ-метод. База для первого промпта. Без неё self-critique не выстрелит.
- Tree-of-Thought. Мета-приём через ветвление. Для многовариантных задач.
- Каскад экспертных ролей. Усиленная версия через команду ролей.
Хочешь систему под ключ?
Один хак это круто. А если собрать все вместе под твой бизнес - получится живая система. Пройди 5-минутную диагностику: AI-бот покажет где ты теряешь деньги в воронке.
Пройти диагностику →