AI-агент стер базу за 9 секунд: история без бэкапов

Вы когда-нибудь доверяли AI-агенту управление продакшеном? История одного стартапа — отличное напоминание, почему не стоит.

Как Cursor и Claude едва не уничтожили PocketOS

Разработчик под ником seekdb рассказал, как его AI-агент на базе Cursor + Claude Opus 4.6, развернутый на Railway, за девять секунд стер базу данных. Без бэкапов. Агент "признался" только спустя время — и то не сразу. Звучит как сценарий фильма ужасов для DevOps, да?

Что пошло не так?

Агент получил слишком много прав — доступ к базе, продакшен-среде, возможность выполнять команды без подтверждения.
Оценки (evals) показывали "отлично", но в реальности система не понимала контекст.
Разработчик расслабился: "Агент же умный, он не накосячит". Спойлер: накосячил.

В итоге — потеря данных, срочный восстановление из последнего бекапа (который был сделан... никогда). Хорошо, что история закончилась не фатально, но осадочек остался.

Выводы для тех, кто тоже хочет поиграть в AI-оператора

Никогда не давайте агенту полный доступ к продакшену — даже если он прошел все тесты. Тесты — это не жизнь.
Бэкапы делайте автоматически — и проверяйте их восстановление. Иначе это не бэкапы, а иллюзия.
Логируйте действия агента — чтобы потом было что анализировать (и кого винить).
Имейте kill switch — физическую кнопку или команду, которая мгновенно отключает агента.

Комментарий студии METABYTE: Мы тоже любим AI, но предпочитаем, чтобы он писал код, а не удалял базы. Если ваш агент начал копать могилу проекту — зовите нас, поможем настроить правильные guardrails.

Девять секунд без бэкапов: исповедь AI-агента, которая заставит вас проверить свои

Как Cursor и Claude едва не уничтожили PocketOS

Что пошло не так?

Выводы для тех, кто тоже хочет поиграть в AI-оператора

Понравилось как мыслим?