Ограниченное контекстное окно — производительность извлечения контекста LLM деградирует по мере введения каждого нового токена. Перефразируя вышеупомянутый блог — **думайте о контексте как об ограниченном "бюджете внимания".**
Грубый вывод, который можно сделать: эффективные контекстные окна, вероятно, составляют 50-60% или даже меньше.
**Не начинайте сложную задачу, когда вы на полпути в разговоре.**
**Сделайте сжатие или начните новый.**
Одна из техник борьбы с деградацией контекста — [[system-reminders|многократное внедрение целей в контекст]].