Ограниченное контекстное окно — производительность извлечения контекста LLM деградирует по мере введения каждого нового токена. Перефразируя вышеупомянутый блог — **думайте о контексте как об ограниченном "бюджете внимания".** Грубый вывод, который можно сделать: эффективные контекстные окна, вероятно, составляют 50-60% или даже меньше. **Не начинайте сложную задачу, когда вы на полпути в разговоре.** **Сделайте сжатие или начните новый.** Одна из техник борьбы с деградацией контекста — [[system-reminders|многократное внедрение целей в контекст]].