Следующий компонент нашей RAG системы – [[LLM Модель|LLM Модель]] (не та же самая, что для создания эмбедингов). В RAG-пайплайне модель (LLM) – это компонент, который принимает подготовленный промпт и на его основе генерирует итоговый ответ. Retriever предоставляет релевантные данные (формирует контекст), а LLM интерпретирует их, резюмирует, структурирует и формирует человекочитаемый вывод. Без модели, RAG – это просто поиск; модель превращает результаты поиска в связный и осмысленный ответ.