Следующий компонент нашей RAG системы – [[LLM Модель|LLM Модель]] (не та же самая, что для создания эмбедингов).
В RAG-пайплайне модель (LLM) – это компонент, который принимает подготовленный промпт и на его основе генерирует итоговый ответ.
Retriever предоставляет релевантные данные (формирует контекст), а LLM интерпретирует их, резюмирует, структурирует и формирует человекочитаемый вывод.
Без модели, RAG – это просто поиск; модель превращает результаты поиска в связный и осмысленный ответ.