Pokemon Chat 狭义 RAG 主流程:Knowledge Base 从入库到回答
AIRAGPokemonChatEngineering
围绕 Pokemon Chat 的 Knowledge Base RAG,拆解从上传文件、解析切块、Embedding、写入 Milvus,到用户提问、向量召回、Rerank、拼接 Prompt、LLM 生成和返回 refs 的完整工程链路。
4 articles tagged with RAG
围绕 Pokemon Chat 的 Knowledge Base RAG,拆解从上传文件、解析切块、Embedding、写入 Milvus,到用户提问、向量召回、Rerank、拼接 Prompt、LLM 生成和返回 refs 的完整工程链路。
系列入口篇:整体拆解 pokemon agent 的前端控制层、后端路由层、RAG 检索层、Agent 编排层、基础设施层与运行时配置层。
从前端组装 meta/history,到 FastAPI 分流、本地直答、RAG 检索增强、LangGraph Agent 调度,再到 NDJSON 流式回前端,系统拆解一次用户提问的完整生命周期。
围绕普通聊天模式,拆解本地事实直答、语义缓存、多源 Retriever、查询改写与最终生成链路,解释 pokemon agent 的 RAG 主链如何工作。