Pokemon Chat 狭义 RAG 主流程:Knowledge Base 从入库到回答
围绕 Pokemon Chat 的 Knowledge Base RAG,拆解从上传文件、解析切块、Embedding、写入 Milvus,到用户提问、向量召回、Rerank、拼接 Prompt、LLM 生成和返回 refs 的完整工程链路。
19 articles tagged with AI
围绕 Pokemon Chat 的 Knowledge Base RAG,拆解从上传文件、解析切块、Embedding、写入 Milvus,到用户提问、向量召回、Rerank、拼接 Prompt、LLM 生成和返回 refs 的完整工程链路。
一篇给工程同学的 LangGraph 复习文:10 分钟建模、1 个可运行最小范式、7 个企业高频问题,以及可直接背诵的分组面试题与答案。
基于 pokemon agent 真实代码,系统拆解 LangGraph 的 tools 路由、runtime 执行、结构化 JSON 输出、memory 分层与上下文工程方法。
系列入口篇:整体拆解 pokemon agent 的前端控制层、后端路由层、RAG 检索层、Agent 编排层、基础设施层与运行时配置层。
从前端组装 meta/history,到 FastAPI 分流、本地直答、RAG 检索增强、LangGraph Agent 调度,再到 NDJSON 流式回前端,系统拆解一次用户提问的完整生命周期。
围绕普通聊天模式,拆解本地事实直答、语义缓存、多源 Retriever、查询改写与最终生成链路,解释 pokemon agent 的 RAG 主链如何工作。
拆解 pokemon agent 的 Agent 模式:前端如何切到 supervisor_agent,LangGraph 如何用状态和工作流编排 supervisor、workers 与 finalizer。
从 .env、ui_config.json、feature flag、/config PATCH、runtime reset 到 health/ready 探针,系统拆解 pokemon agent 的运行时配置热切换机制。
以 pokemon agent 为例,拆解一个多依赖 AI 系统如何用 Docker Compose 组织主干服务、能力服务与 profiles,并划分清晰的服务边界。
从检索、分块、向量化到混合检索、重排和评估,系统梳理 RAG 的核心机制、工程权衡与高频面试问题。
从 Anthropic 的 Building effective agents 出发,系统梳理构建有效 Agent 的核心方法:何时该用 workflow、何时才该上 agent、五类 workflow 模式、agent loop 止损与工具接口设计。
以 harness engineering 的视角解构一个面向 GAIA benchmark 的 Agent 系统:如何组织路由、Loop、工具层、RAG、答案提取与评测闭环,让智能体既能做事,也能被调试、被约束、被验证。
以 Movie Gen 与 Hunyuan Video 为例,系统拆解视频生成的数据引擎:为什么要做质量过滤、运动过滤、去重重采样、结构化字幕与镜头标注,以及这些设计如何直接影响模型的可控性与能力边界。
以 Movie Gen 与 Hunyuan Video 为例,系统梳理视频生成模型的内部工作流:为什么必须先压缩到 latent 空间,patchify 与位置编码如何组织时空 token,文本条件与时间条件怎样进入 Transformer,以及 Flow Matching 在训练和推理时到底在学什么。
从前端设计实验到全栈自主开发,梳理 Anthropic 如何用 harness design 处理长时间任务中的上下文退化、自评失真、任务交接、流程迭代与验证闭环。
面向 AI 科研新手的术语速查指南,涵盖 Baseline、Benchmark、SOTA、Ablation Study 等论文中最常见的专业术语。
从 Skill 设计方法讲到 latex-paper-skills 的完整实战:详解如何把论文写作拆成可复用的 Agent Skills,以及 Gate-Contract-Verify、双路径工作流、引用审计、多模型协作与编译交付。

一篇讲透 Agent Skills 的实战指南:从职责边界、触发条件、SKILL.md 结构到渐进式披露与资源分层,系统教你设计可复用、可维护、可跨平台迁移的 AI Agent Skills。
从 Anthropic 的 Building effective agents 出发,结合 GAIA Agent 完整实战,详解 Workflows vs Agents 选型、五种 Workflow 模式、工具三层架构、System Prompt 设计、Agent Loop 止损、RAG 短路、Python 沙箱与评测闭环。
