AI - Tags | Yun Shen

Back

Home

19 articles tagged with AI

Pokemon Chat 狭义 RAG 主流程：Knowledge Base 从入库到回答
May 07, 2026
AIRAGPokemonChatEngineering
围绕 Pokemon Chat 的 Knowledge Base RAG，拆解从上传文件、解析切块、Embedding、写入 Milvus，到用户提问、向量召回、Rerank、拼接 Prompt、LLM 生成和返回 refs 的完整工程链路。
LangGraph 复习：从 0 到生产级 Agent
April 24, 2026
AIAgentLangGraphEngineering
一篇给工程同学的 LangGraph 复习文：10 分钟建模、1 个可运行最小范式、7 个企业高频问题，以及可直接背诵的分组面试题与答案。
pokemon agent runtime 系列（七）：LangGraph 工程化实战
April 23, 2026
AIAgentLangGraphEngineering
基于 pokemon agent 真实代码，系统拆解 LangGraph 的 tools 路由、runtime 执行、结构化 JSON 输出、memory 分层与上下文工程方法。
pokemon agent runtime 系列（一）：系统设计全景图
April 20, 2026
AIAgentRAGSystemDesign
系列入口篇：整体拆解 pokemon agent 的前端控制层、后端路由层、RAG 检索层、Agent 编排层、基础设施层与运行时配置层。
pokemon agent runtime 系列（二）：一次提问的完整调用链
April 20, 2026
AIAgentRAGCallChain
从前端组装 meta/history，到 FastAPI 分流、本地直答、RAG 检索增强、LangGraph Agent 调度，再到 NDJSON 流式回前端，系统拆解一次用户提问的完整生命周期。
pokemon agent runtime 系列（三）：本地直答、缓存与 RAG 主链
April 20, 2026
AIRAGRetrievalEngineering
围绕普通聊天模式，拆解本地事实直答、语义缓存、多源 Retriever、查询改写与最终生成链路，解释 pokemon agent 的 RAG 主链如何工作。
pokemon agent runtime 系列（四）：LangGraph Agent 编排
April 20, 2026
AIAgentLangGraphOrchestration
拆解 pokemon agent 的 Agent 模式：前端如何切到 supervisor_agent，LangGraph 如何用状态和工作流编排 supervisor、workers 与 finalizer。
pokemon agent runtime 系列（五）：配置热切换与运行时覆盖
April 20, 2026
AIConfigDevOpsRuntime
从 .env、ui_config.json、feature flag、/config PATCH、runtime reset 到 health/ready 探针，系统拆解 pokemon agent 的运行时配置热切换机制。
pokemon agent runtime 系列（六）：Docker Compose 架构与服务分层
April 20, 2026
AIDockerDevOpsInfrastructure
以 pokemon agent 为例，拆解一个多依赖 AI 系统如何用 Docker Compose 组织主干服务、能力服务与 profiles，并划分清晰的服务边界。
RAG 原理、流程与关键设计
April 17, 2026
AILLMNLP
从检索、分块、向量化到混合检索、重排和评估，系统梳理 RAG 的核心机制、工程权衡与高频面试问题。
构建有效 Agents：方法、Workflow 与 Agent Loop
April 16, 2026
AIAgentTooling
从 Anthropic 的 Building effective agents 出发，系统梳理构建有效 Agent 的核心方法：何时该用 workflow、何时才该上 agent、五类 workflow 模式、agent loop 止损与工具接口设计。
GAIA Agent：从组件设计到评测闭环
April 16, 2026
AIAgentTooling
以 harness engineering 的视角解构一个面向 GAIA benchmark 的 Agent 系统：如何组织路由、Loop、工具层、RAG、答案提取与评测闭环，让智能体既能做事，也能被调试、被约束、被验证。
视频生成的数据引擎：视频模型真正学到什么，往往先由数据决定
April 16, 2026
AIGenAI
以 Movie Gen 与 Hunyuan Video 为例，系统拆解视频生成的数据引擎：为什么要做质量过滤、运动过滤、去重重采样、结构化字幕与镜头标注，以及这些设计如何直接影响模型的可控性与能力边界。
视频生成模型怎么工作：从 VAE 压缩、Patchify 到 Flow Matching
April 16, 2026
AIGenAI
以 Movie Gen 与 Hunyuan Video 为例，系统梳理视频生成模型的内部工作流：为什么必须先压缩到 latent 空间，patchify 与位置编码如何组织时空 token，文本条件与时间条件怎样进入 Transformer，以及 Flow Matching 在训练和推理时到底在学什么。
Harness 设计：如何让 Claude 处理长时间自主开发
April 12, 2026
AIAgentTooling
从前端设计实验到全栈自主开发，梳理 Anthropic 如何用 harness design 处理长时间任务中的上下文退化、自评失真、任务交接、流程迭代与验证闭环。
AI 科研术语扫盲：从 Baseline 到 SOTA，一文搞懂论文高频术语
March 09, 2026
AIPaper
面向 AI 科研新手的术语速查指南，涵盖 Baseline、Benchmark、SOTA、Ablation Study 等论文中最常见的专业术语。
Agent Skills 实战：从 Skill 设计方法到 latex-paper-skills 论文工作流
March 04, 2026
AIPaperTooling
从 Skill 设计方法讲到 latex-paper-skills 的完整实战：详解如何把论文写作拆成可复用的 Agent Skills，以及 Gate-Contract-Verify、双路径工作流、引用审计、多模型协作与编译交付。
Agent Skills 实战指南：从 SKILL.md 到可复用工作流设计
March 04, 2026
AIAgentTooling
一篇讲透 Agent Skills 的实战指南：从职责边界、触发条件、SKILL.md 结构到渐进式披露与资源分层，系统教你设计可复用、可维护、可跨平台迁移的 AI Agent Skills。
用 Anthropic 的方法构建有效 Agents：工程化笔记
March 04, 2026
AIAgentTooling
从 Anthropic 的 Building effective agents 出发，结合 GAIA Agent 完整实战，详解 Workflows vs Agents 选型、五种 Workflow 模式、工具三层架构、System Prompt 设计、Agent Loop 止损、RAG 短路、Python 沙箱与评测闭环。

Pokemon Chat 狭义 RAG 主流程：Knowledge Base 从入库到回答

LangGraph 复习：从 0 到生产级 Agent

pokemon agent runtime 系列（七）：LangGraph 工程化实战

pokemon agent runtime 系列（一）：系统设计全景图

pokemon agent runtime 系列（二）：一次提问的完整调用链

pokemon agent runtime 系列（三）：本地直答、缓存与 RAG 主链

pokemon agent runtime 系列（四）：LangGraph Agent 编排

pokemon agent runtime 系列（五）：配置热切换与运行时覆盖

pokemon agent runtime 系列（六）：Docker Compose 架构与服务分层

RAG 原理、流程与关键设计

构建有效 Agents：方法、Workflow 与 Agent Loop

GAIA Agent：从组件设计到评测闭环

视频生成的数据引擎：视频模型真正学到什么，往往先由数据决定

视频生成模型怎么工作：从 VAE 压缩、Patchify 到 Flow Matching

Harness 设计：如何让 Claude 处理长时间自主开发

AI 科研术语扫盲：从 Baseline 到 SOTA，一文搞懂论文高频术语

Agent Skills 实战：从 Skill 设计方法到 latex-paper-skills 论文工作流

Agent Skills 实战指南：从 SKILL.md 到可复用工作流设计

用 Anthropic 的方法构建有效 Agents：工程化笔记