RAG 实战

检索增强生成技术 · 向量数据库 · Knowledge Graph

文章列表

11
RAG基础：检索增强生成入门
第 11 期 2026-01-09 · 8 分钟阅读入门
RAG（检索增强生成）原理与实战入门：讲解RAG的核心思想、基本架构（索引→检索→生成→回答）、适用场景，以及为什么RAG成为LLM应用的主流范式。
12
向量数据库选型与实战
第 12 期 2026-01-09 · 7 分钟阅读实践
主流向量数据库横向对比：Pinecone、Milvus、Weaviate、Chroma、Qdrant等，从性能、成本、易用性、部署方式等多维度分析，并提供实战选择建议。
13
文档切片与Embedding策略
第 13 期 2026-01-09 · 8 分钟阅读实践
RAG系统的两大基石：如何科学地切分文档（固定大小、语义切片、滑动窗口），如何选择和优化Embedding模型（OpenAI、Cohere、BGE等），以及这些选择如何影响检索质量。
14
混合检索与重排序（Reranking）
第 14 期 2026-01-09 · 11 分钟阅读进阶
提升RAG准确率的关键技术：结合关键词检索（BM25）和向量检索的混合检索策略，使用Cross-encoder等重排序模型优化检索结果，以及如何平衡准确性和效率。
15
Advanced RAG：多跳检索与Self-RAG
第 15 期 2026-01-09 · 11 分钟阅读进阶
进阶RAG技术：处理复杂推理问题的多跳检索（Multi-hop Retrieval）、自反思检索（Self-RAG）、递归检索与迭代优化，以及如何让AI自主判断何时需要检索。
16
RAG评估体系构建
第 16 期 2026-01-09 · 12 分钟阅读进阶
如何科学评估RAG系统效果：介绍RAGAS、TruLens、DeepEval等评估框架，讲解Faithfulness、Answer Relevancy、Context Precision等核心指标，以及如何构建自动化评估流程。
17
GraphRAG：知识图谱增强检索
第 17 期 2026-01-09 · 8 分钟阅读进阶
知识图谱与RAG的结合：GraphRAG如何利用实体关系和图结构提升检索质量、Community Detection算法、图谱构建流程，以及在结构化知识场景中的优势。
18
RAG生产环境最佳实践
第 18 期 2026-01-09 · 8 分钟阅读实践
RAG系统生产化实践：缓存策略（语义缓存、LRU缓存）、并发控制与限流、成本优化（模型选择、Token优化）、监控告警，以及构建高可用RAG服务的经验总结。