RAG(检索增强生成)原理与实战入门:讲解RAG的核心思想、基本架构(索引→检索→生成→回答)、适用场景,以及为什么RAG成为LLM应用的主流范式。
RAG 实战
检索增强生成技术 · 向量数据库 · Knowledge Graph
文章列表
- 11
- 12主流向量数据库横向对比:Pinecone、Milvus、Weaviate、Chroma、Qdrant等,从性能、成本、易用性、部署方式等多维度分析,并提供实战选择建议。
- 13RAG系统的两大基石:如何科学地切分文档(固定大小、语义切片、滑动窗口),如何选择和优化Embedding模型(OpenAI、Cohere、BGE等),以及这些选择如何影响检索质量。
- 14提升RAG准确率的关键技术:结合关键词检索(BM25)和向量检索的混合检索策略,使用Cross-encoder等重排序模型优化检索结果,以及如何平衡准确性和效率。
- 15进阶RAG技术:处理复杂推理问题的多跳检索(Multi-hop Retrieval)、自反思检索(Self-RAG)、递归检索与迭代优化,以及如何让AI自主判断何时需要检索。
- 16如何科学评估RAG系统效果:介绍RAGAS、TruLens、DeepEval等评估框架,讲解Faithfulness、Answer Relevancy、Context Precision等核心指标,以及如何构建自动化评估流程。
- 17知识图谱与RAG的结合:GraphRAG如何利用实体关系和图结构提升检索质量、Community Detection算法、图谱构建流程,以及在结构化知识场景中的优势。
- 18RAG系统生产化实践:缓存策略(语义缓存、LRU缓存)、并发控制与限流、成本优化(模型选择、Token优化)、监控告警,以及构建高可用RAG服务的经验总结。