当前位置：首页 > news >正文

LLM基础概念：RAG

news 2025/7/4 12:02:39

什么是RAG

在大语言模型时代，RAG指的是在回答问题或生成文本时，先从大规模文档库中检索相关信息，然后利用这些检索到的信息来生成响应或文本，从而提高预测的质量。RAG已被证明能显著提高回答的准确性，减少模型产生的幻觉，尤其是在知识密集型任务中。

RAG的好处

提高答案准确性：通过引用外部知识库中的信息，RAG可以提供更准确的回答
增加用户信任：用户可以通过引用的来源来验证答案的准确性
便于知识更新和引入特定领域知识：RAG通过结合LLMs的参数化知识和外部知识库的非参数化知识，有效的解决了知识更新的问题。

如何实现RAG

RAG如何做到效果最优

提高数据质量：
- 数据清洗：清理掉明显的噪音和错误数据提高数据的多样性和数量
  - 知识库走知识图谱，建立概念之间的关系
知识召回的质量：召回率和准确率
- 合理的chunking，多留一些overlap，保持语义性
- 召回采用多种手段：搜索+语义综合召回，提升召回匹配度

评测驱动

- 多调试，通过评测数据结果驱动调优；并且通过case study理解大模型进一步做出适配的调优策略。

http://www.mrgr.cn/news/38797.html

相关文章：

【系统方案】智慧城市大数据平台建设方案（Word）

GCC使用入门

HAL库I2C通用驱动程序（HAL I2C Generic Driver）

H.264编解码工具 - NVIDIA CUDA

余生，闲话少说，闲事少管，闲人少理（深度）

现在转行AI晚不晚，应该怎么做呢？

LangChain：介绍

STM32F103C8----3-2 LED流水灯（跟着江科大学STM32）

【工具类：FastJsonRedisSerializer】

免费送源码：Javaspringboot++MySQL springboot 社区互助服务管理系统小程序计算机毕业设计原创定制

LeetCode //C - 389. Find the Difference

新组合：节律微生态=单菌完成图+宏基因组

Maven(1)什么是Maven?

人工打电话的操作步骤指南

平衡操控使用场景分析和对低延迟的直播技术要求

感知红利！单车ADAS摄像头提至9.45颗！市场激战再升级

安全类面试题-填空题

Spring Boot 进阶-Spring Boot 如何实现自定义的过滤器详解

人工智能与机器学习原理精解【29】

生信初学者教程（十五）：差异结果的热图