AI测试入门:基于 RAG 的 LLM 应用程序的测试方法「详细介绍」
AI测试入门:基于 RAG 的 LLM 应用程序的测试方法「详细介绍」
- 1. RAG 架构
- 2. 检索器和生成器的作用
- 3. RAG 的评估指标
- 3.1 检索器指标:答案相关性(Answer Relevancy)
- 3.2 检索器指标:忠诚度(Faithfulness)
- 3.3 检索器指标:上下文召回(Contextual Recall)
- 3.4 检索器指标:上下文精度(Contextual Precision)
- 4. 测试方法
1. RAG 架构
一个典型的 RAG 架构包括一个检索器(对知识库进行矢量搜索检索上下文的组件)和一个生成器(从检索器中获取检索上下文以构建提示并生成自定义 LLM 响应作为最终输出的组件)。在大多数情况下, “知识库” 由存储在向量数据库(如 ChromaDB)中的向量嵌入组成。
RAG 架构的示意图说明如下:
1.检索器在运行时,首先嵌入给定的输入;
2.搜索包含数据的向量空间以找到前 K 个最相关的检索结果 ;
3.根据相关性(或与矢量化输入嵌入的距离)对结果进行排名;
4.最后被处理成一系列提示,并传递给生成器,也就是你选择的 LLM &