RAG 实战 · 从一篇文档到一个回答

什么是 RAG · 流程怎么走 · Ragflowy 在这条链路里做了什么

什么是 RAG?为什么要它? 3 句话讲清
问:LLM 不是已经很强了吗?
大模型只懂公开数据,不知道你公司的合同、SOP、客户档案这些私有知识。直接问"我们 2025 Q3 的退货政策"—— 它要么瞎编,要么说不知道。
问:那训练一个企业大模型不就行了?
微调一次百万级成本 + 几周时间,新文档来了又得重训。还容易"灾难性遗忘"——改 A 部门的就把 B 部门的忘了。
问:那 RAG 是怎么解的?
RAG = Retrieval-Augmented Generation(检索增强生成)。每次提问先去知识库检索相关内容,再把检索结果和问题一起喂给 LLM,让它基于"参考资料"作答。文档变了只换库,模型不动。
能做什么
企业知识库问答 客服 FAQ 智能文档助手 法律 / 医疗 / 金融 专家系统 代码库问答
RAG 完整流程 · 用户视角主线 8 步走完
  离线 · 数据准备(把文档建成可检索的知识库)
1详情

上传文档

PDF / Word / PPT
Excel / TXT / MD / HTML
2详情

切分

长文档拆成
语义完整的 chunk
3详情

向量化

每个 chunk
变成数字向量
4

入库

向量库存好
等待检索
  在线 · 用户问答(每次提问触发)
5详情

用户提问

输入问题
问题也变成向量
6详情

检索匹配

向量库返回
相似度最高的 N 个
7详情

LLM 生成

问题 + 检索结果
一起给大模型
8

返回答案

基于参考资料
+ 引用来源
  点击任意流程节点,弹出该环节的「需要做什么 + Ragflowy 怎么做」对照展开
Ragflowy 工具栈
文档清洗
多源 → 干净 md
文档分段
语义+结构 双保障
QA 生成
为检索造标准答案
RAGFlow
向量化 + 检索引擎
GridSearch
扫最优参数组合
RAG 评测
Ragas 生成质量
FAQ
真实问答集
聊天助手
端到端问答入口