与文档和知识库聊天

Open WebUI 支持检索增强生成（RAG），可帮助本地 AI 模型基于你上传的文档或整理好的知识库回答问题。

本指南介绍如何在聊天会话中分析单个文档，以及如何构建可重复使用的持久知识集合。

学习目标

在本指南中，你将学习如何：

配置嵌入模型来处理文档文本。
在聊天会话中上传并分析单个文档。
构建和管理持久知识库。
（可选）为复杂文档版式配置高级内容提取引擎。

前提条件

开始前，确保已满足以下条件：

已安装并配置 Open WebUI，且至少有一个可用的模型后端。
已安装嵌入模型应用，例如 Qwen3 Embedding 0.6B (Ollama)。
拥有 Open WebUI 实例的管理员权限。

配置嵌入模型

文档理解需要嵌入模型将文本转换为向量数据。要配置 Open WebUI，需要先获取嵌入模型信息。

获取嵌入模型信息

从启动台打开 Qwen3 Embedding 0.6B (Ollama)。
记录主页面上显示的准确模型名称。例如：qwen3-embedding:0.6b。

在 Open WebUI 中应用嵌入设置

在 Open WebUI 中，选择你的头像图标，然后前往 Admin Panel > Settings > Documents。
在 Embedding 区域中，指定以下设置：
- Embedding Model Engine：选择 Ollama。
- API Base URL：输入你之前记录的嵌入模型端点 URL。
- Embedding Model：输入你之前记录的嵌入模型名称。

分析单个文档

将文档直接附加到聊天会话中，用于一次性的分析和总结。

开始一个新聊天。
选择模型。
点击消息输入框下方的 add_2，然后选择 Upload Files。
上传 PDF 或文本文件。
输入提示词，让模型分析文档。例如：
plain
```
Summarize the main points of this document.
```
提交提示词。如果生成的回复包含文件引用，说明 Open WebUI 已成功将该文档加入上下文。

构建知识库

对于需要在多个聊天中重复使用的文档，需创建持久知识库。

在 Open WebUI 中，点击你的头像图标，然后前往 Workspace > Knowledge。
点击 New Knowledge。
在 What are you working on 字段中，输入知识库名称。例如：Product FAQs。
在 What are you trying to achieve 字段中，输入描述。例如：Frequently asked questions and support guides for Olares products。
点击 Create Knowledge 保存集合。
点击 add > Upload files，然后上传文件来填充知识库。

将知识库附加到聊天

开始一个新聊天。
选择模型。
点击消息输入框下方的 add_2，然后选择 Attach Knowledge。
选择要使用的知识集合。
询问与知识库内容相关的问题。模型会检索相关段落，并在回复中引用它们。

（可选）配置高级提取引擎

默认情况下，Open WebUI 使用简单的文本提取引擎。对于包含表格或复杂格式的文档版式，需切换到 PaddleOCR，以获得更好的准确性。

性能影响

PaddleOCR 需要更多 GPU VRAM，处理文档也比默认引擎更慢。仅在文档版式质量非常关键时使用该引擎。

从应用市场安装 PaddleOCR 应用。
获取 PaddleOCR 端点 URL：
a. 打开 Olares 设置，然后前往应用 > PaddleOCR > 共享入口 > PaddleOCR API。
b. 复制端点 URL。例如：http://6b2a6fc50.shared.olares.com。
在 Open WebUI 中，前往 Admin Panel > Settings > Documents。
在 General 区域中，为 Content Extraction Engine 选择 PaddleOCR-vl。
在 API Base URL 中，输入 PaddleOCR 端点 URL。
在 API Token 中，输入任意文本。不要留空。
点击 Save。