RAGFlow 命中率最高的RAG知识库引擎 本地部署 小白教程

资源包:ragflow资源包链接: https://pan.baidu.com/s/1aBSMLuKZL1Wa2EOfxK9qvg 提取码: a2jm

前言

知识库构建

基于传统的 RAG框架,市面上涌现出很多具有代表性的RAG+AI工作流+AGENT的实现方式。包括MaxKB,AnythingLLM、Dify、FastGPT、RAGFlow、DB-GPT、Langchain-Chat等等。网上已经有大大做了横向测评,虽可能带有些主观色彩且随着产品不断迭代,缺点也可能已经补齐。其中 RAGFlow 以其对深度文档理解著称;而高度可配置的 Dify,则为用户提供了更为灵活多样的选择。

今天就带领大家部署安装目前知识库命中率最高的ragflow.毕竟知识喂给模型了,他调用不出来,回答的驴唇不对马嘴,还是很恼火的。

RAGFlow简介:是一款基于深度文档理解构建的开源 RAG引擎,可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型,针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。

配置要求 以windows为例

  • 系统版本最低要求:Windows 10 或 Windows 11 64-bit,家庭版、专业版、企业版、教育版 22H2 (build 19045) 或者更高。(劝退精简版系统用户)
  • CPU>=4核心
  • 内存>= 16 GB

如何查询您的系统版本呢?

使用 Windows + R 快捷键打开「运行」- 运行 winver 命令打开「系统信息」工具。

如何查看硬件配置呢?

右键 开始 任务管理器 性能 就可以看CPU 内存 硬盘 GPU信息了

部署步骤简单介绍:

  1. 安装docker
  2. 安装ragflow
  3. 设置ragflow 对接模型 本地或api

一、安装docker

系统版本最低要求就是针对docker的,docker 会调用 windows 自带的虚拟化功能 Hyper-V 或 适用于 Linux 的Windows子系统。

  1. 在windows上启用虚拟化技术
    开机按F2或DEL进入UEFI/BIOS找到虚拟化选项开启,品牌机可以参考Windows官方说明,其他用户直接百度谷歌搜下XX主板 如何开启虚拟化 即可。这里不再演示。

  2. 启用或关闭 Windows 功能
    开启后进入系统。开始 搜索 启用或关闭 Windows 功能 选中

  • Hyper-V
  • 适用于Linux的Windows子系统
  • Virtual Machine Platform
    点击确定,系统会自动安装并重启。
  1. 下载安装docker
    下载:重启进入系统后,下载并安装docker,可以官网,可以用我给大家整理好的资源包。
    安装位置:docker默认是安装在C盘,安装过程中无法更改。官方提供了从命令行安装的方法。
    例如:安装到D盘Docker目录下,将安装包放在D盘根目录,在D盘创建2个空文件夹Docker,WSL,分别用于存放 docker程序,和 WSL(指定 WSL 分发磁盘的默认位置)
    安装:管理员身份打开cmd (注意是cmd不是powershell终端),
    cd /d d:\ 进入D盘根目录
    复制粘贴如下命令
1
start /w "" "Docker Desktop Installer.exe" install --backend=wsl-2 --installation-dir=D:\Docker --wsl-default-data-root=D:\WSL --accept-license

参数说明

安装完 点击 close and restart 会重启系统 打开docker desktop 及一个cmd窗口,提示适用于 Linux 的 Windows 子系统必须更新到最新版本才能继续,可通过运行 “wsl.exe –update” 进行更新,回车 进行安装。期间Docker destop会因为这个报错,没关系点击Quit,等WSL更新安装完就好了。

全部安装完成后如果你的管理员账户与你的用户账户名 比如我的augus不同,需要将用户添加到docker-user组
计算机管理去添加
或者终端管理员

1
net localgroup docker-users augus /add

设置:Docker engine 更换国内镜像源

原为 建议备份

1
2
3
4
5
6
7
8
9
{
"builder": {
"gc": {
"defaultKeepStorage": "20GB",
"enabled": true
}
},
"experimental": false
}

更改为以下,直接复制粘贴过去。增加的实际是是docker国内镜像,以后可能会失效,失效就需要替换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
{
"builder": {
"gc": {
"defaultKeepStorage": "20GB",
"enabled": true
}
},
"experimental": false,
"registry-mirrors": [
"https://docker.1ms.run",
"https://docker.1panel.dev",
"https://docker.zhai.cm"
]
}

粘贴好之后 点击 apply and restart

二、安装ragflow

  1. 确保 vm.max_map_count 不小于 262144
    这个参数是Linux内核参数,用于限制进程可使用的最大内存映射数量。

终端管理员

1
2
3
4
5
6
7
8
9
wsl -d docker-desktop -u root

#查看
sysctl vm.max_map_count
确保不小于262144,若小于

vi /etc/sysctl.conf
vm.max_map_count=262144
# 按ESC键,输入:wq 回车进行保存

  1. 下载安装ragflow

如果你有git

1
git clone https://github.com/infiniflow/ragflow.git

如果没有,官网下载 将资源包中的 ragflow-main.zip 放到D盘根目录
解压到当前文件夹,进入到ragflow-main/docker 目录下
找到.env文件 右键打开方式 选择其他应用 记事本

  • CTRL+F 搜索定位 DOC_ENGINE=${DOC_ENGINE:-elasticsearch}
    • 如果你的内存16G,将elasticsearch换成infinity
    • 如果你的内存大于16,是32或更多,不用更换。
  • CTRL+F 搜索定位 RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0-slim
    • 在其前面加个# 注释掉 这是删减版我们不要
  • CTRL+F 搜索定位 # RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0
    • 将其前面的#删除,意为下载完整版
  • CTRL+F 搜索定位 # HF_ENDPOINT=https://hf-mirror.com
    • 将其前面的#删除,意为可以使用huggingface的镜像源
    • 修改完成后保存,关掉

更改好后保存

回到终端

1
2
3
cd /d D:\ragflow-main\
# 注意你的目录,粘贴运行如下命令
docker compose -f docker/docker-compose.yml up -d

等待安装完成,如果期间报错退出,重新运行上述命令,如果还不行,需要回到docker desktop 去更改国内镜像源了(前面讲过)。如果还是不行那么只能代理了。

安装完成后

ragflow简单设置,对接模型

浏览器打开 127.0.0.1 就可以进入ragflow

注册账户并登录,注册是无需验证的

右上角更改语言

添加模型前准备模型名称及IPV4地址 以ollama为例子

1
2
# 查看模型名称
Ollama list

查看已经部署好的模型
比如 deepseek-r1:14b

查看自己Ip
右下角网络图标,右键 网络和internet设置点击正字使用的网络 比如以太网 比如 无线网络 最下方 IPV4地址 我这里是192.168.3.203

http://192.168.3.203:11434