Dify+DeepSeek实战教程！企业级 AI 文档库本地化部署，数据安全与智能检索我都要

笔记哥 / 04-28 / 3点赞 / 0评论 / 586阅读

4 28

技术博文 DeepSeek

## Dify Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务（Backend as Service）和 LLMOps 的理念，使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员，也能参与到 AI 应用的定义和数据运营过程中。 ### 部署 Dify Dify 官方提供了使用 [Docker Compose 部署](https://docs.dify.ai/zh-hans/getting-started/install-self-hosted/docker-compose)的方式，如下： ```bash $ git clone https://github.com/langgenius/dify.git --branch 0.15.3 $ cd dify/docker $ cp .env.example .env $ docker-compose up -d ``` 你可能会遭遇无法获取 Github 代码、Docker 镜像等问题，需要挂🪜解决。 ### 使用 Rainbond 部署对于不熟悉 K8s 的伙伴，又想在 K8s 中安装 `Dify`，可以使用 Rainbond 来部署。Rainbond 是一个无需了解 K8s 的云原生应用管理平台，支持通过可视化界面管理容器化应用，提供应用市场一键部署、源码构建等能力，帮助用户在不接触 K8s 底层的前提下，轻松实现应用的生产级部署与运维。 **免费试用 Rainbond Cloud（零门槛快速体验）** 如果你想零成本快速上手云原生部署，推荐直接体验 Rainbond Cloud（点击注册 `https://run.rainbond.com`，新用户即享免费额度）—— 无需自备服务器或配置复杂环境，注册登录后，在云端环境中一键部署 `Dify`，5 分钟内即可开启 AI 应用开发。 **私有化本地部署（企业级可控性首选）** 如果需要将 Dify 部署在自有服务器或数据中心（满足数据本地化、合规性要求），Rainbond 提供极简[私有化部署方案](https://www.rainbond.com/docs/quick-start/quick-install)，无需手动编写 K8s 配置，10 分钟内即可完成生产级环境搭建： ```csharp curl -o install.sh https://get.rainbond.com && bash ./install.sh ``` 等待几分钟后，通过 `http://IP:7070` 访问 Rainbond 并注册登录。 **通过应用市场一键部署 Dify** 创建应用并选择通过应用市场部署，在开源应用商店中搜索`Dify` ，点击一键安装。 ![](https://cdn.res.knowhub.vip/c/2505/05/8bd16b9b.png?G0YAAMS2SeOk0tq2HdkHj1FCBBM5cAkUAmu70nO9BGnu%2b0YRoPyRuJrpQV8e%2fnw5NbhoL58umlAlGwMTFHivCg%3d%3d) 等待拓扑图中的组件颜色全部变为绿色则代表部署成功。由于应用模板给每个组件分配的资源比较少，只能保障基本运行，在实测过程中索引 200 个文档左右 Worker 等服务就发生了 OOM。需要在安装完成后手动调整下相关组件的资源，比如 `API、Worker、Plugin、Sandbox` 组件的资源配额。进入到组件内 -> 伸缩，修改资源为 `500m、1G` ，具体根据实际情况来调整。 ![](https://cdn.res.knowhub.vip/c/2505/05/2df18bed.png?G04AAMS22TiZe9tm2ZvweNILT7ABBy6BQmD5SOd6CbKr8uvMQPljNgP0iIeHP%2f81txSrP5cumhF0xGMglAqJF3ZbhgE%3d) 点击访问按钮即可通过平台生成的域名访问 Dify 可视化界面，注册即可开始 AI 应用开发之旅。 ![](https://cdn.res.knowhub.vip/c/2505/05/623bb69b.png?G0IAAORznlf8fZ9ReLCytcAhBy7fCQKhwFKthStbFeuuOxEH5Q8GzZRDHj%2f88y02ahTff1hgIFCh) ## 配置 Dify 使用本地大模型关于如何在本地部署 DeepSeek R1 大模型可以参考我写的上一篇文章 [K8S 部署 Deepseek 要 3 天？别逗了！Ollama+GPU Operator 1 小时搞定](https://mp.weixin.qq.com/s/c4TLKeiTHlXxcLpC5xhBAg)，同时在[哔哩哔哩](https://www.bilibili.com/video/BV1J2LbzBEPW)也有视频。 ### 添加 Embedding 模型 Embedding 模型就像一个**语义转换器**：把我们写的文字、上传的文档这些人类能看懂的内容，变成机器能计算的数字指纹（向量）。比如**怎么备份文件**和**文件备份步骤**，这两句话意思差不多，经过模型处理后，生成的向量也很接近，这样机器就能知道它们是同一个意思，而不是只看字是不是一样。在咱们的知识库里，上传的资料必须先通过这个模型转换成向量，存到专门的数据库里。这样当用户用自然语言提问时，系统不是傻乎乎地匹配关键词，而是真正理解问题的意思，从数据库里精准找到最相关的内容。比如问**API 调用报错怎么解决**，系统能直接定位到文档里讲错误处理的部分，而不是只返回带**API和报错**字眼的零散段落，这一步就像给知识库建了一个**语义索引**，是让 AI 能读懂咱们私有数据的关键。 **使用 Ollama 部署本地的 Embedding 模型：** 进入 Rainbond 的 Ollama 组件内，进入 Web 终端执行如下命令： ```bash ollama pull bge-m3 ``` ![](https://cdn.res.knowhub.vip/c/2505/05/88fdd902.png?Gz4AAORtm0v9vWdqGkRFCVHjc5BCQKlrhcjctxAF5Yegr6WH%2b%2fzw6zMJTtLePqigZxVu2Bi4pwM%3d) 为啥选 BGE-M3？主要因为它是专为中文检索场景定制的选手，背靠中科院团队研发，天生自带中文语义理解 Buff。你也可以直接在 Ollama 里搜索其他 Embedding 模型。 ![](https://cdn.res.knowhub.vip/c/2505/05/9288d08a.png?G0EAAORtm0v9vSdaGlRGCRFswAl5JKkGtuq5qld45r6FCCh%2fCFqEHu7Lwz9fFeck7e1DJYoxeDIsq4J7GQ%3d%3d) ### 在 Dify 中配置本地 Embedding 模型和 LLM 模型进入 Dify 页面后，点击右上角头像 -> 设置 -> 模型供应商，安装 Ollama。插件安装可能需要点时间，如未成功请再次安装。 ![](https://cdn.res.knowhub.vip/c/2505/05/d05f44cd.png?G0AAAORznlf8fZ9ReLCytcAhBy7fCQKhwFKthStdFeuuOxEH5Q8GzZRDHj%2f88y02ahTff1hgQi1QoQ%3d%3d) 分别对接本地的 LLM 和 Text Embedding 模型相关信息。我这里填写的是 Ollama 内网地址，因为我的 Dify 和 Ollama 部署在一个 Rainbond 集群内，就可以通过内网访问；内网地址可在 Ollama 组件内 -> 端口查看到对内服务的访问地址，如下： ![](https://cdn.res.knowhub.vip/c/2505/05/3f5f7b51.png?G0YAAMS2SeOk0tq2HdkHj1FCBBM5cAkUAmu70nO9BGnu%2b0YRoPyRuJrpQV8e%2fnw5NbhoL58umlAlGwMTFHivCg%3d%3d) ![](https://cdn.res.knowhub.vip/c/2505/05/f774a686.png?G0YAAMS2SeOkQmPbdmQfPEYJEUzkwCVQCKztSs%2f1EqS57xtFgPJH4mqmB315%2bPPl1OCivXy6aEKVbAxMUOC9Kg%3d%3d) 踩坑：保存后模型没有添加，我又添加了好几次，最后我等了10分钟左右插件才加载好，前面重复添加的几个都出来了-。- ![](https://cdn.res.knowhub.vip/c/2505/05/bc043c36.png?G0YAAMS2SeOkDm1t25F98BglRDCRA5dAIbC2Kz3XS5Dmvm8UAcofiauZHvTl4c%2bXU4OL9vLpoglVsjEwQYH3qg%3d%3d) 配置系统默认模型。 ![](https://cdn.res.knowhub.vip/c/2505/05/05671119.png?G0YAAMS2SeOkLk1t25F98BglRDCRA5dAIbC2Kz3XS5Dmvm8UAcofiauZHvTl4c%2bXU4OL9vLpoglVsjEwQYH3qg%3d%3d) ## 创建知识库点击上方的知识库按钮，创建一个新的知识库，上传本地的文档并下一步。 ![](https://cdn.res.knowhub.vip/c/2505/05/cce16392.png?G0MAAORznlf8fZ9ReLCytWADTsgjTCmwVc%2f1EsK6605EoPzBoJlyyMPDP99io0bx%2fcdlARUK) 这里是对文档进行分段与清洗，这里都默认就可以了，具体可以参考 [Dify 知识库文档](https://docs.dify.ai/zh-hans/guides/knowledge-base)。 ![](https://cdn.res.knowhub.vip/c/2505/05/3218de61.png?G0UAAORtm0uFZu%2bJlnosSohgA07QA0wpsFXP9RLCq%2fbtRED5Q9DW0sORHv75hjgXacwPlwVouNMA) 模型记得选择我们上面配置的 bpe-m3 Embedding 模型。 ![](https://cdn.res.knowhub.vip/c/2505/05/a82b8bcd.png?G0UAAORtm0sdvd4TLfVYlBDBBpygB5hSYKue6yWEV%2b3biYDyh6CtpYcjPfzzDXEu0pgfLgvQcKcB) 等待所有文档的状态变为**可用**即可进行下一步。 ![](https://cdn.res.knowhub.vip/c/2505/05/93b4bb2d.png?G0UAAORtm0s9rd4TLfVYlBDBBpygB5hSYKue6yWEV%2b3biYDyh6CtpYcjPfzzDXEu0pgfLgvQcKcB) ## 创建聊天助手首先我们创建一个聊天助手应用。 ![](https://cdn.res.knowhub.vip/c/2505/05/21d67ba6.png?Gz4AAORznlf8fZ9ReLCytWADDlxSiimwVc%2f1EsK6605EoPzBoJlyyMPDP99io0bx%2fcdFYqOGCgU%3d) 添加我们上面创建的知识库 ![](https://cdn.res.knowhub.vip/c/2505/05/7f37f179.png?G0AAAORtm0uFZu%2bJlnosSohgAw5cAoU4WfVcL0G8at9OBJQ%2fBG0tPRzp4Z9viHORxvxwUYhzQcOdBg%3d%3d) 点击右上角的发布，再点击运行。 ![](https://cdn.res.knowhub.vip/c/2505/05/673457f4.png?G0YAAORznhf%2bvs8oPLSytWADDlwiymnAwVa9hQtdFe%2fedxANyh%2bCVqWHI3%2f455vi3KSxPlgQ4txQLBd3Gg%3d%3d) ## 测试对话 ![](https://cdn.res.knowhub.vip/c/2505/05/0722b404.png?G0MAAETnFhPQbY0BgkWdfnPCBhy4BApxsuq5XoIUsG8TAcofxrmWHx3Twz9fWCnER%2f90UVspCHHBeyY%3d) 可以说效果还是比较不错的。如果感觉回答的效果还不满意，可以参考文档对[召回参数进行调整](https://docs.dify.ai/zh-hans/guides/knowledge-base/integrate-knowledge-within-application)。 ## 最后到这儿，一个能读懂企业私有文档、数据完全本地化可控的 AI 知识库就搭好了！从部署 Dify 到配置 Embedding 模型，再到上传文档、创建聊天助手，每一步都是围绕让技术落地为实际需求设计的；既解决了传统文档检索的低效问题，又用本地化部署守住了数据安全的底线。把复杂的架构变成人人能用的工具，让代码和文档真正服务于业务。如果你在搭建过程中遇到资源调整、模型适配等细节问题，别忘了回到文中看看踩坑提示；如果想进一步优化问答效果，Dify 的召回参数配置、Rainbond 的资源调度策略都有很大探索空间。现在，你可以试着让这个专属的 AI 助手回答文档问题，也可以把它分享给团队小伙伴，让知识真正流动起来。

本文来自投稿，不代表本站立场，如若转载，请注明出处：http//www.knowhub.vip/share/2/2948

浏览器如何确定最终的CSS属性值？解析计算优先级与规则

« 上一篇 04-28

ES2025 `Promise.try()` 新API 太好用

04-28 下一篇 »