MrDoc使用说明手册
🎊 基本概念
🚀 快速开始
创建文集
创建文档
添加成员协作
📑 文档与知识库基础
文集基础配置
文集置顶
WebHook消息推送
首页隐藏文集
文集关联集
文集选项卡配置
📄 文档编辑与内容创作
添加文档附件
显示文档目录
创建文档快捷方式
设置文档标签
设置文档别名
插入视频
文档自动保存
📦 文档管理与组织
文集目录排序
修改文档排序
下级文档控制
设置文档上下级
文档历史版本
转让文集
转让文档
复制文档/移动文档
文档访问记录
文集导出与下载
文档下载与导出
导出文档PDF
文档拖拽排序
🔐 协作与权限管理
设置文档权限
设置文集访问权限
文档禁止复制
设置文档水印
文集协作/文集成员管理
文档分享
文集分享
开启文档评论
🗄️ 图片与附件管理
配置图片/附件上传限制大小
配置图片上传格式
配置附件上传格式/附件白名单
附件预览
转让附件/转让图片
清理图片
🎯 数据导入与迁移
桌面客户端导入
导入 Joplin 笔记本
导入印象笔记
Web 端导入
命令行导入
Web端导出
🔑 第三方登录配置
钉钉扫码登录和钉钉内免登配置
企业微信认证接入
LDAP 认证接入配置
OIDC 认证接入
微信公众号网页授权
📦 第三方存储配置
minio 配置
七牛云OSS配置
阿里云OSS配置
AWS S3 配置
🤖 AI知识库与智能问答
基础配置
AI模型配置
Qdrant部署
Dify 框架配置
重建文档AI索引
AI功能
AI 文档创作
📝 OnlyOffice 接入
📊 Drawio 接入
⚓ 系统设置和管理
站点信息配置
首页模板配置
官网主题首页配置说明
用户与账户配置
统计代码配置
文档广告/信息块/自定义head配置
禁止更新检测
全站搜索模式
文档内图片缩略显示
站点反馈
RSS订阅
站点单标签设置
发件邮件配置
站点数据导出
编辑器配置
文集文档页面显示站点顶部导航栏
🧑 个人账号管理
设置默认编辑器
设置用户昵称
修改用户密码
绑定第三方账号
🎈 API 与开发者接口
获取用户 Token
获取文集列表
获取文集目录
获取文集文档列表
获取个人文档列表
获取指定文档内容
新建文集
新建文档
更新文档
上传图片
验证用户Token
🖥️ 客户端与生态集成
💻桌面客户端
📱手机客户端
🌐浏览器扩展
⌨️Obsidian 插件
常见使用问题索引
Powered by MrDoc Pro
-
+
home
🤖 AI知识库与智能问答
🤖 AI知识库与智能问答
## 1. 概述 觅思文档内置了完整的 AI RAG(Retrieval-Augmented Generation,检索增强生成)引擎,可直接实现: * 文档向量化 * 向量检索 * AI 问答 * AI 辅助写作 * 文档语义搜索 * AI 内容生成 内置 AI 引擎采用「RAG + 大语言模型」的方式运行,其核心能力包括: * 文档切片(Chunk) * Embedding 向量化 * 向量检索 * 重排(Rerank) * 大语言模型生成(LLM) 同时,觅思文档并不绑定特定 AI 服务商,所有 AI 能力均可通过独立配置的大模型接口实现,包括: * 文本生成模型 * Embedding 模型 * Rerank 重排模型 在此基础上,觅思文档还支持接入 Dify,用于扩展更复杂的 AI 工作流与应用编排能力。 本文主要介绍: * 觅思文档内置 AI 引擎的工作机制; * Dify 的集成方式; * 独立 AI 接口的作用; * AI 接入后的整体能力。 --- ## 2. AI 接入方案说明 觅思文档目前支持两种 AI 接入方案: | 方案 | 说明 | | --------- | ------------------ | | 内置 AI 引擎 | 使用 MrDoc 自带 RAG 能力 | | Dify 集成方案 | 使用 Dify 作为 AI 平台 | 两种方案: * 功能定位不同; * 配置方式不同; * 运维复杂度不同; 通常情况下: > 选择其中一种方案即可。 --- ### 方案一:内置 AI 引擎 内置 AI 引擎是: > 觅思文档自身实现的一套完整 RAG 知识库方案。 整体流程如下: ```text 文档内容 ↓ 文档切片(Chunk) ↓ Embedding 向量化 ↓ 向量存储 ↓ 用户提问 ↓ 向量检索 ↓ Rerank 重排(可选) ↓ LLM 生成答案 ``` 其特点: * 开箱即用; * 配置简单; * 运维成本低; * 更适合私有部署; * 更适合文档知识库场景。 适用于: * AI知识库 * AI知识问答 * 文档语义搜索 * AI辅助写作 * 企业内部知识库 --- ### 方案二:Dify 集成方案 Dify 是第三方 AI 平台。 觅思文档支持将文档同步到 Dify 知识库,并调用 Dify 提供的 AI 接口。 Dify 更偏向于: * AI 工作流平台 * AI Agent 平台 * 多模型统一管理平台 * AI 应用编排平台 适用于: * 企业 AI 工作流 * AI Agent * 多步骤 AI 自动化 * 复杂 AI 应用 相比内置 AI 引擎: * 运维复杂度更高; * 部署成本更高; * 更适合复杂 AI 场景。 --- ## 3. 觅思文档内置 AI 引擎 ### 内置 AI 引擎架构 觅思文档内置 AI 引擎本质上是一套完整的 RAG 知识库方案。 整体流程如下: ```text 文档内容 ↓ 文档切片(Chunk) ↓ Embedding 向量化 ↓ 向量存储 ↓ 用户提问 ↓ 向量检索 ↓ Rerank 重排(可选) ↓ LLM 生成答案 ``` --- ### 内置 AI 引擎的组成 #### (1)Embedding 向量化模型 用于将文档内容转换为向量数据,以实现语义检索。 主要用于: * 文档向量化 * 用户问题向量化 * 相似度检索 --- #### (2)向量数据库 用于存储文档向量数据。 默认情况下: * 觅思文档可使用内置存储方案; * 无需额外部署向量数据库。 同时也支持配置外部 Qdrant 向量数据库,以获得: * 更高性能; * 更大规模向量存储; * 更强扩展能力。 --- #### (3)Rerank 重排模型(可选) 用于对向量检索结果进行二次排序,提高检索准确率。 适用于: * 大规模知识库; * 相似内容较多的场景; * 对问答准确率要求较高的场景。 --- #### (4)LLM 大语言模型 用于生成最终回答内容。 可用于: * AI 问答 * AI 辅助写作 * 文档总结 * 内容润色 * AI 翻译 --- ## 4. Dify 集成架构 除了内置 AI 引擎外,觅思文档还支持接入 Dify。 Dify 更偏向于: * AI 工作流平台 * AI 应用编排平台 * 多模型统一管理平台 适用于: * 复杂 AI 工作流; * 企业级 AI 应用; * 多模型统一调度; * AI Agent 场景。 --- ### (1)同步文档到 Dify 知识库 觅思文档支持将文档同步到 Dify 知识库,供 Dify 进行: * 文档切片 * 向量化 * AI 问答 同步内容包括: * 文档标题 * 文档正文 支持: * 手动同步 * 自动同步 --- ### (2)调用 Dify AI 接口 觅思文档可直接调用 Dify 提供的接口,包括: * Chat / Completion 接口 * 知识库检索接口 * Dify App 对话接口 用于实现: * AI 聊天 * AI 问答 * AI 工作流 * 企业 AI 助手 --- ## 5. 独立 AI 大模型接口 无论是: * 内置 AI 引擎 * AI 辅助写作 * Dify 集成 本质上都需要调用外部 AI 大模型接口。 因此,觅思文档支持单独配置: | 类型 | 用途 | | ------------ | ---------- | | 文本生成模型 | AI 对话、内容生成 | | Embedding 模型 | 文档向量化 | | Rerank 模型 | 检索结果重排 | 支持接入: * OpenAI 接口规范 * 本地部署模型 * 第三方 AI 服务商 * OpenAI 兼容接口 包括但不限于: * OpenAI * DeepSeek * Qwen * Gemini * Claude * Ollama --- ## 6. AI 知识库问答工作流程 AI知识库问答采用典型 RAG(检索增强生成)流程。 整体工作流程如下: ```mermaid flowchart TD A[用户提问] --> B[问题向量化] B --> C[向量数据库检索] C --> D[召回相关切片] D --> E[Rerank 重排] E --> F[拼接上下文] F --> G[提交 LLM] G --> H[生成最终回答] ``` --- ### 工作流程说明 #### (1)用户提问 用户输入自然语言问题。 例如: ```text 如何部署 Qdrant? ``` --- #### (2)问题向量化 系统调用 Embedding 模型,将用户问题转换为向量。 用于进行语义检索。 --- #### (3)向量检索 系统从向量数据库中查找与问题最相似的文档切片。 --- #### (4)Rerank 重排 如果启用了 Rerank 模型: 系统会对召回结果再次排序,以提高准确率。 --- #### (5)LLM 生成答案 系统将检索结果作为上下文提交给大语言模型。 最终由 LLM 生成自然语言回答。 --- ## 7. 接入后的 AI 能力 完成 AI 接入后,觅思文档可实现以下能力。 --- ### AI 知识库 * 文档语义检索 * AI 知识问答 * RAG 检索增强生成 * 企业知识库 --- ### AI 写作 * AI 文档创作 * AI 内容续写 * AI 润色优化 * AI 翻译 --- ### AI 阅读与分析 * 文档总结 * 内容提炼 * 智能分析 * AI 辅助阅读 --- ### AI 对话 * 网站 AI 助手 * 企业知识机器人 * AI 聊天助手 --- ## 8. AI 使用前提 在使用 AI 功能前,需要先完成以下配置: | 配置项 | 是否必须 | | ------------ | ---- | | AI 引擎配置 | 是 | | 文本生成模型 | 是 | | Embedding 模型 | 是 | | 文档向量化 | 是 | 可选配置: | 配置项 | 是否必须 | | ------------ | ---- | | Rerank 模型 | 否 | | Qdrant 向量数据库 | 否 | 建议先阅读: * Dify框架配置 * Qdrant部署 * AI文档创作 --- ## 9. 推荐使用建议 | 使用需求 | 推荐方案 | | ----------- | -------------------------- | | 快速启用 AI | 内置 AI 引擎 | | 低运维复杂度 | 内置 AI 引擎 | | 私有部署知识库 | 内置 AI 引擎 | | AI 文档写作 | 独立 AI 接口 | | 企业级 AI 工作流 | Dify | | 多模型统一管理 | Dify | | AI Agent 场景 | Dify | | 大规模知识库 | 内置 AI 引擎 + Qdrant + Rerank | --- ## 10. 常见问题 ### AI 回答为空 可能原因: * 文档未向量化; * AI 同步未开启; * Embedding 配置错误; * 向量数据库异常; * 未检索到相关内容。 --- ### AI 回答不准确 可能原因: * 文档内容过少; * 文档结构混乱; * 检索命中率低; * 未启用 Rerank; * 大模型能力不足。 --- ### AI 无法理解专业术语 建议: * 在文档中增加术语说明; * 增加 FAQ; * 增加示例内容; * 使用行业专用模型。 --- ## 11. 总结 觅思文档的 AI 能力,本质上是: > “文档系统 + RAG + 大语言模型”的深度融合。 通过 AI 与知识库结合,觅思文档不仅是一个文档系统,也可以成为: * 企业 AI 助手 * 私有化知识机器人 * 智能检索平台 * AI 驱动的知识中枢 在私有化部署场景下,可以有效解决: * 文档难检索 * 知识难沉淀 * AI 无法结合内部数据 * 数据无法离开内网 等问题。
📄 基础配置
→
📄 AI功能
→
州的先生
May 11, 2026, 8:56 a.m.
Forward
Favorites
Last
Next
Scan the QR Code
Copy link
Scan the QR code to share.
Copy link
share
link
type
password
Update password
Validity period
Markdown file
Word document
PDF document
PDF document (print)