Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,10 @@ title: ローカルファイルをアップロード

JPG、JPEG、PNG、GIF形式で2MB未満の画像は、該当するチャンクの添付ファイルとして自動抽出されます。これらの画像は個別に管理でき、検索時にチャンクと一緒に返されます。

抽出された画像のURLはチャンクテキスト内に残りますが、テキストをきれいに保つためにこれらのURLを安全に削除できます。削除しても抽出された画像には影響しません。

インデックス設定でマルチモーダル埋め込みモデル(**Vision**アイコン付き)を選択した場合、抽出された画像も埋め込まれ、検索用にインデックス化されます。

1チャンクにつき最大10枚まで画像添付が可能です。超過分は抽出されません。

<Tip>
Expand All @@ -42,19 +46,15 @@ title: ローカルファイルをアップロード
- 1チャンクあたりの添付画像数上限:`SINGLE_CHUNK_ATTACHMENT_LIMIT`
</Tip>

抽出ルールの対象
上記の抽出ルールの対象

- DOCXファイルに埋め込まれた画像

<Note>
その他のドキュメントタイプ(例:PDF)に埋め込まれた画像は、[ナレッジパイプライン](/ja/use-dify/knowledge/knowledge-pipeline/readme)で適切な文書抽出プラグインを使用した場合のみ抽出できます
</Note>
<Tip>
その他のファイルタイプ(例:PDF)に埋め込まれた画像は、[ナレッジパイプライン](/ja/use-dify/knowledge/knowledge-pipeline/readme)で適切な文書抽出プラグインを使用して抽出できます
</Tip>

- 任意のファイルタイプで、以下のMarkdown記法でURL参照可能な画像
- 任意のファイルタイプで、以下のMarkdown記法でアクセス可能なURLを介して参照される画像

- `![代替テキスト](image_url)`
- `![代替テキスト](image_url "タイトル")`

<Tip>
その後のインデックス設定でマルチモーダル埋め込みモデル(**Vision**アイコン付き)を選択した場合、抽出された画像は埋め込まれ、検索用にインデックス化されます。
</Tip>
Original file line number Diff line number Diff line change
Expand Up @@ -201,6 +201,8 @@ Difyのドキュメント抽出器、あるいはMarketplaceから「Dify Extrac

ドキュメント内の画像は、適切なドキュメントプロセッサを使用して抽出できます。抽出された画像は対応するチャンクに添付され、個別に管理でき、検索時にはそのチャンクと一緒に返されます。

抽出された画像のURLはチャンクテキスト内に残りますが、テキストをクリーンに保つためにこれらのURLを安全に削除できます。これは抽出された画像には影響しません。

各チャンクには最大10枚まで画像を添付できます。これを超える画像は抽出されません。

選択したプロセッサで画像が抽出されなかった場合、Difyは以下のMarkdown記法でアクセス可能なURLが参照されている2MB未満のJPG、JPEG、PNG、GIF画像を自動的に抽出します:
Expand All @@ -216,7 +218,7 @@ Difyのドキュメント抽出器、あるいはMarketplaceから「Dify Extrac
- 1チャンクあたりの添付画像数上限:`SINGLE_CHUNK_ATTACHMENT_LIMIT`
</Tip>

その後のインデックス設定で**Vision**アイコン付きのマルチモーダル埋め込みモデルを選択した場合、抽出された画像も埋め込み・インデックス化され、検索対象となります。
インデックス設定で**Vision**アイコン付きのマルチモーダル埋め込みモデルを選択した場合、抽出された画像も埋め込み・インデックス化され、検索対象となります。

</Accordion>

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -31,10 +31,10 @@ sidebarTitle: コンテンツの管理

チャンク設定に基づき、すべてのドキュメントは検索の基本単位であるコンテンツチャンクに分割されます。

各ドキュメント内のチャンク一覧からそれらを閲覧・管理し、検索の効率と精度を最適化できます
各ドキュメント内のチャンク一覧からそれらを閲覧・管理し、検索の効率と精度を向上させることができます

<Tip>
左上のドキュメント名をクリックして、別のドキュメントに素早く切り替えられます
左上のドキュメント名をクリックすると、別のドキュメントへ素早く切り替えられます
</Tip>

![チャンクの管理](/images/manage_document_chunks.png)
Expand All @@ -44,9 +44,9 @@ sidebarTitle: コンテンツの管理
| 追加 | 新しいチャンクを1つまたは複数まとめて追加します。<br/><br/>親子分割モードのドキュメントでは、親チャンクと子チャンクの両方を追加可能です。<Info>「チャンクを追加」は Dify Cloud の有料機能です。利用するには [Professional または Team プラン](https://dify.ai/pricing) へのアップグレードが必要です。</Info>|
| 削除 | チャンクを完全に削除します。**削除は元に戻せません。**|
| 有効/無効 | 一時的にチャンクを検索対象に含める/除外します。無効化されたチャンクは編集できません。|
| 編集 | チャンクの内容を修正します。編集されたチャンクは **「編集済み」** と表示されます。<br/><br/>親子分割モードのドキュメントでは:<ul><li>親チャンクを編集するとき、子チャンクを再生成するか保持するかを選択できます。</li><li>子チャンクを編集しても、親チャンクには影響しません。</li></ul><Tip>ドキュメント内の画像がチャンクの添付ファイルとして抽出される場合、そのURLはチャンクテキスト内に残ります。これらのURLを削除しても、抽出された画像の添付ファイルには影響しません。</Tip>|
| 編集 | チャンクの内容を修正します。編集されたチャンクには **Edited** マークが付きます。<br/><br/>親子分割モードのドキュメントでは:<ul><li>親チャンクを編集するとき、子チャンクを再生成するか変更せずに保持するかを選択できます。</li><li>子チャンクを編集しても、親チャンクは更新されません。</li></ul>|
| キーワードの追加/編集/削除 | 経済的インデックス方式を使用するナレッジベースでは、各チャンクに対してキーワードを追加・編集して検索精度を向上させることができます。<br/><br/>1つのチャンクにつき最大10個のキーワードを設定可能です。|
| 画像添付ファイルの追加/削除 | ドキュメントから抽出された画像を削除したり、対応するチャンク内に新しい画像をアップロードしたりできます。<br/><br/>画像の添付ファイルとチャンクは独立して編集でき、互いに影響しません。<Note>各チャンクには最大10枚まで画像の添付が可能で、検索時に一緒に返されます。これを超える画像は抽出されません。<br/><br/>セルフホスティング環境では、環境変数 `SINGLE_CHUNK_ATTACHMENT_LIMIT` を変更してこの制限を調整できます。</Note><Tip>クロスモーダル検索(テキストと画像の両方を意味的関連性に基づいて検索)を有効にするには、ナレッジベースにマルチモーダル埋め込みモデル(**Vision** アイコン付き)を選択してください。<br/><br/>画像の添付ファイルは埋め込み・インデックス化され、検索に利用されます。</Tip>|
| 画像添付ファイルの追加/削除 | ドキュメントから抽出された画像を削除したり、対応するチャンク内に新しい画像をアップロードしたりできます。<br/><br/>抽出された画像のURLはチャンクテキスト内に残りますが、テキストをきれいに保つためにこれらのURLを安全に削除できます。抽出された画像には影響しません。<Note>各チャンクには最大10枚まで画像の添付が可能で、検索時にチャンクと一緒に返されます。この制限を超える画像は抽出されません。<br/><br/>セルフホスティング環境では、環境変数 `SINGLE_CHUNK_ATTACHMENT_LIMIT` でこの制限を調整できます。</Note><Tip>マルチモーダル埋め込みモデル(**Vision** アイコン付き)を選択すると、抽出された画像も埋め込み・インデックス化され、検索に利用されます。</Tip>|

## ベストプラクティス

Expand All @@ -73,4 +73,4 @@ sidebarTitle: コンテンツの管理

- 「返金期間はどのくらいですか?」

- 「返品時の送料はかかりますか?」
- 「返品時の送料はかかりますか?」
Original file line number Diff line number Diff line change
Expand Up @@ -32,6 +32,10 @@ title: 上传本地文件

JPG、JPEG、PNG 和 GIF 格式且小于 2 MB 的图片将作为附件,自动提取到对应的分段。这些图片可独立管理,并在检索时与分段一同返回。

提取的图片 URL 会保留在分段文本中,但你可以放心删除这些 URL 以保持文本整洁——这不会影响已提取的图片。

若在索引设置中选择多模态嵌入模型(带有 **Vision** 图标),则提取出的图片也将被向量化并索引以供检索。

每个分段最多支持 10 个图片附件,超出的图片不会被提取。

<Tip>
Expand All @@ -46,15 +50,11 @@ title: 上传本地文件

- DOCX 文件中嵌入的图片

<Note>
其他文件类型(如 PDF)中嵌入的图片,只能通过在[知识流水线](/zh/use-dify/knowledge/knowledge-pipeline/readme)中使用合适的文档提取器插件进行提取
</Note>
<Tip>
其他文件类型(如 PDF)中嵌入的图片,可通过在[知识流水线](/zh/use-dify/knowledge/knowledge-pipeline/readme)中使用合适的文档提取插件进行提取
</Tip>

- 在任何文件类型中,通过以下 Markdown 语法引用、URL 可访问的图片:

- `![替换文本](image_url)`
- `![替换文本](image_url "标题")`

<Tip>
若在后续的索引设置中选择多模态嵌入模型(带有 **Vision** 图标),则提取出的图片将被向量化并参与检索。
</Tip>
- `![alt text](image_url)`
- `![alt text](image_url "optional title")`
Original file line number Diff line number Diff line change
Expand Up @@ -39,6 +39,8 @@ title: "步骤二:编排知识流水线"
4. **用户输入表单配置**:定义流水线使用者需要输入的参数
5. **测试与发布**:验证并正式启用知识库

---

## 步骤一:数据源配置

在一个知识库里,你可以选择单一或多个数据源。目前,Dify 支持 4 种数据源:**文件上传、在线网盘、在线文档和网页爬虫**。
Expand Down Expand Up @@ -192,7 +194,11 @@ title: "步骤二:编排知识流水线"

<Accordion title="对于文档中的图片">

通过合适的文档处理工具,可将文档中的图片提取为对应分段的附件。被提取的图片可独立管理,并在检索时与分段一同返回。每个分段最多支持 10 个图片附件,超出的图片不会被提取。
通过合适的文档处理工具,可将文档中的图片提取为对应分段的附件。被提取的图片可独立管理,并在检索时与分段一同返回。

被提取图片的 URL 会保留在分段文本中,但你可以安全地删除这些 URL 以保持文本整洁——这不会影响已提取的图片。

每个分段最多支持 10 个图片附件,超出的图片不会被提取。

若使用的工具未提取到图片,Dify 会自动提取通过以下 Markdown 语法引用、URL 可访问且小于 2 MB 的 JPG、JPEG、PNG 和 GIF 图片:

Expand All @@ -207,7 +213,7 @@ title: "步骤二:编排知识流水线"
- 每个分段的最大附件数量:`SINGLE_CHUNK_ATTACHMENT_LIMIT`
</Tip>

若在后续的索引设置中选择多模态嵌入模型(带有 **Vision** 图标),则提取出的图片将被向量化并参与检索
若在索引设置中选择多模态嵌入模型(带有 **Vision** 图标),则提取出的图片也将被向量化并参与检索

</Accordion>

Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -44,9 +44,9 @@ sidebarTitle: 维护内容
| 添加 | 新增或批量新增分段。<br/><br/>对于采用父子分段模式的文档,可同时新增父分段和子分段。<Info>「添加分段」在 Dify Cloud 上为付费功能,[升级至 Professional 或 Team 版](https://dify.ai/pricing) 即可解锁使用。</Info>|
| 删除 | 永久删除分段。**删除不可撤销**。|
| 启用 / 禁用 | 临时将分段纳入或排除检索。已禁用的分段不可编辑。|
| 编辑 | 修改分段内容。已编辑的分段将标记为 **已编辑**。<br/><br/>对于采用父子分段模式的文档:<ul><li>编辑父分段时,可选择重新生成其子分段或保持原有的子分段不变。</li><li>编辑子分段不会改变其父分段。</li></ul><Tip>当文档中的图片被提取为分段附件时,其 URL 会保留在分段文本中。删除 URL 不会影响已提取的图片附件。</Tip>|
| 编辑 | 修改分段内容。已编辑的分段将标记为 **已编辑**。<br/><br/>对于采用父子分段模式的文档:<ul><li>编辑父分段时,可选择重新生成其子分段或保持原有的子分段不变。</li><li>编辑子分段不会改变其父分段。</li></ul>|
| 添加 / 编辑 / 删除关键词 | 在使用经济索引方式的知识库中,可为分段添加或修改关键词,以提升其可检索性。<br/><br/>一个分段最多可添加 10 个关键词。|
| 添加 / 删除图片附件 | 在对应分段中,删除从文档中提取的图片或上传新图片。<br/><br/>图片附件和分段内容可独立编辑,互不影响。<Note> 每个分段最多支持 10 张图片附件,在检索中将被一同返回;超过数量的图片不会被提取。<br/><br/>对于自托管部署,可通过修改环境变量 `SINGLE_CHUNK_ATTACHMENT_LIMIT` 调整此数量限制。</Note><Tip>若要启用跨模态检索——即基于语义相关性同时检索文本和图片,需为知识库选择多模态嵌入模型(带有 **Vision** 图标)。<br/><br/>被提取的图片附件将被向量化并参与检索。</Tip>|
| 添加 / 删除图片附件 | 在对应分段中,删除从文档中提取的图片或上传新图片。<br/><br/>提取的图片 URL 会保留在分段文本中,你可以安全地删除这些 URL 以保持文本简洁——这不会影响已提取的图片。<Note> 每个分段最多支持 10 张图片附件,在检索中将被一同返回;超过数量的图片不会被提取。<br/><br/>对于自托管部署,可通过修改环境变量 `SINGLE_CHUNK_ATTACHMENT_LIMIT` 调整此数量限制。</Note><Tip>若选择多模态嵌入模型(带有 **Vision** 图标),提取的图片也将被向量化并索引以供检索。</Tip>|

## 最佳实践

Expand Down