データソースの接続
- データソース > + 追加 を選択します。
- ソースタイプとして ファイル を選択します。
- ファイルをドラッグアンドドロップするか、クリックしてアップロードします。サポートされている形式には、PDF、HTML、Markdown、Word、PowerPoint、オーディオ、およびビデオ(最大100 MB)が含まれます。
ファイルの管理
アップロードされると、ファイルはリストビューに表示されます。処理ステータス
最初、ファイルは 待機中 または 処理中 として表示される場合があります。
取り込みが完了すると、ステータスは 処理済み に変わります。
ファイルの再処理
任意のファイルの取り込みパラメータを変更して再処理できます。- 処理タイプ(例:Text から Image へ)などの編集可能なパラメータを変更します。
- 必要に応じて、チャンクサイズ、チャンクの重複、言語 などの他の設定を調整します。
- 再生 ボタン(三角形のアイコン)をクリックして、新しい設定で再取り込みをトリガーします。
利用可能なパラメータとその効果については、取り込み設定 ページで詳しく説明されています。
チャンクマネージャー
処理されたファイルについては、生成されたチャンクを表示および編集して、検索精度を微調整できます。- 処理されたファイルの横にある チャンクマネージャー リンク(または歯車アイコン)をクリックします。
- 個々のチャンク、有効状態、およびメタデータを確認します。
チャンクの編集
チャンクの 有効 ステータスを切り替えて、検索に含めるか除外するかを選択できます。また、文字数やソースファイルの詳細などのメタデータも表示できます。画像処理ビュー
ファイルが Image 処理タイプを使用して処理される場合、システムはビジョンモデルを使用してレイアウトとコンテンツを分析します。
チャンクマネージャーは 並列ビュー を表示します:
- 左パネル: 元のページ画像を表示します。
- 右パネル: 生成された説明と抽出されたデータを表示します。