メインコンテンツへスキップ
ファイル データソースを使用すると、取り込みと処理のためにドキュメントをGIDRに直接アップロードできます。

データソースの接続

  1. データソース > + 追加 を選択します。
  2. ソースタイプとして ファイル を選択します。
ファイル接続モーダル
  1. ファイルをドラッグアンドドロップするか、クリックしてアップロードします。サポートされている形式には、PDF、HTML、Markdown、Word、PowerPoint、オーディオ、およびビデオ(最大100 MB)が含まれます。
ファイルアップロードボックス

ファイルの管理

アップロードされると、ファイルはリストビューに表示されます。

処理ステータス

最初、ファイルは 待機中 または 処理中 として表示される場合があります。 ファイル待機中 取り込みが完了すると、ステータスは 処理済み に変わります。 ファイル処理済み

ファイルの再処理

任意のファイルの取り込みパラメータを変更して再処理できます。
  1. 処理タイプ(例:Text から Image へ)などの編集可能なパラメータを変更します。
  2. 必要に応じて、チャンクサイズチャンクの重複言語 などの他の設定を調整します。
  3. 再生 ボタン(三角形のアイコン)をクリックして、新しい設定で再取り込みをトリガーします。
ファイルの再処理
利用可能なパラメータとその効果については、取り込み設定 ページで詳しく説明されています。

チャンクマネージャー

処理されたファイルについては、生成されたチャンクを表示および編集して、検索精度を微調整できます。
  1. 処理されたファイルの横にある チャンクマネージャー リンク(または歯車アイコン)をクリックします。
  2. 個々のチャンク、有効状態、およびメタデータを確認します。
チャンクマネージャービュー

チャンクの編集

チャンクの 有効 ステータスを切り替えて、検索に含めるか除外するかを選択できます。また、文字数やソースファイルの詳細などのメタデータも表示できます。

画像処理ビュー

ファイルが Image 処理タイプを使用して処理される場合、システムはビジョンモデルを使用してレイアウトとコンテンツを分析します。 画像処理チャンクビュー チャンクマネージャーは 並列ビュー を表示します:
  • 左パネル: 元のページ画像を表示します。
  • 右パネル: 生成された説明と抽出されたデータを表示します。
これにより、チャンクを編集しながら、元のドキュメントに対してAIによる視覚要素(チャート、図表)の解釈を検証できます。