URL - GIDR.ai

URL データソースを使用すると、ウェブページやナレッジベースからコンテンツを取り込むことができます。従来のクローラーとは異なり、システムは リアルタイム検索 を介して動作します：

スコープ付き検索とスクレイピング: 提供されたURL（およびそのサブパス）に スコープされた 関連ページを検索します。これにより、制御された境界が作成され、指定されたエンタープライズソースからのみコンテンツが取り込まれることが保証されます。
キャッシュ: スクレイピングされたコンテンツは、設定可能な有効期限とともにローカルキャッシュに保存されます。
検索: クエリが実行されると、システムはまずローカルキャッシュを確認します。コンテンツが見つからないか期限切れの場合、インターネット（定義されたスコープ内）を検索し、並行して新鮮なコンテンツをスクレイピングします。

データソースの接続

データソース > + 追加 を選択します。
ソースタイプとして URL’s を選択します。
開始 URL を入力します（例：https://dashboard.intelligrated.com/knowledgebase）。
（オプション）システムに定期的にコンテンツを更新させたい場合は、キャッシュ有効期限 の値を設定します。

URL接続モーダル

URLの管理

追加されると、トップレベルURLがリストに表示されます。システムは、そのパスの下で見つかったウェブページの数を識別します。 URLリストビュー

URLリストビュー

ウェブページリスト

メインURLをクリックすると、発見および処理された個々のウェブページのリストが表示されます。各ページは個別に取り込まれます。ウェブページリストビュー

ウェブページリストビュー

チャンクマネージャー

ファイルと同様に、各ウェブページから生成されたチャンクを管理して、高品質な検索を確保できます。

特定のウェブページの横にある矢印アイコン > をクリックして、チャンクビューを開きます。
次へ矢印を使用してチャンクをナビゲートします。

URLチャンクビュー

チャンクの詳細

チャンクの特定の内容、文字数、およびメタデータを表示できます。必要に応じて、特定のチャンクを有効または無効にすることができます。 URLチャンク詳細ビュー

URLチャンク詳細ビュー

ファイルコネクタ