メインコンテンツへスキップ
URL データソースを使用すると、ウェブページやナレッジベースからコンテンツを取り込むことができます。従来のクローラーとは異なり、システムは リアルタイム検索 を介して動作します:
  1. スコープ付き検索とスクレイピング: 提供されたURL(およびそのサブパス)に スコープされた 関連ページを検索します。これにより、制御された境界が作成され、指定されたエンタープライズソースからのみコンテンツが取り込まれることが保証されます。
  2. キャッシュ: スクレイピングされたコンテンツは、設定可能な有効期限とともにローカルキャッシュに保存されます。
  3. 検索: クエリが実行されると、システムはまずローカルキャッシュを確認します。コンテンツが見つからないか期限切れの場合、インターネット(定義されたスコープ内)を検索し、並行して新鮮なコンテンツをスクレイピングします。

データソースの接続

  1. データソース > + 追加 を選択します。
  2. ソースタイプとして URL’s を選択します。
  3. 開始 URL を入力します(例:https://dashboard.intelligrated.com/knowledgebase)。
  4. (オプション)システムに定期的にコンテンツを更新させたい場合は、キャッシュ有効期限 の値を設定します。
URL接続モーダル

URLの管理

追加されると、トップレベルURLがリストに表示されます。システムは、そのパスの下で見つかったウェブページの数を識別します。 URLリストビュー

ウェブページリスト

メインURLをクリックすると、発見および処理された個々のウェブページのリストが表示されます。各ページは個別に取り込まれます。 ウェブページリストビュー

チャンクマネージャー

ファイルと同様に、各ウェブページから生成されたチャンクを管理して、高品質な検索を確保できます。
  1. 特定のウェブページの横にある矢印アイコン > をクリックして、チャンクビューを開きます。
  2. 次へ 矢印を使用してチャンクをナビゲートします。
URLチャンクビュー

チャンクの詳細

チャンクの特定の内容、文字数、およびメタデータを表示できます。必要に応じて、特定のチャンクを有効または無効にすることができます。 URLチャンク詳細ビュー