- スコープ付き検索とスクレイピング: 提供されたURL(およびそのサブパス)に スコープされた 関連ページを検索します。これにより、制御された境界が作成され、指定されたエンタープライズソースからのみコンテンツが取り込まれることが保証されます。
- キャッシュ: スクレイピングされたコンテンツは、設定可能な有効期限とともにローカルキャッシュに保存されます。
- 検索: クエリが実行されると、システムはまずローカルキャッシュを確認します。コンテンツが見つからないか期限切れの場合、インターネット(定義されたスコープ内)を検索し、並行して新鮮なコンテンツをスクレイピングします。
データソースの接続
- データソース > + 追加 を選択します。
- ソースタイプとして URL’s を選択します。
- 開始 URL を入力します(例:
https://dashboard.intelligrated.com/knowledgebase)。 - (オプション)システムに定期的にコンテンツを更新させたい場合は、キャッシュ有効期限 の値を設定します。
URLの管理
追加されると、トップレベルURLがリストに表示されます。システムは、そのパスの下で見つかったウェブページの数を識別します。
ウェブページリスト
メインURLをクリックすると、発見および処理された個々のウェブページのリストが表示されます。各ページは個別に取り込まれます。
チャンクマネージャー
ファイルと同様に、各ウェブページから生成されたチャンクを管理して、高品質な検索を確保できます。- 特定のウェブページの横にある矢印アイコン
>をクリックして、チャンクビューを開きます。 - 次へ 矢印を使用してチャンクをナビゲートします。
チャンクの詳細
チャンクの特定の内容、文字数、およびメタデータを表示できます。必要に応じて、特定のチャンクを有効または無効にすることができます。