RAG に使用するソースデータの取り込み

公開日: 2025.07.29

Share:

この記事で学べること

  •  Data Cloud で RAG に活用できるデータソース
  • それぞれのデータソースに適したユースケース

はじめに

この記事では、 Data Cloud を RAG ( Retrieval Augmented Generation )として活用するためのデータソースについて解説します。 Salesforce のレコードデータや添付ファイル、外部システムのデータ、アップロード可能なファイルなど、それぞれのデータソースの特徴や適したユースケースを理解し、自社に最適なデータソースを選択しましょう。

利用可能なデータソース

 Salesforce のレコードデータ(構造化)

構造化データである Salesforce オブジェクトのレコードも RAG に活用できます。例えば、ナレッジ記事( Knowledge )は典型的な情報源です。 FAQ や社内ドキュメントがナレッジとして Salesforce に蓄積されている場合、これをそのまま Agentforce の回答に活用できます。ナレッジの本文を検索インデックス化することにより、意味の類似性をもとに関連性の高い情報を検索できます。ナレッジ以外の Salesforce オブジェクトも活用できるため、例えば商談やケースなどレコードに蓄積されたメモ・説明文などをもとに類似レコードを探すという利用方法もあります。

 Salesforce レコードの添付ファイル(非構造化)

レコードへの添付ファイルも RAG に活用できます。例えば、商談に添付されたプレゼン資料や契約書類、ケースに添付された製品マニュアルなどが挙げられます。 Data Cloud において、レコードの添付ファイルも取り込むように設定をすることで、非構造化データである添付ファイルを読み取り、その内容をもとにした検索インデックス(チャンク化、ベクトル化)の作成が可能です。レコードに保存されている情報だけでは不十分な場合などは、添付ファイルが有効です。

外部システムのデータ(構造化 / 非構造化)

Salesforce 以外の外部システムにあるデータも RAG に活用できます。たとえば、外部データウェアハウスのデータ、基幹システムの構造化データや、クラウドストレージにある非構造化のデータファイルなどが含まれます。 Data Cloud はこうしたデータを取り込むための接続方法を提供しています。代表例として、コネクタ経由で外部データベースと連携したり、API経由でデータを取り込んだりする方法があります。

アップロード可能なファイル(非構造化)

もし手元にあるデータを直接取り込みたい場合、PDF、テキスト、HTML 形式のファイルアップロードも可能です。これを利用すれば、小規模なデータセットや試験的なデータをスムーズに RAG 環境に追加できます。製品カタログやサービス利用ポリシーなど、まとまった内容が一つのファイルに集約されているようなデータはアップロードして RAG に活用することに適しています。

データの取り込み

 RAG にデータを活用するために、まずは Data Cloud にデータを取り込む必要があります。データ取り込みの手順は以下のとおりです。

構造化データの場合

  1. データストリームを作成し、データソースから Data Cloud にデータを取り込む(データレイクオブジェクトが作成される)
  2. データレイクオブジェクトのデータをデータモデルオブジェクトにマッピングする
  3. データモデルオブジェクトに対して検索インデックスを設定する(次の記事で解説します)

非構造化データの場合

  1. データレイクオブジェクトを作成しソースとなる非構造化データを Data Cloud に取り込む
  2. データレイクオブジェクトを非構造化データモデルオブジェクトにマッピングする
  3. UDMO に対して検索インデックスを設定する(次の記事で解説します)

※非構造化データの場合はデータストリームが作成されません。

※Agentforceデータライブラリを使用する場合は、上記の処理が自動で行われます。

 Data Cloud へのデータの取り込みについて、詳しく知りたい方は以下の記事をご覧ください。

まとめ

 RAG の情報源として、様々なソースからのデータを利用可能です。実現したいユースケースや自社のデータの保持状況も踏まえ、最適なデータソースを選択しましょう。次の記事では、取り込んだデータを RAG に使えるように処理を行う「検索インデックス」について詳しく解説します。

学習ツール

Premier Success Plan をご契約のお客様は、この記事の内容について1対1のフォローアップセッションでご相談いただけます。

具体的な設定方法などについてご支援が必要でしたらぜひ以下のリンクよりお申し込みくださいませ。

エキスパートコーチング: Data Cloud : AI &  Agentforce

参考リソース

公開日: 2025.07.29

Share:

前の記事「Data Cloud における RAG 関連機能」

次の記事「「検索インデックス」によるベクトルデータベース構築」

活用ステップ

このカテゴリの人気記事

Salesforce活用に役立つメルマガ登録

Salesforce ヘルプ Agentforce が幅広い質問に24/365迅速に対応します

詳しくはこちら