RAG に使用するソースデータの取り込み

公開日 : 2025.07.29

Share:

2025 年 10 月 14 日以降、Data Cloud は Data 360 にブランド変更されました。

この記事で学べること

  • Data 360 で RAG に活用できるデータソース
  • それぞれのデータソースに適したユースケース

はじめに

この記事では、 Data 360 を RAG ( Retrieval Augmented Generation )として活用するためのデータソースについて解説します。 Salesforce のレコードデータや添付ファイル、外部システムのデータ、アップロード可能なファイルなど、それぞれのデータソースの特徴や適したユースケースを理解し、自社に最適なデータソースを選択しましょう。

利用可能なデータソース

 Salesforce のレコードデータ(構造化)

構造化データである Salesforce オブジェクトのレコードも RAG に活用できます。例えば、ナレッジ記事( Knowledge )は典型的な情報源です。 FAQ や社内ドキュメントがナレッジとして Salesforce に蓄積されている場合、これをそのまま Agentforce の回答に活用できます。ナレッジの本文を検索インデックス化することにより、意味の類似性をもとに関連性の高い情報を検索できます。ナレッジ以外の Salesforce オブジェクトも活用できるため、例えば商談やケースなどレコードに蓄積されたメモ・説明文などをもとに類似レコードを探すという利用方法もあります。

 Salesforce レコードの添付ファイル(非構造化)

レコードへの添付ファイルも RAG に活用できます。例えば、商談に添付されたプレゼン資料や契約書類、ケースに添付された製品マニュアルなどが挙げられます。 Data 360 において、レコードの添付ファイルも取り込むように設定をすることで、非構造化データである添付ファイルを読み取り、その内容をもとにした検索インデックス(チャンク化、ベクトル化)の作成が可能です。レコードに保存されている情報だけでは不十分な場合などは、添付ファイルが有効です。

外部システムのデータ(構造化 / 非構造化)

Salesforce 以外の外部システムにあるデータも RAG に活用できます。たとえば、外部データウェアハウスのデータ、基幹システムの構造化データや、クラウドストレージにある非構造化のデータファイルなどが含まれます。 Data 360 はこうしたデータを取り込むための接続方法を提供しています。代表例として、コネクタ経由で外部データベースと連携したり、API経由でデータを取り込んだりする方法があります。

アップロード可能なファイル(非構造化)

もし手元にあるデータを直接取り込みたい場合、PDF、テキスト、HTML 形式のファイルアップロードも可能です。これを利用すれば、小規模なデータセットや試験的なデータをスムーズに RAG 環境に追加できます。製品カタログやサービス利用ポリシーなど、まとまった内容が一つのファイルに集約されているようなデータはアップロードして RAG に活用することに適しています。

データの取り込み

 RAG にデータを活用するために、まずは Data 360 にデータを取り込む必要があります。データ取り込みの手順は以下のとおりです。

構造化データの場合

  1. データストリームを作成し、データソースから Data 360 にデータを取り込む(データレイクオブジェクトが作成される)
  2. データレイクオブジェクトのデータをデータモデルオブジェクトにマッピングする
  3. データモデルオブジェクトに対して検索インデックスを設定する(次の記事で解説します)

非構造化データの場合

  1. データレイクオブジェクトを作成しソースとなる非構造化データを Data 360 に取り込む
  2. データレイクオブジェクトを非構造化データモデルオブジェクトにマッピングする
  3. UDMO に対して検索インデックスを設定する(次の記事で解説します)

※非構造化データの場合はデータストリームが作成されません。

※Agentforceデータライブラリを使用する場合は、上記の処理が自動で行われます。

 Data 360 へのデータの取り込みについて、詳しく知りたい方は以下の記事をご覧ください。

まとめ

 RAG の情報源として、様々なソースからのデータを利用可能です。実現したいユースケースや自社のデータの保持状況も踏まえ、最適なデータソースを選択しましょう。次の記事では、取り込んだデータを RAG に使えるように処理を行う「検索インデックス」について詳しく解説します。

学習ツール

Premier Success Plan をご契約のお客様は、この記事の内容について 1 対 1 のフォローアップセッションでご相談いただけます。

具体的な設定方法などについてご支援が必要でしたらぜひ以下のリンクよりお申し込みくださいませ。

エキスパートコーチング: Data Cloud : AI &  Agentforce

参考リソース

公開日 : 2025.07.29

Share:

前の記事 「Data 360 における RAG 関連機能」

次の記事 「「検索インデックス」によるベクトルデータベース構築」

活用ステップ

このカテゴリの人気記事

Salesforce活用に役立つメルマガ登録

【4/22まで】SFUG CUP2026 登壇エントリー受付中!

詳しくはこちら