生成AIのビジネス活用につきまとうリスク解消のカギを握る「文書管理」

生成AI・ビジネス活用｜オープンテキスト

生成AIのビジネス活用につきまとう
リスク解消のカギを握る「文書管理」

企業が保有する膨大な量の文書やデータを生成AIで利活用する仕組みとして、RAG（検索拡張生成）が大きな注目を集めている。その背景にあるのが、生成AIが本来的に抱えるハルシネーションや情報漏えいのリスクだ。オープンテキストでは、生成AIのビジネス活用する際の問題解消のカギとなるRAGの仕組みを支える「次世代型クラウドコンテンツ管理」により、すぐに生成AIをビジネス活用できるソリューションを展開している。（聞き手：日経BP 総合研究所上席研究員渡辺享靖）

RAGによって切り拓かれる
生成AIでの社内データの活用

オープンテキスト株式会社
ソリューション・コンサルティング統括本部
コンテンツ／エクスペリエンス・ソリューションコンサルティング部
部長
秋山英二氏

渡辺　企業がビジネスにおける生成AIの活用へと舵を切る中、RAG（Retrieval Augmented Generation：検索拡張生成）の利用により、社内データを加味した回答を生成AIから得ようという取り組みが今後メインストリームになると目されています。

秋山　はい。おっしゃるように生成AIのビジネス活用は、ChatGPTなどのサービスに質問をして、インターネット上にある情報から必要な知見を得るというところから、自社のビジネス文書などを都度、サービスにアップロードして、一部自社が保有するデータを生成AIの回答に活かす方向へと進んできました。しかし、いずれも自社データの活用という意味では限定的と言わざるを得ません。これに対し企業内に独自のデータ基盤を用意して、統合的かつ定常的な活用によって、企業が実践する業務用途に、より合致した回答を得られるようにしていこうというのがRAGのコンセプトです。

渡辺　RAGに基づく生成AIのビジネスユースケースとしては、どのようなものが考えられますか。

秋山　多数ありますが、1例をあげるとバックオフィスでの活用です。例えば、契約書や請求書などの証憑書類を分析対象として、最適な仕入先の選択にかかわる意思決定に生かしたり、契約書と請求書の内容を突合して、契約に不適合な取引を洗い出すといったケースです。他にも、プロジェクト資料、製品マニュアル、技術論文など大量の文書から、俊敏に必要な知見やノウハウを抽出するようなユースケースも考えられます。例えば、コンタクトセンターでのサポート業務などはイメージしやすい利用局面だといえます。日常的なオフィス業務においても、従業員がチャットボット的なスタイルで、人事や経費にまつわる規定などを短時間で調べるといったユースケースも考えられます。

ハルシネーションの問題解消には
ガバナンスの効いた版管理が肝要

渡辺　実に様々な使い方が想定され、大いに期待が高まるところではありますが、一方で生成AIの活用には、常にハルシネーション、つまり誤回答の問題や、情報漏洩への危惧といったものがついてまわります。確かに、RAGはハルシネーションの軽減に寄与するものといえそうですが、それら課題の解消やリスクの回避に向けて、オープンテキストではどう対応していくべきだとお考えでしょうか。

秋山　当社では、生成ＡＩのビジネス活用における問題解消のカギを握るのはRAGの仕組みであり、それを実現した「統合的なコンテンツの一元管理」であると捉えており、「Core Content」と「Content Aviator」という2つで構成されるソリューションを提案しています。Core Contentは統合コンテンツ管理基盤であり、コンテンツ管理やワークスペース、レコードマネジメントなどの機能を有しています。Content Aviatorは、Core Contentで統合管理されたコンテンツを生成AIで利活用を可能するもので、合わせることで生成AIをビジネスに活用でき、業務効率化と生産性向上に革命をもたらすと信じています。

渡辺　オープンテキストのソリューションによって、具体的にどのようなことが可能になるのでしょうか。

秋山　まずハルシネーションの問題についていえば、生成AIを使って、仮に過去の企画書や提案書をベースに必要な情報を得ようとした場合、RAGの基盤上のフォルダに特定の文書の新旧さまざまな版が混在していたとしたらどうでしょう。生成AIにはそれら文書の新旧の判断がつかず、古い情報に基づいて間違った回答を返してくる可能性があります。そこで、フォルダ内にある文書が格納されていて、そこにそのアップデート版である文書を格納する際には、横並びではなく旧版を更新する形でしか格納できないような制御を行います。こうした仕組みがあれば、ガバナンスが効いた形で版管理を実践することができ、その結果、AIが最新のものをベースに適切な回答を生成できるようになるという効果が得られるわけです。

渡辺　なるほど。Core Contentを活用してそうした運用を実践すれば、特段意識することなく文書を格納していけることからユーザーに負荷もかかりませんね。

※講演の一部をOn-Demand形式で視聴いただけます。

文書管理基盤で付与された
閲覧権限情報をRAGに連携

渡辺　一方の情報漏えいの問題についてはいがでしょう。

秋山　まず、AIのデータソースが利用者ごとの閲覧権限範囲とリンクしていないことが問題として挙げられます。例えば個人情報などの機密情報に閲覧権限を持たないユーザーにまで生成AIが回答してしまう危険があるというわけです。つまり、あるデータソースに付与された閲覧権限についての情報が適切にRAGの側へと連携されて、生成AIがそれに基づいてユーザーごとに開示可能な情報と、開示してはいけない情報を峻別できるような仕組みを実現すればリスク回避できます。

　当社の提供するソリューションでは、Core Content側で管理している閲覧権限の情報が、Content Aviatorへと確実に引き継がれる形を実現しています。結果、生成AIが各ユーザーの権限に応じた情報のみを含む回答を生成するため、機密情報などが漏洩するリスクは軽減されます。

[画像のクリックで拡大表示]

企業の生成AI活用に寄与する文書管理基盤「Core Content」

RAGの仕組みを支える「Content Aviator」により、ハルシネーションや情報漏えいといった生成AIのリスク対策において大きな威力を発揮する

渡辺　今後、企業の間で活発になると予測される生成AIのビジネス活用ですが、ハルシネーションや情報漏えいの問題は切実なリスクとして認識し、RAGの仕組みなどで十分な対策をとっていく必要があります。まさにオープンテキストの提供するソリューションが企業の要請に応えるものとなるわけですね。

オープンテキスト株式会社

https://www.opentext.com/ja-jp

INDEXページ