ONLINE SEMINAR Review ITインフラSummit 2024 Summer 生成AI活用を支えるIT基盤を探る

ONLINE SEMINAR Review ITインフラSummit 2024 Summer 生成AI活用を支えるIT基盤を探る

AI・デジタルツイン・データ基盤Forum

日本オラクル

AIとデータベースのシナジー
ビジネス価値の最大化

日本オラクル
事業戦略統括 事業開発本部 本部長
佐藤 裕之

生成AIの活用は、膨大なデータを利用するためデータの扱いが取り組みの成否を握るといっても過言ではない。しかも扱うデータの種類はますます多様になり、ハンドリングが難しい。膨大かつ多様なデータを賢く扱い、生成AIを企業内で活用していくための方法を探る。

生成AIを企業で活用するために必要なRAGとベクトルDB

日本オラクル
佐藤 裕之

多くの企業で生成AIの活用が進められている。一方で生成AIを企業で使う場合には課題も多い。ハルシネーション(幻想)など回答精度の問題、膨大にかかるコスト、セキュリティ、プライバシーや著作権などに関わる法制度対応などだ。日本オラクルの佐藤裕之氏は、「生成AI活用において、特に重要な要素がデータです。データの扱いいかんによって、生成AIをうまく活用できるかできないかが決まってしまいます」と指摘する。

企業内で生成AIを活用するためには、汎用的な大規模言語モデル(LLM)に企業内データを組み合わせる必要がある。汎用的なLLMだけでは企業独自の問いに答えられないし、LLMは一時点で切り取ったデータを用いているため過去データしか参照できない。データの出所が不明なのでハルシネーションの可能性も残る。「企業で生成AIを使うには、これらの課題を改善することが求められます。そのために検索拡張生成(RAG)やベクトルデータベース(DB)が活用され始めています」(佐藤氏)。

RAGとは生成AIに独自データを取り込むためのアーキテクチャのこと。ベクトルデータとはテキストや画像を数値化したもので、それを扱えるベクトルDBを使えば数値を比較することで類似データを検索できるようになる。具体的には、投入されたプロンプト(質問)がベクトルに変換され、あらかじめベクトル化されたデータから類似情報を検索し、根拠となるリンクを付加して回答する。これにより新しいデータを含む企業データを考慮でき、根拠を明示することでハルシネーションの問題も回避できる可能性がある。例えば、金融業ではレポート、請求書、ファイリングから重要な情報を自動的に抽出したり、行政では検索機能の強化やあらゆる言語での複雑な文書の要約などが可能になる。

高まるマルチモーダルDBと自律型DBの重要性

このようにRAGとベクトルDBは生成AI活用に極めて有用だが、生成AIのプロンプトは多種多様なため、これらだけでは対応しきれない。例えば、「提供した画像と類似した画像を、サンフランシスコから20マイル以内で撮影されたものの中から表示してください」というプロンプトがあったとする。類似画像はベクトルDBで対応できるが、撮影場所の特定は位置情報DBから検索する必要がある。プロンプトが複雑になればなるほど、様々な要素のデータが必要となっていく。そこで求められるのが、複数の種別のデータを1つのDBに格納し、活用できるマルチモーダルDBである。

業務で扱うデータは、構造化データもあればドキュメントデータもあり、グラフやIoTから上がってきた時系列データもある。フロント部分に入っているデータは様々で、それをビジネスに生かすためデータの抽出や変換、処理が行われ、徐々に構造化データへと収束していく。このような多様なデータを扱う業務システムで単一用途のDBを使っていると、データが各アプリケーションに依存し、散在することになる。佐藤氏は、「生成AIに企業データを使う場合、散在するDBからデータを統合する必要があります。その開発は大規模になればなるほど複雑になり、データ収集にも手間がかかります。管理面でも非機能要件にバラツキが生まれ、例えば全体のセキュリティが低いレベルに引きずられることになってしまいます。マルチモーダルDBによってデータが一括管理されていた方が、管理面を含め圧倒的に使いやすい」と指摘する。

もう1つ必要な要素として自律型DBがある。生成AI技術で開発を行う場合、開発スピードが極めて重要だ。そのためにはインフラ運用の手間を軽減し、開発者は開発に専念する必要がある。運用管理の手間を軽減するために有効なのが自律機能である。DBの管理をクラウドに任せることで、開発に専念できる環境を実現するわけだ。「マルチモーダルDBと自律型DBという2つの要素が重要というお話を、多くのお客様やパートナーから聞くことが増えています」(佐藤氏)。

  • 1
  • 2

▲PageTop

CONTENTS