AI・デジタルツイン・データ基盤Forum
Cohesity Japan
技術本部
生成AIの普及が進み、企業は生成AIを業務の効率化などに活用し始めた。一方、AIを支えるITインフラには、AIが利用するデータを迅速に準備して維持し続ける仕掛けが求められている。こうした中、AIを活用したデータセキュリティと管理のリーダーのCohesityは、蓄積したセカンダリデータを生成AIで活用するための会話型の検索AIアシスタント「Cohesity Gaia(コヒシティガイア)」をリリースした。生成AIの活用にあたってデータ管理用ITインフラに求められる姿と、企業内データから生成AIで洞察を得るCohesity Gaiaの具体的な機能を紹介する。
2024年現在、生成AIを業務に活用する動きが盛んである。企業は、データ分析、業務効率化、チャットボットによる顧客対応など、各種の用途で生成AIの取り組みを始めている。この動きに合わせ、AIが利用するデータを迅速に準備して維持し続ける仕掛けがITインフラに求められている。
企業が扱うデータは、本番環境の業務システムでアクティブに使っているプライマリ(1次)データと、1次データのバックアップや使用頻度が低いデータを格納したセカンダリ(2次)データに分かれる。容量で比べると、全体の約80%以上がセカンダリデータに該当する。
米Cohesity(コヒシティ)の日本法人、Cohesity Japanの技術本部は、「セカンダリデータを、データ分析などの2次利用に活用すべきです」と指摘し、「生成AIを効率よく活用するためには、信頼できる社内データをセカンダリストレージに蓄積して管理することが前提になります」と語った。
生成AIで使う大規模言語モデル(LLM)は、インターネット上のデータを学習しているので、幅広い分野の知識を備えている。しかし、間違ったデータや、企業にとって有益ではないデータも含まれる。一方、「企業が社内で蓄積したデータは品質が高いので、ここから得られる洞察は業務に役立ちます」(Cohesity Japan 技術本部)。
こうした背景の下、Cohesityは、生成AIを活用するために必要なITインフラを簡単に用意できるデータ管理ソリューションを提供している。
Cohesityの創業は2013年で、2019年には日本法人のCohesity Japanを設立している。創業者は、Google File Systemの開発をリードした後、仮想化基盤の米Nutanixを創設したMohit Aron氏。直近の2024年2月には、米Veritas Technologiesのデータ保護部門を買収しており、現在ソリューションの統合を進めている。
Cohesityは、セカンダリデータを効率よく管理して様々な用途に利活用するためのソリューションを開発・販売している。このソリューションの特長としては独自に開発された分散ファイルシステムによるデータの管理と利用者のニーズに合わせてサービスを止める事なくハードウエアを拡張できるスケールアウト型のアーキテクチャである。
機能面での特長は、分散ファイルシステムによるデータ管理の機能に加えて、データのバックアップ、ファイルサービス、データセキュリティ、災害対策といったデータを処理する機能も併せ持っている点である。
2020年頃からは、データセキュリティ機能に注力している。例えば、データを暗号化してしまうランサムウエア攻撃から守るために、書き換え不能なデータセキュリティを実現する機能や、いつもと異なる不正な操作を機械学習で検知する機能などを追加している。
直近では、蓄積したデータを対話型生成AIで活用するユースケースに注力している。現在では、対話型生成AIのチャット画面に自然言語で質問を投げ、Cohesity上に蓄積したバックアップデータを検索し、コンプライアンスや効率の良い情報の取得などに活用するという使い方が可能である。このための機能が「Cohesity Gaia」である。