ITpro Special
週間WEEKLY ITpro Special ITpro

100テラバイトの社内データを有効活用 大容量でも高精度・高速な検索システム

企業内で流通・蓄積されるデータの量が爆発的に増加する今、業務や経営の効率化にデータをいかに役立てるかが問われている。そのためのデータ検索システムとして導入が広がっているのが、全文検索・情報活用システム「QuickSolution」である。独自のインデックスと強力なあいまい検索機能によって、高精度な検索を高速に実行できる純国産のソフトウエア製品だ。2015年4月には100テラバイトの大容量に対応するQuickSolution 10も登場した。

住友電工情報システム株式会社
ビジネスソリューション事業本部
第二システム開発部
QuickSolution開発グループ
アシスタントマネージャー
三島 吉就

企業内で流通・蓄積されるデータの量が爆発的に増えている。その結果、「情報発信したのにターゲットとする人に届かない」「探しているデータになかなかたどり着けない」という悩みも深刻化してきた。

「そうした“企業内ビッグデータ”を生産性向上やイノベーションに役立てるには、高精度で高速な検索システムが欠かせません」

住友電工情報システムでQuickSolutionの開発プロジェクトリーダーを務める三島吉就氏は、こう指摘する。大量の情報の中からいかに有益な情報を探し出すか――。そのスピードがビジネスの成否に大きく影響する。三島氏は「検索システムの必要性を感じている企業は非常に多い」と言う。

大容量100テラバイトに対応した検索システムが登場

住友電工情報システムが提供する「QuickSolution」は、「ピンポイントの検索」「利用者の権限を考慮した検索」「情報の整理・分類・活用」といった企業レベルの検索ニーズに応えるデータ検索システムである。対象データについてのインデックス(索引)を自動的に作成し、そのインデックスを使って検索画面やアプリケーションからの検索要求に応答する仕組みになっている。

検索対象にできるのは、ファイルサーバー、データベース、社内Webコンテンツ、グループウエアなどのデータ。三島氏はその技術的な特長を、「1台のQuickSolutionサーバーで20テラバイトの社内データを扱うことができ、アクセス権限をファイル単位でチェックしています」と説明する。

2015年4月には、待望の新版となるQuickSolution 10が登場した。「QuickSolution 10では、『大容量』『高精度』『高速』『軽量』をねらって検索エンジンとインデックスの設計を一から見直しました」と、三島氏。より多くのデータをより少ないITリソースで高速に検索できるようにしたとアピールする。

最大の変更点は、1台のQuickSolutionサーバーが扱える最大データ容量を6テラバイトから20テラバイトへと3倍以上に拡張したこと。位置考慮検索とアクセス権限チェックの速度は従来の数倍になり、インデックスなどに必要なディスク容量は7分の1へと減少した。「要求仕様が低くなったので、社内に余っているサーバーに組み込んだり、クラウドサービスの仮想マシンに載せたり、といった使い方も現実的になりました」、と三島氏は言う。

QuickSolutionの仕組み
社内外に点在する情報を横断的に検索・活用できる。さらに、権限を考慮した検索を実現
[画像のクリックで拡大表示]

検索画面は使いやすくてシンプル

QuickSolutionの検索画面(Webベースの検索クライアント)は、Windowsエクスプローラーによく似たシンプルで使いやすいデザインになっている。

ファイルサーバー内のデータをキーワードに基づいて探すには、対象とするフォルダー(複数可)を左側のフォルダーツリーで選び、画面上部のテキストボックスにキーワードを入力するだけでOK。検索の結果は、画面の右下に要約テキストとサムネイル画像で表示される。サムネイル画像にマウスを当てれば画像が拡大され、クリックすればビューアーでの確認も可能だ。

また、QuickSolutionには高度な「あいまい検索」機能も備わっているので、キーワードの表現が検索対象データと多少違っていても、目的のデータは“ピンポイント”で見つけることができる。この機能は基本的には類似検索アルゴリズムによって実現されていて、表記の揺れ、スペルミス、OCR特有の誤認識結果などを自動的に補正する仕組みだ。各種の辞書(正規化辞書・異表記辞書・シソーラスなど)と連携させることにより、正確性(誤答が少ないこと)も網羅性(もれが少ないこと)も高めることができる。

さらに高度な機能としては、位置考慮検索と近傍検索がある。

位置考慮検索とは、複数のキーワードが文書冒頭などの限られた位置に集中しているものを優先して拾い上げる方式のこと。近傍検索とは、検索対象データにおけるキーワード間の距離(文字数)と順序を指定する方式である。文書の最初に要約がまとめられている学術論文や、特許文書を検索する場合に威力を発揮することだろう。

QuickSolution検索画面
対象フォルダーを選んでキーワードを入力。結果は、要約とサムネイル付きで表示される
[画像のクリックで拡大表示]

情報活用や管理者向けの機能も豊富。業務アプリからも検索できる

このほか、QuickSolutionには情報の整理・分類・活用に役立つ機能も豊富に装備されている。

例えば、「これは有用だ」と思われるデータにタグを付けて利用者単位で「お気に入り」に登録するお気に入り/タグ付け機能。オプション装備とはなるが、検索結果の分類や分析を可能にする可視化機能もある。

QuickSolutionは、運用管理もしやすい。利用者のログイン回数と検索回数、インデックスの状態、ファイル種類別の件数と容量などは、利用状況レポートで容易に確認できる。不要ファイルリストに基づいてデータの整理やライフサイクル管理も可能だ。フルスペックモデル(拡張モデル)なら、Active DirectoryおよびLDAPと連携したアクセス権限管理もできる。また、QuickSolutionのAPIは公開されているので、業務アプリケーションに検索機能を埋め込んで活用するのも容易だ。

業種・業態を問わない1700サーバー以上の豊富な導入事例

このような優位性を背景に、QuickSolutionは様々な業種で日々の業務遂行に使われている。「2001年に販売を開始してから、すでに14年。導入実績は1700サーバーを超えており、純国産製品ならではの迅速・確実なサポートをお客様にお届けしています」と、三島氏。全社レベルの大規模な導入事例だけでなく、部門単位で利用している例も多いという。

導入先は幅広く、大手企業だけでなく中小企業や、公共、文教分野でも活用されている。業種・業態を問わず導入が広がる。例えば中国電力では、グループウエア、Webサイト、FAQデータなどを横断的に検索できる全社基盤のシステムとして、QuickSolutionを導入。検索の時間や手間を短縮し、ハード構築費用のコスト削減も実現したという。

これまでの導入においては業務効率化を実現した事例が多いが、2015年4月に登場した新バージョン10では、経営により近い貢献も見込めるという。「さらに能力が高まったQuickSolution 10を活用すれば、社内に埋没した大量の情報を拾い上げて、経営効率アップに役立てられます」と、三島氏は強調する。QuickSolution 10は、ビッグデータの前処理用プラットフォームとしても利用できる検索システムに仕上がっている。現在、あらゆる企業に求められている大容量データの有効活用に欠かせないソリューションとなる可能性を秘めている。

セミナー情報
2015年5月~6月に「QuickSolution 10発売記念セミナー」開催

●東京(第1回) 5/27(水)15:00~17:00
●東京(第2回) 6/18(木)15:00~17:00
●大阪 5/19(火)15:00~17:00
●名古屋 5/28(木)15:00~17:00
詳細はこちら ⇒ URL:http://www.sei-info.co.jp/event/seminar201505qs.html

■出展情報

第20回 ビッグデータ活用展 春
5/13(水)~5/15(金)
場所:東京ビッグサイト

お問い合わせ
  • 住友電工情報システム株式会社

    ビジネスソリューション事業本部 マーケティング室
    URL http://www.sei-info.co.jp/
    メールでのお問い合わせはこちら