AIや機械学習など数理科学の活用事例に触れられるNTTデータ数理システムのユーザーコンファレンスが、今年はオンライン開催となった。実施は2020年11月19日と20日の2日間。新型コロナは開催形式をリアルからネットに替えただけでなく発表内容にも影響を及ぼした。ニューノーマルを見据えた講演が相次いだのだ。
毎年11月に開催される数理システムユーザーコンファレンスは、いまや千人規模の参加者が集う注目度の高いコンファレンスだ。その理由は昨今のAIブームだけではない。NTTデータ数理システム(MSI)が35年以上にわたり統計や機械学習をはじめとした数理科学の分野でトップランナーとして走ってきたこと、そして同社が支援するユーザー企業には先進事例に取り組む企業が多いというところにその理由があるのだろう。
2020年11月にオンライン開催されたコンファレンスでは、多くのユーザー企業の意識に新型コロナがあった。Withコロナの時代からいずれAfterコロナ、そしてニューノーマルへと時代は不連続に変わっていく。それは過去の経験と勘だけでは対処できない状況が次々と目の前に出現することだともいえる。企業は新しいルールを探し出さなくてはいけないし、また制約のあるなかで活動を最適化することも必要になるだろう。
こうした課題に対してMSIの箱守聰社長は「数理科学の技術が役に立つ」と強調する。実際、今回のユーザーコンファレンスでは、数理科学によってビジネスの現場を変革する実施例や取り組みのヒントとなる発表が相次いだ。例えば、海外工場をリモートで改善した事例や、さまざまなビジネス要因と売り上げの関係性を紐解こうとする試みだ。
基調講演に登壇した博報堂DYホールディングスの道本龍氏はマーケティング・ミックス・モデル(MMM)について講演した。MMMは売り上げなどマーケティングの効果を、広告や店頭販促、季節、価格などさまざまなビジネス要因から予測するモデルのことだ。
既存のMMMは、予測はできるもののその因果関係は分からない、いわばブラックボックスが多かった。これを構造が理解できて変化を察知できるところまで進化させた。
具体的には、テレビや雑誌の広告、価格や季節といったさまざまな要因(パラメーター)と売り上げの間に消費者の心の動き(広告想起や購入意欲)などを置き、それらを関係づける構造を想定する。そしてどの経路がどれだけ影響しているのかを示せるようにしたのだ。しかも影響の大きさは時系列で評価できるので、ある時期はテレビの効果が大きかったが数カ月後にはその効果が減り、代わりに価格の影響が大きくなってきているといったことが分かる。値下げのタイミングを決めるヒントとしても活用できるのだ。
システムを開発する際に問題となったのは、適切な構造モデルをどのようにして見つけ出すかだった。週次の売り上げデータは、3年分を貯めても150データほどにしかならない。一方でパラメーターの数は多く、広告出稿量、価格、天候、競合他社の施策など、場合によっては数百から数千にも及ぶ。このため妥当な売り上げ予測をするモデルは何種類も作れてしまう。そのなかからいかに肌感に合う、信頼できるモデルを見つけ出すかということが課題だった。
道本氏はこの課題をMSIに相談した。MSIには時系列解析やモデリング、パラメーター推定などに詳しい技術者がいる。しかも、最新の論文を読み込んで、それを今回の課題に対応させると「こうなるのではないか」といった、さらに先を行く提案もしてくれたという。
道本氏たちの研究の成果は、新たなMMMサービスとして結実した。アイズファクトリー、博報堂DYメディアパートナーと共同で開発した「m-Quad」(構造型動的時系列解析)である。
売り上げにつながる経路が時代の変化とともに影響力を変えたとしても、その変化を正しく把握できていれば新たな対策を立てることができる。もしも構造モデル自体が変質するほどの大きな時代変化が起きているのであれば、早急に新たな構造モデルを見つけ出しておくとよい。それを分析すれば、他社に先んじて効果的なマーケティング施策を打てるようになるからだ。
スペシャルセッションには日本水産の畑中弘紀氏が登壇し、熟練作業者の経験と勘を数理モデルに落とし込む事例を紹介した。
食品製造/加工の現場には単純な機械化では省人化できない作業が残されている。これらは熟練作業者の経験や勘に頼っているのだが、作業者の高齢化・引退は待ってはくれない。このままでは将来、技術の伝承が途絶えかねないのだ。
そこで熟練作業者の技術を数理モデルに落とし込む取り組みを始めたのだが、熟練作業者の技術には言語化が難しいケースが多い。例えば練り物となる前のペースト状の原料に指を差し入れて状態の良し悪しを判断していたとする。それは温度を見ているのか、粘度を確認しているのか、複数の条件を同時に見ているのであればそれぞれがどう絡み合っていればよいのか。なかなか言葉として引き出しづらい。
1回でモデル化できることはまずなく、何度もヒアリングとモデル化、データ収集とデータ解析、そして検証と修正を繰り返すことになる。このためデータ解析は素早く行いたい。その対策として畑中氏はMSIのVMS(Visual Mining Studio)を使うことにした。VMSは分析・モデリング機能が豊富であることに加えて、直感的なビジュアルプログラミング環境があることから、Pythonでコードを書くのに比べてはるかに効率的に業務が進められたという。
今後は試行錯誤して得られた学習モデルと現場システムの連携を図りたいという。当面はリアルタイム性の低い現場に対してバッチ処理的に行うことになる。現在、MSIが提供しているVMSのプラットフォームでは現場システムに学習済みモデルをオンラインで組み込むことができないという制約も関係している。ただし、近々発表される次期プラットフォームではこれができるようになるという。畑中氏は「早く使ってみたい」と期待を口にしていた。
AGCは、プラントの生産能力を検証するシミュレーションについて講演した。同社のとある海外拠点では需要が増えたため増産が必要になり、日本から関係者を渡航させて改善活動を行う予定だった。だが、新型コロナの影響で現地に行けなくなってしまった。そこで、日本国内からリモートで対象設備の情報を入手し、設備の能力を評価するところから始めることにした。
プラントのなかにボトルネックと思われる設備があり、当初はその増設を検討していた。だがMSIの汎用シミュレーションシステム、S4 Simulation Systemを使って評価したところ、当該設備を増設しても全体の生産能力は期待通りには向上しないことが分かった。一方で、想定とは違う場所に問題があることが同システムで明らかになった。
そこで、新たに見つけた問題を先に解決し、その後に設備を増設するという具合に、取り組む順序を替えてみたらどうなるかシミュレーションしてみた。すると、新たに見つけた問題を解決するだけでも当面の需要増に対応できるという数字が得られた。日本から関係者を渡航させることなく、しかも当初予定していた投資を先送りできたのである。
現場作業に制約が残るニューノーマル時代には、シミュレーション技術が担う役割が大きくなりそうだ。
日本経済新聞社の安井雄一郎氏は、新聞記事データを活用する取り組みについて発表した。
日本経済新聞社は以前より新聞記事データを分析用として販売しており、2020年9月30日にはAWS MarketplaceおよびAWS Data Exchangeでもサンプルデータの提供を開始している。今回の発表ではまずこの記事データを使った実験を紹介した。具体的にはMSIのテキストマイニングツール、Text Mining Studio(TMS)を使い、2020年1月から6月までの日本経済新聞朝刊一面の記事を分析した。例えば、頻度の高い主語-述語の組み合わせを抽出したところ、「時間-かかる」という係り受けの頻度が最も多く、時系列で見ると4月にピークがあることが分かった。おそらく新型コロナに対する対策についての記事であろうと推測できる。
さらに安井氏は、記事をグラフ構造で表して蓄積することで多彩なサービスを提供できるデータベースを目指す取り組みについて述べた。記事データをベースにしたサービスを検討するときに、サービスによってさまざまな自然言語処理を行う必要がある。その処理はサービスによりまちまちで定型化しづらいのだが、分かち書きのような前処理や初期に行ういくつかの自然言語処理は定型化できる。そこでこれらを済ませたものをデータベースにして蓄積しておく。追加の処理が必要な場合もここから始めれば効率的だ。
今回、採用したグラフ構造は、記事-パラグラフ(段落)-文章-単語といった階層をノード(節点)とエッジ(枝)で表現したもの。この形式のデータベースは、つながりをたどる検索が高速にできるメリットがある。例えばAという単語を含むパラグラフのうち、Bという単語も入っているパラグラフを検出するといったことが高速にできる。
実験例として、ある単語が「新型コロナウイルス」とともに同じパラグラフに出現した頻度を時系列で調べた結果を示した。対象は2020年1月から8月の日本経済新聞朝刊。組織を表す単語では「政府」や「厚生労働省」の出現頻度が4月にピークを迎えた。役職では「首相」が3月にピークを迎え、その後4月、5月と下がる。これに対して逆に4月、5月と上昇した単語が「社長」。ピークとなった5月には「首相」の倍近い頻度で出現していた。5月になって社長が新型コロナウイルスに関係したなんらかの発言をした、あるいは判断に迫られたといった状況が推測できる。生活関連の企業では5月に「任天堂」の頻度が突出した。
安井氏はこのデータベースの技術を使い、日経のメディアや情報サービスの価値を高めたいと考えている。例えば日経電子版をさらに使いやすくするためのバックエンドであったり、「日経バリューサーチ」企業情報データベースサービスや「日経テレコン」記事検索サービスの質を向上させる使い方だ。「未来を読む人のそばに」は、情報を縦横に検索できる使いやすいツールが要る。その準備を進めているということだろう。
〒160-0016
東京都新宿区信濃町35 信濃町煉瓦館1階
TEL.03-3358-6681 FAX.03-3358-1727
Email.sales@msi.co.jp