~特命デベロッパー・池澤あやかのさらなる挑戦~
使用期限ナシで無料の
IBM Cloud
「データ分析」にチャレンジ!
東京都中央区のとあるオフィスビルにある「アイ・ビー開発」。特命デベロッパー・池澤あやかは、クライアントからの依頼や要望に応えるべく、奮闘している。今回持ち込まれたのは、「データ分析」という新しい課題だった。果たして彼女は解決策を見いだせるのか?
晴田的確な状況判断で多くの難案件を成功させてきた、敏腕プロジェクトマネージャー。 合川真面目さが売りの営業担当者。几帳面&丁寧な対応で多くの顧客の信頼を集める。
和田沈着冷静なデータエンジニア。社内の女性社員からは姉御的存在として慕われている。
池澤あやか
IBM Cloudを使って、クライアントの要望を実現していくエンジニア。チームメンバーと力を合わせながら、難しい案件にも果敢に挑む。一方、タレント活動も好調。最近はITスキルを生かしてデベロッパー向けのイベントに登壇することも!
もう、桜の開花時期で損はしない?!
Watson Studioで来年に向けた桜の開花を予測しよう!
出張中のプロマネから届いたメールに書かれていたのは、営業・合川が担当する新規クライアントについてだった。内容は「桜の開花予測を行いたい」。池澤あやかがひらめいた、IBM Cloudの活用法とは?
いますぐIBM CloudのWatson Studioを使ってみよう!方法と登録はこちら

AIの活用環境がまとめてそろえられる「Watson Studio」

池澤あやか

池澤あ、マネージャーお帰りなさい! 出張お疲れさまでした。

晴田ただいま。早速だけど、出張中にメールした案件について話そう。合川くん、お願いできるかな?

晴田

合川はい。準備しておきましたので、私から概要を説明します。

クライアントはフラワーダイナー。花をモチーフにしたメニューや店内装飾がファミリー層に大人気のレストランチェーンです。

桜、梅雨、真夏日、紅葉など、季節に合わせた特別メニューやイベントを企画しているんですが、今年は桜の開花が例年よりかなり早くて、特別メニューの開発が遅れてしまったそうなんです。おかげで売上にも影響が出たとか。

合川
池澤あやか

池澤確かに、今年は開花が早かったですよね。私の周りでも、お花見のタイミングを逃した人は多かったみたいです。

合川お花見シーズンは、同社にとって一年で最大の稼ぎ時の1つ。来年同じことを繰り返さないよう、「独自に桜の開花予測ができないか」という話が持ち上がったというわけです。

合川
池澤あやか

池澤そういうことでしたか。でも、ナイスタイミングです! 先日、IBM Cloudに「Watson Studio」というデータ分析サービスが追加されたんですよ。

晴田前に教えてくれたものと何か違うのか?

晴田
池澤あやか

池澤もともと提供されていた「Data Science Experience(以下、DSX)」や機械学習のモデリングに加え、画像認識などの様々なツールも統合されたので、よりデータ分析が行いやすくなったんです。

Watson Studio
「Data Science Experience」「Watson Machine Learning(モデリングツール)」「Watson Visual Recognition(画像認識)」などが統合されたデータ分析環境を提供。チームでのコラボレーションも容易になる

晴田よさそうだな! ちなみに、コストのほうは……?

晴田
池澤あやか

池澤心配無用です、マネージャー。ライト・プランに含まれているので一定のデータ量までは無料で使えます。データ量が多い場合や、より迅速にデータ分析を行いたい場合は、クレジットカードを登録するだけで従量課金型のPAYG(Pay As You Go)プランに移行できます。

いますぐIBM CloudのWatson Studioを使ってみよう!方法と登録はこちら

データの読み込みや加工、分析モデルの作成を実行するJupyter Notebook

池澤あやか

池澤また、データ分析は通常、データサイエンティスト、データエンジニア、アプリケーションエンジニアなど、役割の異なる人がチームを組んで作業します。Watson Studioでは、分析チームがコラボレートできるような様々なツールも用意されているんです。

その1つが、「Jupyter Notebook」です。Jupyter Notebookでは、分析対象のデータの読み込みや分析モデルの作成・学習、分析結果の可視化などを、コードを書いてその場で実行できます。

Jupyter Notebook
データ分析ツール。PythonやRに対応しており、セル内にコードを書き、その場で実行可能。2次元の表形式でデータを操作するPandasライブラリ、データを様々な形で可視化するBrunelライブラリ、機械学習を行うscikit-learnライブラリなどを利用できる
池澤あやか

池澤このWatson Studioを使って、高度なデータ分析の部分を和田さん、コーディングを私が担当するっていうのはどうでしょうか?

晴田頼もしいね! よし、それでいこう。

晴田
後日、ミーティングルームにて

和田では、まず簡単なデモを見てください。気象庁のサイトから、「全国53都市の気象観測所の位置情報」と「2007年〜2017年の各都市の桜の開花日」のデータを取得しました。これらのファイルをJupyter Notebookに取り込みます。

和田
池澤あやか

池澤Watson Studioでプロジェクトを立ち上げ、Notebookを作成。ファイルをドラッグ&ドロップすると、クラウド上のストレージにデータがアップロードされ、呼び出しに必要なコードが自動で挿入されます。

図1 分析対象のデータをNotebookに読み込む 図1 分析対象のデータをNotebookに読み込む

合川へえ、簡単そうですね。

合川

和田ファイル2つを観測所名で結合し、各観測所での「2017年の桜の開花日」を日本地図にプロットしたのが次の画面です。

和田
図2 2017年の桜の開花日を日本地図にプロット 図2 2017年の桜の開花日を日本地図にプロット

晴田処理のコードは何で書いているの?

晴田
池澤あやか

池澤Pythonです。データの操作や地図へのプロットには、ライブラリを使っています。

和田私はPythonを使ったことがないので池澤さんにお任せしましたが、Pythonに慣れているデータ分析担当者なら、自分でコードを書いてもいいでしょう。

和田
いますぐIBM CloudのWatson Studioを使ってみよう!方法と登録はこちら

分析モデルを作成して桜の開花予測を実行

合川

合川いよいよ開花時期の予測ですね。どんな手順で行うんですか?

池澤まず、読み込んだデータから「特徴量」を抽出します。次に、開花予測を行う「分析モデル」を作ります。この分析モデルに特徴量を入力すると、開花日予測が実行できます。

池澤あやか
和田

和田例えば、桜は「春に気温が高くなると開花する」「冬の気温が低いと早く開花する」という性質があります。そこで、「全国53都市」における「2007年〜2017年、1月1日〜6月30日」の気象データから、この性質を表す特徴量として「最高気温の7日間移動平均」「2月、3月の平均気温の累積値」「1月の平均気温の平均」を抽出することにしました。

晴田

晴田むむ……。この辺はなかなか難しそうだな。

和田

和田確かに、どのデータを特徴量として抽出するかを決めるには、ある程度のノウハウや知見が必要です。データ分析担当者の腕の見せ所といえますね。でも、IBM Cloudでは機械学習のライブラリが使えるので、様々なモデルを気軽に試すことができます。

こうして抽出した特徴量のうち、2016年までのものを「学習用」、2017年のものを「テスト用」にします。学習用を分析モデルに入力して学習させた後、テスト用を入力すると、2017年の開花日を予測できる仕組みです。

特徴量
データがどんな特徴を持つかを数値化したもの。これをどう定めるかで予測精度が大きく変わる
分析モデル
ここに特徴量を入力することで、学習データから見いだした法則性を基に、データ分析が行える
図3 実測値(3日後に開花)と開花予測日の比較 図3 実測値(3日後に開花)と開花予測日の比較

池澤実測値と開花予測の差も、地図上に表示できますよ。

池澤あやか
図4 実測値と予測値の差(日数)を日本地図にプロット 図4 実測値と予測値の差(日数)を日本地図にプロット
いますぐIBM CloudのWatson Studioを使ってみよう!方法と登録はこちら

分析、評価を繰り返し、予測精度を上げる

晴田

晴田ふむふむ。じゃあ、これをプロトタイプとしてクライアントに提案しよう。

和田

和田待ってくださいマネージャー。どのデータを使い、どのような分析を行うかによって、特徴量や分析モデルが変わるので、このままは使えません。一例としてデモに使うのが良いと思います。

合川

合川そういえば、クライアントは桜の開花予測に成功した暁には、梅やあじさい、真夏日の予測なども行いたいと言っていました。それを年間の施策立案に生かしたいと。

池澤では、実際のモデルはその辺りの情報もヒアリングした上で作成しましょう。ちなみに、お客様にはデータ分析担当者はいますか。Pythonのコードは書けるのかしら……。

池澤あやか
合川

合川担当者はいるそうです。ただ、コードが書けるかどうかまでは聞けていません。

和田

和田データ分析は「一度実行して終わり」というものではないの。特徴量や分析モデルを変えて、分析を実行、結果を評価して……というサイクルを回しながら、予測精度を上げていくことが大事よ。Watson Studioは、機械学習を無料で気軽に始められることはもちろん、本格的な活用にも対応しているから、そのメリットを引き出す上でもぜひ使いこなしてほしいわね。

晴田

晴田よし、わかった。次の打ち合わせでは、クライアントが予測したい内容に加えて、人員体制などもヒアリングした上で、うちとの役割分担を調整しよう。池澤さん、和田さん、デモの準備と確認事項のまとめをお願いできるかな。

池澤あやか
和田

池澤和田了解しました!

池澤……自分で提案しておいてなんですが、Watson Studioって、まだまだいろんなことに使えそうですね。私もデータ分析の勉強をしたくなってきました!

池澤あやか
和田

和田データ分析が役立つ領域は今後、もっと増えるはず。お互いがんばりましょうね。

データ分析という新しい扉を開いた特命デベロッパー・池澤あやか。ビジネス価値を生み出すデータ分析へのニーズはますます大きくなるだろう。IBM Cloudを活用する彼女の歩みは止まらない!

いますぐIBM CloudのWatson Studioを使ってみよう!方法と登録はこちら
PAGETOP
ステップ・バイ・ステップでオンラインによるハンズオンも開催
IBM Cloud どこでもハンズオン : Watson Studioを使って桜の開花日を予測しよう!
5月22日(火) 16:00-18:30
関連リンク
お問い合わせ
日本アイ・ビー・エム株式会社 IBM Cloud(Bluemix)に関するお問い合わせ