「かつては1年かかっていたことが、30分に」新しい遺伝子医療を人工知能「IBM Watson」が支える

遺伝子医療革命の背景にある
論文とシークエンスデータの激増

2015年7月、東京大学医科学研究所(以下、東大医科研)と日本IBMは、「Watson for Genomics(WfG)」(2016年6月に「Watson Genomic Analytics」から「Watson for Genomics(WfG)」に名称を変更)を活用した新たながん研究を開始すると発表した。北米地域以外の医療研究機関としては、東大医科研がWfGの最初のユーザーとなった。

長年にわたって遺伝子医療の探究を続けてきた東大医科研が目指すのは、それぞれのがん患者に適した治療を提供する個別化医療である。同研究所教授の宮野悟氏は「私たちの目的は論文を書くことではありません。経過報告のために論文を書くことはありますが、大きな目的は研究の成果を患者さんにお返しすることです」と語る。

東京大学医科学研究所 ヒトゲノム解析センター長 教授 宮野悟氏

1人1人のがん患者に適した治療法を探るための手段の1つが、ゲノム解析である。ゲノム上のすべての遺伝情報を読みとり、解析することで原因の特定や治療方針の決定に役立てる。そのために東大医科研が選んだのが、WfGである。

この選択の背景にあるのが、遺伝子医療革命とも呼ぶべき動きである。「遺伝子によるがん研究の世界は、大きく変わりました」と宮野氏はいう。重要な変化の1つは、扱うデータ量が爆発的に増大したことである。

「1つは、膨大な量の電子データが生みだされるようになったことです。がんの分野だけで、2014年に約20万の論文が発表されました。バイオメディカル分野の論文は2000万以上に達します。こうした論文の数は倍々ゲームのような勢いで今も急増中です」(宮野氏)

がんの研究者が自分のテーマに関係しそうなすべての論文に目を通すことは事実上不可能だ。一方で、膨大なシークエンスデータが出現している。シークエンスデータとは、DNAの塩基配列を示すデータのこと。次世代シークエンサーと呼ばれる高性能のDNA解析装置が登場したことで、より大量のデータが生成されるようになった。

「世界的に有名な生命科学研究所である米Broad Instituteは、2013年に1PB(ペタバイト)のシークエンスデータを得ました。翌14年には、その量は300PBに増加。1年で2桁増です。また、14年から18年の5年間に得られるシークエンスデータ量は、2EB(エクサバイト:2EB=2000PB)を超えるとの予測があります。これまでに生命科学が遭遇したことのないデータ量です」(宮野氏)

以前は人手に頼って1年がかり。
Watson導入後は類似の調査が30分に

東大医科研における遺伝子研究の成果の1つとして、大腸ポリポーシス(ポリープが大腸に多数発生し、大腸以外の臓器にも異常を伴うことが多い。放置すると高確率で大腸がんに移行する)の原因を明らかにしたことがある。中心的な役割を担ったのは、宮野氏の同僚である古川洋一教授だ。

「このときは、ポリポーシスの全ゲノムシークエンスを行いました。原因であろうと疑われる遺伝子を順番に調べていった結果、ある遺伝子の周辺の異常がポリープの大発生をもたらしていることがわかりました。どうやって探したかというと、目で探した。パソコンの画面に表示されるシークエンスデータをじっとにらんで、怪しいものはないかと探すのです。原因の特定までに1年かかりました」(宮野氏)

このようなやり方では、遺伝子医療革命後に結果を残すことは難しい。東大医科研の研究者たちが難問を前に悩んでいたとき、目の前に現れたのがWatson Genomic Analyticsだった。

Watson Genomic Analyticsを活用した研究は、2015年7月にスタート。最初の数カ月間は、必ずしも適切な答えが返ってきたわけではない。がん患者から得たデータなどをもとに学習を繰り返す中で、WfGはスマートなものへと成長していった。

大腸がんの細胞株を用いてWatsonの能力テストを行った。これに先立って、Watson Genomic Analyticsは膨大な情報を学習していた。2000万件超の論文の要約部分、1500万件超の薬品の特許情報、世界中の研究機関から集められた100万超のがんの変異に関する情報などである。

「細胞株を用いたゲノムのシークエンスデータを用いて、Watsonによる解析テストを行った事例です。まずシークエンスのデータを解析すると、4000を超える遺伝子変異の候補が挙がってきました。遺伝子の4000カ所について、その変異が大腸がんの原因になっているかどうかを調べる必要があります。これを従来のような手作業で調べるのは不可能です。頑張ってもせいぜい100くらいでしょう。そこで、Watsonの登場です。データをWatsonに投入すると、30分かからないうちに打ち返してくれました」(宮野氏)

WfGは原因である確率が高い順に、数十にまで絞り込まれた遺伝子変異の候補を提示。「この染色体の、この遺伝子変異が疑わしいですよ」とアドバイスしたのである。こうして研究チームは原因を特定することができた。「かつては1年かかっていたことが、30分になった」と宮野氏。効果はそれだけではない。

「Watsonからは、他にも有益な情報が提供されました。たとえば、このがんについては原因となる遺伝子をターゲットとした別の薬が承認されていることがわかりました。また、治験が行われている薬の候補、他のがんについては承認されているが、このがんについては承認されていない薬の情報なども提供されます。これらの薬をレコメンドする理由を含めて、です」と宮野氏はいう。

「Watsonがなかったら、
ここにたどり着くことはできなかった」

WfGの活用事例の中に、100万人に数人が発症するといわれるがんの一種についての研究がある。このがんについて全ゲノムシークエンスを行うと、約200万の遺伝子変異の候補が挙がってきたという。

「このデータをWatsonで解析した結果、ある遺伝子が浮かび上がりました。それは他の種類のがんの原因遺伝子であり、すでに承認済みの薬があった。思いがけないことです。もしWatsonがなかったら、ここにたどり着くことはできなかったでしょう」と宮野氏は話す。

冒頭で述べたように、東大医科研は患者に対する個別化医療を目指している。いうまでもなく、診断や治療方針の決定を担うのは医師である。WfGの医療への活用は研究段階であり、提供されるレコメンドなどを参考にすることはあるものの、最終的には医師自身の知見や経験に基づいて意思決定が行われる。これをサポートするのがWfGの役割。世界中の研究機関などが発信する論文やデータから学び続けることで、WfGが提供する情報の質や精度は高まっていく。個別化医療への歩みもスピードアップするに違いない。

「たとえば、急性骨髄性白血病という血液のがんがあります。患者さんには大きく2つのタイプがあり、一方は病気の進行が非常に速く、もう一方はゆっくりと進行します。治療法はまったく異なります。医科研には診断や治療の難しい患者さんが多いのですが、同僚の医師たちは、その難しい判断を下さなければなりません」と宮野氏。しかも、厳しい時間的な制約があるという。

「血液のがんについて、医科研では20日余りの間に診断し、治療方針を決定するという決まりがあります。個別化医療を行うためには、この枠組みの中で患者のゲノムシークエンスを実施し、遺伝子変異の原因を突き止めて治療法について意思決定しなければなりません。スピードは非常に重要な要素です」(宮野氏)

このような観点でも、WfGに対する東大医科研の期待は大きい。

「昨年7月にWatsonが導入されてから、医科研の臨床シークエンス研究の現場、1人1人の医師や研究者は熱くなっています」と語る宮野氏は、個別化医療の未来を思い描いて高揚している。

関連リンク
Future Healthcare -コグニティブ・システム時代の到来- 詳細はこちら