三田評論ONLINE

【Researcher's Eye】
ビッグデータの射程距離

2021/05/28

  • 片岡 圭亮(かたおか けいすけ)

    慶應義塾大学医学部内科学教室(血液)教授
    専門分野/血液内科学、がん遺伝学

近年、医学・医療におけるデータ量は、急激に増加している。医学でビッグデータという言葉が初めて登場したのは、2008年『Nature』誌の特集「ペタバイト時代の科学」であろう。とくに、ゲノム医学においては、次世代シーケンサーの普及もあり、年間エクサバイトを超える量のデータが生成されており、従来ビッグデータを扱ってきた天文学、TwitterやYouTubeにおけるデータ量をもはるかに凌駕している。

私は、現在、慶應義塾大学で血液内科診療に携わりながら、国立がん研究センター研究所にも所属し、血液がんを中心としたがんの遺伝子解析研究に取り組んでいる。ゲノム医学において、次世代シーケンサーの恩恵を最も受けたのは「がん」であり、多くの大規模研究により、がんのドライバーになるさまざまな遺伝子異常や、それらが集積する分子経路が同定されてきた。さらに、それらの異常をターゲットとする薬剤(分子標的薬)が短期間で開発され、実際に患者予後の改善に繋がっている事例も散見される。

このように医学・医療ビッグデータ解析の恩恵を社会が享受できる時代になった一方で、機械学習・深層学習を中心とする第3次AIブームも過ぎ去ろうとする中、その限界も明らかとなっている。基本的には、ビッグデータ解析は後ろ向きの観察研究であり、さまざまなバイアスの影響を受けやすい。さらに、個々のデータの質は玉石混交であり、その取捨選択が重要である。

実際の解析では、頻度や相関関係の分析が中心となり、因果関係に関して確定的に言及可能な状況は多くない。そのため、従来の臨床試験による介入研究や、疾患のメカニズム研究等の重要性は現在も変わっておらず、ビッグデータ解析とは相補的に機能するものである。

本邦では、長い間、医学・医療分野においてもビッグデータ解析をはじめとした情報科学の重要性が叫ばれているが、その本質の理解は十分ではない。現在、全ゲノム解析等実行計画等、大規模な国家プロジェクトが進行しているが、これらのビッグデータの利活用を促進し、その効能を最大化するためには、ビッグデータの可能性と限界、すなわち、その射程距離を共有することが肝要である。

※所属・職名等は本誌発刊当時のものです。

  • 1
カテゴリ
三田評論のコーナー

本誌を購入する

関連コンテンツ

最新記事