医学研究におけるデータサイエンス

なぜ今データサイエンスなのか

 初めまして、代表取締役社長の永沢大樹でございます。

 今回は初めてのブログ投稿ということで医学研究におけるデータサイエンスを取り組む姿勢についてお話しできれば幸甚でございます。

 昨今、データサイエンスはマーケティングの最適化、自然言語処理、画像解析と様々な場面で利用されております。もちろん、医学においても例外ではございません。医療現場においてデータサイエンスの手法を取り入れれば、医療機関の収益向上だけでなく、患者様に対してより質の高い医療を施設に依存することなく、全国均一に受けられることが期待できます。

 しかしながら、医療界においてAI開発というとすぐに手法についての話になってしまい、本当に解決するべき課題設定を無視したまま研究開発を進めペンディングになってしまう取り組みも多く見て参りました。そこで研究の流れについて私の場合の考え方をご紹介したいと思います。

医学研究でのデータサイエンス取組む順番とは

 データサイエンスと聞くとすぐにAIと思う浮かべてしまう方も多くいるかと思いますが、まずはベーシックな医療統計が基礎でございます。このフェイズを飛ばして医学研究におけるデータサイエンスを進めることはできません。医療統計への理解が深まったときに初めて、機械学習や深層学習などの手法学習に取り組むことを最初にお勧めいたします。

 さて、実際の研究に取り組む際に多くの方が最初の落とし穴に入ってしまう多くの場合で挙げられるのは「データありきの研究」でございます。臨床的な課題抽出を飛ばして、手頃に手に入る医療・生体データをとにかく機械学習のアルゴリズムに当てはめようとしてしまう。この問題点は研究が進んだ上で発生する成果が何の課題解決になっているのか明確でなく、研究発表をしたら終わりというような安易な行動だということです。

 通常の研究活動と同様に下記のようなフローに基づいた取り組みが必要です

 上記フローの最初に課題抽出があるのが大切である。課題は臨床業務や先行研究の問題に着目することが大切である。例えば、透析中の患者様の中には透析後半に低血圧になる患者様がいらっしゃることがある。そのような場合、オンラインHDFという治療法であれば、透析前半に予定除水量の過半数以上を除去しておきたい、そのために運転条件の変更が必要になる。その際の血圧変動を予測できれば、患者様へのご負担を最低限にしながら、無理なく治療を行うことができる。低血圧状態になってしまうと透析治療が続けられないだけでなく、血圧回復のために補液することとなり、体に余分な水分が残ったまま治療を終えることになってしまいます。そうなると適正体重を保てず、心臓への負担が増加し、心不全に至る可能性もある。これがデータサイエンスによって解決できれば、喜ばしい限りである。現状、上記に対応した透析装置は存在せず、現場スタッフの日頃の患者観察や勘に頼った運転状況の変更が余儀なくされている(※私の一意見だといことをお忘れずに)。

 上記を恐らく手法調査を進めていくと血圧変動の予測手法として、状態空間モデルやリカレントニューラルネットワークなど時系列分析が有効かもしれない。

 このように最初に臨床課題があってから初めて分析手法となることを意識しなければ、臨床のための研究ではなく、データサイエンス遊びのための研究ごっこになってしまう。データサイエンスの手法を応用すれば勘や経験に頼った医療ではなく、データに基づいた意思決定ができるようになり、施設の医療レベルの底上げにもつながる。日頃から勘や経験の比重が大きい業務があれば、それこそが医学において、データサイエンスを活用する課題の1つと言えるかもしれない。

 今回はかなり専門的な記事となってしまったが、今後は純枠なビジネスデータサイエンスを含めていろいろご紹介をしていきたいと思います。

 ご参照くださいまして、ありがとうございます。

代表取締役社長

永沢 大樹