EdTechZine(エドテックジン)

学習目的・対象者別

アナリティクスを社会に実装できる「場」と「人」の拡大を目指すSASの研究支援

SAS FORUM JAPAN 2020レポート(後編)

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/01/26 07:00

 SAS Institute Japan(SAS Japan)は、11月25日にオンラインイベント「SAS FORUM JAPAN 2020」を開催した。テーマごとに設けられた8トラックのうち、「アカデミック」トラックでは、主に教育・研究領域におけるSAS(サス)の取り組みと成果が多数紹介された。SAS Japanでアカデミック・プログラム・マネージャーを務める竹村尚大氏に、各セッションで紹介された研究の概要と、SASがそれらを支援する理由について聞いた。

SAS Japan アカデミア推進室 アカデミック・プログラム・マネージャー 竹村尚大氏

SAS Japan アカデミア推進室 アカデミック・プログラム・マネージャー 竹村尚大氏

「データアナリティクスで社会課題を解決する研究」を発表する場の提供

 「データがあふれる世界をインテリジェンスに満たされる世界に変える」というSASのビジョンを実現していくにあたり、大学をはじめとする高等教育機関、および研究機関の果たす役割は大きい。特に研究の領域において、現在SASでは「社会実装を視野に入れたプラクティカルな側面を重視した研究支援に注力している」と竹村氏は言う。

 「日本のアカデミアでは、どちらかといえば基礎研究に重きが置かれており、データサイエンスのような学問領域を、そのほかの分野にどう応用すべきかといった研究や実践は、まだまだ少ない。米国ではそうした分野が日本以上に進んでおり、SAS Japanとしても、その領域を開拓する研究に対して、積極的にサポートを行っている」(竹村氏)

 今回のSAS FORUMでは、大学とSASによる共同研究の成果を発表するセッションが設けられた。いずれも、専門的な課題に対して、データアナリティクスによるアプローチを社会課題の解決へとつなげようとするものだ。

「オープンデータを用いた少子化問題の要因分析」(同志社大学大学院文化情報学研究科)

 同志社大学の研究は、日本を含む先進諸国で喫緊の社会問題となっている「少子化」に対して、データサイエンス的なアプローチで、背景にある要因を明確化しようとする試みだ。少子化問題に対しては、政府もこれまで、さまざまな数値目標の設定や、法律の新設・改定などを行っている。しかし、それらの施策が「どれだけ客観的な原因分析や費用対効果分析に基づいて立案されたのかが不明瞭」な点が問題だと研究グループは指摘する。単なるデータの基礎的な集計からは見えてこない「出生力」に影響を与えている社会的要因を、統計分析によって明らかにし、より効果的な施策の立案に生かすことが研究の目的という。

 研究では、政府のオープンデータから複数のデータを抽出。それらを元に、都道府県を合計特殊出産率(1人の女性が生涯に生む子どもの人数)が「高」「中」「低」の特長を持つ3つのクラスターに分類し、各クラスターがどのような変数(食料物価や住宅物価、光熱費といった社会要因)に強く影響を受けているかを統計的に推定した。

 分析においては、クラスター分析と回帰分析の同時推定を行う「Sparse clusterwise regression」や、複数の変数間の関係性を推定する「ベイジアンネットワーク」といったさまざまな統計分析手法が用いられているが、その際「SAS Viya(サス・バイヤ)」によるデータ処理やビジュアライズが、結果の検討や考察を容易にしたという。

「SAS Viya」によるデータ処理やビジュアライズが、分析結果の検討や考察を容易に
「SAS Viya」によるデータ処理やビジュアライズが、分析結果の検討や考察を容易に

「ディープラーニングを用いた乳房超音波画像のコンピュータ支援診断システムに関する研究」(日本たばこ産業)

 この研究は、発表者である田中大樹氏が東北大学大学院医学系研究科に在籍していた当時より、SASのバックアップを受けて取り組んできたものだという(参考:プレスリリース)。乳がんの診断においては「マンモグラフィー」が広く用いられているが、乳房組織が密な女性の場合は精度が不十分なため、エコー(超音波)検査を併用した診断が行われている。しかし、エコー画像の読影(画像を人の目で見て診断すること)は、読影者のスキルや主観に結果が左右されやすく、偽陽性率(良性腫瘤を悪性と診断する割合)も高い傾向があり、追加検査による、患者の精神的・肉体的負担が増しがちなことが課題になっているという。

 研究では、画像を高い精度で識別できるディープラーニング手法である「CNN」(Convolutional Neural Network)を用いて、エコー画像から、人間が気付きにくい腫瘤の特徴を発見できる精度の高い診断支援システムを作成することが目的となる。研究の過程では「SAS Viya」を利用し、あらかじめ用意されている画像識別の学習済みモデルなども活用しながら、モデルの構築と精度の検討を繰り返したという。

研究の過程で、SAS Viyaにあらかじめ用意されている学習済みモデルを活用
研究の過程で、SAS Viyaにあらかじめ用意されている学習済みモデルを活用

 結果的に、感度(悪性腫瘤を正しく悪性と識別する割合)が90.9%、特異度(良性腫瘤を正しく良性と識別する割合)が87.0%、AI(機械学習)の評価指標として用いられるAUC(Area Under the Curve)が0.951という、高精度の識別モデルを実現した。臨床現場への導入にあたっては、まだ解決すべき課題が残されているものの、AIによる高精度の診断支援システムにより、医師や患者の負担軽減、医療費削減につながることが期待されているという。

 これらの研究を進めるにあたり、SASではツールの提供および技術的な側面からの支援を行っている。その目的について、竹村氏は「データサイエンス、アナリティクスについての最新のテクノロジーと知見を、各専門分野の課題に適用することで、SASが活用される領域を広げると同時に、専門領域とアナリティクスの双方に明るいエキスパートを育成することを目指している」とする。


関連リンク

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 高橋 美津(タカバシ ミツ)

    PCやネットといったIT分野を中心に、ビジネスやゲーム分野でも執筆を行うフリーランスライター。Windowsユーザー。

おすすめ記事

All contents copyright © 2017 Shoeisha Co., Ltd. All rights reserved. ver.1.0