広島大学学術院 准教授 (大学院先進理工系科学研究科) 伊森晋平 先生

No.26 統計解析の手法に関する研究を続けて―数理統計学を用いたモデル選択・予測―

取材日:2020年1月6日

 
広島大学学術院 准教授
(大学院先進理工系科学研究科)

伊森晋平 先生


 
専門分野:数理統計学
経歴:
2014年 08月~2018年 01月 大阪大学基礎工学研究科助教
2017年 05月~2018年 01月 理化学研究所革新知能統合研究センター客員研究員
2018年 01月~2020年 03月 広島大学学術院 助教 (大学院理学研究科)
2018年 04月~現在 理化学研究所革新知能統合研究センター客員研究員
2020年 04月〜現在 広島大学学術院 准教授 (大学院先進理工系科学研究科)

◯ 数理統計学とは

私は「数理統計学」という分野を専門としています。「統計学」は多くの分野でデータ解析の手法として用いられており、データからモデルを構築し、事象のメカニズムを明らかにしようとする学問です。さらに「数理」がつくと、数学的な観点から明らかにするという要素が入ります。すなわち、統計学の中で用いられる解析手法の数学的な性質、理論や定理の導出・解析を行っています。「数理統計学」の一例として、私がこれまでしてきた研究の中で、モデル選択についてご紹介いたします。モデル選択とは、複数の候補モデルから「良いモデル」を選択することが目的の分野であり、どのような基準でそのモデルを選んだかを数学的に示すことができます。

では、具体例を挙げます。人の身長と体重のデータセットが図1のように得られているとします。これを表すモデルとして赤・青・緑の線を考えましょう。モデルというのはあくまで仮説ですので、様々なモデルが考えられます。誤差の無いモデルという視点に立つと、すべての点を通った緑線のモデルが最も誤差の小さいモデルであると言えます。しかし、身長と体重の関係がこのような曲線で与えられるとは考えにくく、新たにほかのデータ点がプロットされたときの誤差がとても大きくなりそうです。それを考慮すると、おそらく青線のモデルが良いモデルであるように思えます。つまり、モデル選択における基準として様々なものが考えられ、誤差はそのひとつでしかなく、必ずしもその基準で「良いモデル」が得られるとは限りません。モデルの良さの基準は研究、解析の目的に依存して異なります。さまざまな目的に応じて複数の候補モデルから「良いモデル」を見つけるのが「モデル選択」という分野の目的です。

◯ あらゆる分野への応用

私の研究は、統計学の手法に関する数学的側面からのアプローチであり、具体的に特定のデータに対する適用例はほとんどありません。しかし、統計学はデータを取り扱う学問であるため、物理・化学・生物などさまざまな領域との親和性があり、データを扱う分野でさえあれば、あらゆる研究に応用できます。
その例として、がん罹患数に関する統計的な解析が挙げられます。がんにかかった人の数は毎年、調査・集計されています。しかし、死亡してはじめてわかる罹患数(裏に隠された罹患数)を考慮すると、報告された罹患数と真の罹患数には差異がある可能性があります。そこで「裏に隠された罹患数」も考慮した解析を行い、モデルを構築することで、より正確な罹患数の予測を試みることができます。

◯ 今後取り組むべき問題―新たなデータ構造

今後は、従来の解析手法では解くことのできない問題に取り組んでいきたいと思います。そのうちの一つとして、高次元データに関する問題を考えています。具体的に、データ構造(図2)の話をします。古典的な統計学の問題設定は、100人に対して2項目(例えば、身長・体重)のデータがある、縦長のデータ構造(図2左)が主流でした。そのようなデータ構造に対して、ここ最近は100人に対して10000項目以上のたくさんの項目についてデータがとられるような横長のデータ構造(高次元データ;図2右)の研究が盛んに行われています。横長のデータを解析する上では、縦長と同じ解析手法を用いることは不可能であったり、妥当性が保証されなかったりします。さらに昨今では、ビッグデータと呼ばれる縦横に大きいデータセットが注目されています。
上記のデータ構造の解析のために、これまでの視点とは異なる新たな解析手法が提唱されてきました。高次元データにおいては、そもそもすべての変数が意味をもつとは限らないため、その中から重要な意味のある変数を取り出すという「変数選択」という分野が盛んに研究されています(これは先述のモデル選択の一種です)。また、この場合は計算量の問題も生じ得ることから、解析の条件に制約を加えるなどの方法が考えられています。
また、最近の私の研究では、補助変数を用いた解析を行いました。注目している変数だけでなく、別の変数(補助変数)を解析に加えることで、新たな情報を得ようとする解析手法です。
これから先、さらに新しい未知のデータ構造が現れ、従来の解析手法が通用しないことがあるかもしれません。そのような問題を解決できるような解析手法を考えたいと思っています。

◯ 研究者を志したきっかけ

高校生のときから好きな科目は数学でした。しかし、現在専攻している「数理統計学」について、また、数学がどのように細かい分野に分類されるか、知る機会はありませんでした。学部3年生のときに、「確率・統計」の授業で初めて「数理統計学」を知りました。そのころの私は勉強を全くしておらず、あまり真面目な学生ではなかったと思います。ですが、「確率・統計」の授業はよく理解できました。それが理由で、研究室配属のときにはその分野を勉強できる研究室を選びました。
学部4年生のときは就職しようと思って就活をしていました。しかし6月までによい結果が出なかったので、それからは院試勉強に切り替えました。院試勉強で数学を改めて勉強してみて、大学の講義での内容がよりよく分かってきました。分かってくるとどんどん楽しくなり、数学を仕事にしたいと考え始めました。好きなものを仕事にするのは大事なことだと思っています。そして、修士のときに取り組んだ研究テーマが「モデル選択」でした。修士、博士と研究に取り組んだ成果をよい形にすることができ、今でも研究を続けられているのは、とても幸せなことだと感じています。

◯ 広島大学の外でのキャリア、その経験から感じたこと

博士号を取得する前に助教として採用され、大阪大学の研究室に赴任しました。また、理化学研究所の数理統計学チームでも客員研究員として研究しています。海外の大学との共同研究の機会も与えていただき、主に研究内容についてディスカッションを行いました。その中で、実際に会ってディスカッションをすることの大切さを実感しました。より短時間で言いたいことが伝わりますし、目を見て話すことで機微を感じられるというのが利点です。そのことは日本人同士のディスカッションでも大事だと思います。
海外での生活は苦労しましたが、英語が下手な私の話をゆっくりと聞いてくれたりご飯に連れて行ってくれたり、周りの人のやさしさに助けられました。そのような経験のおかげで、英語でディスカッションを行う上でハードルが下がったと感じています。
その後、広島大学のテニュアトラック教員に採用して頂き、研究をしています。広島大学では、よい環境で思い切って研究でき、充実した研究生活を過ごせています。

学会発表時の様子

◯ 研究を進める際の心がけ

こつこつ頑張るということを、いつも心がけています。私は要領が悪いと思っています。しかし、気になったことから一つ一つつぶしていくということを意識して、丁寧な研究を目指しています。そのために、常に研究のことについて考えるようにしています。私の経験では、研究のアイデアは移動中に思いつくことが多々あり、出先で思いついたことについて計算してみることもあります。そのことは、大学院生のときから習慣になっています。
また、これから研究者を目指す学生に知っていてほしいのは、頑張っていれば誰かがみてくれているということです。私も以前、他大学の先生から、研究集会で発表しないかと声をかけていただいた経験があります。おそらく、学会発表などを通して私の研究分野を認識してくださっていたのだと思います。そのようなことを心の支えに、また研究を頑張ることができます。

◯ 学生へのメッセージ

私は決して優秀ではなく、周囲の人たちに支えられてなんとか今日まで研究を続けてくることができました。先に述べたように、頑張っていればどこかで誰かがみていてくれるので、前向きに研究を続けていくことが肝要だろうと思います。学生時代は雑務もなくひたすら勉強や研究をすることができていたのですが、年齢を重ね、立場や環境が変わり、最近は以前のように集中できる時間が短くなっていると実感しています。学生時代に学んだことは大切な財産になるので、自身の研究分野に囚われず、様々なことに興味を持ち、たくさん学ぶことを心がけると良いのではないでしょうか。その中で、他大学や海外の人たちとコンタクトをとり、情報交換することもとても役立つと思います。
研究は気をつけないと止まることがなく、生活リズムや体調が崩れがちです。体は資本ですから、しっかりと休憩をとりつつ、フレッシュな頭脳でいい研究をしてください。

取材風景

◯ 取材を終えて

数学は全ての理系科目の基礎となり、「あらゆることに応用できる」普遍的な学問であると改めて認識しました。また、取材時は僕が質問したことや理解が及んでいないことに対して、先生が数式を書いて簡潔に説明していただき、そこに数学の魅力を感じることができました。
先生は院試勉強の際に、数学が好きだという理由で研究者への道を決められ、今では助教としてご活躍されています。研究について常に考え続けられており、本当に数学が好きだという気持ちが感じられました。その好きだという気持ちが進路を考える上では当たり前のことですが、最も重要なことです。僕自身も研究や自分の専門が本当に好きなのか改めて考えたいと思いました。

取材担当:福原大輝(広島大学 理学研究科 博士課程前期2年)