カール・フリストンの新型コロナに対する動的因果モデル
詳細- 詳細
- 作者: 松田卓也
カール・フリストン教授(Karl Friston)たちの第一論文”Dynamic Causal Modeling of COVID-19”について紹介する。42ページの大部の論文である。この論文は感染疫学のゲームチェンジャーではないかと私は思うので概要を紹介したい。
フリストンのベイズ推論によるコロナ感染理論
フリストンの手法は従来の感染疫学理論モデルであるSEIRモデルなどとは逆の行き方である。従来の手法では、SEIR方程式などにおいて感染率、潜伏期間、発症時間、人口などのパラメターと初期条件を与えて、時間発展方程式を解く。そして日日の感染者数、死者数を結果として求めて観測値と比較する。合わなければパラメターを変更する。SEIR方程式では4つの状態(S,E,I,R)を置くので4コンパートメントモデルと呼ばれる。
フリストンの手法はベイズ推論を用いて観測値からパラメターや初期条件を推定する。与える観測データは日日の検査陽性者数と死者数だけである。(与えるのは検査陽性者数であり、真の感染者数ではない。それは未知の隠れ変数であるから求めるべきものである)。計算結果として、感染率(再生産数)、潜伏期間などの隠れパラメターが求まる。さらに人口まで求まる。ここが最大の焦点と思うので、後で詳しく解説する。Stay at Homeなどの政府の政策も、外から与えるのではなく、計算結果として求まる点も興味深い。
モデルの内容
時間発展方程式は基本的にSEIRモデルを拡張したものだ。ただし単にSEIRの4コンパートメントではなく、256コンパートメントモデルである。系は4つの隠れファクターから構成され、各ファクターはさらに4つの状態からなる。4つのファクターと、4つの状態は具体的に
1) 場所: 家、外、集中治療室、死体置き場
2) 感染状況: S(未感染)、E(潜伏期)、I(感染)、R(免疫あり)
3) 症状: 未発症、発症、重態、死亡
4) 検査: 未検査、検査待ち、陽性、陰性
各人はそれぞれ4^4=256の状態のどれかにいる。各状態間の時間遷移行列を考えて、その行列要素をパラメターとする。パラメター数は基本パラメターが21個あり、その他のものも含めると150にもなる。基本パラメターは平均と分散で規定されるガウス分布を仮定する。まず事前確率として、これらのパラメターの平均と分散を与えるが、最終的には計算の結果としてこれらのパラメターの事後確率が求められる。
変分ベイズ推論
これらのパラメターを求める手法として機械学習で使われる変分ベイズ法を採用する。変分ベイズ法を理解することがこの理論の本質を理解する鍵だが、それは極めて難解である。フリストンはそれをfMRIなどの解析に応用して膨大な業績を残した。フリストンは近年、それを脳の認識理論に応用して、自由エネルギー原理と称してたくさんの論文を書いて、たくさんの追従者を出している(私もその一人だ)。しかし変分ベイズ理論が分からなくても、論文の結果は十分理解できる。要するにコロナ問題は、フリストンにとっては、彼の理論の一つの応用に過ぎない。
実際の計算
モデルは2階層になっていて、世界的レベルと各国(各都市)レベルに分かれる。多くのパラメターは世界的に共通だが、実人口とか緯度など、各国(各都市)固有のパラメターもある(これは与える)。計算する国は120ほどある。パラメター数は150ほどあるが全部が重要な訳ではない。まずどのパラメターが重要か、あるいは不必要かを決めるために、それらを組み合わせた多数のモデルを作り、その尤もらしさを計算して比較する。そして観測結果に最も近い結果を与えるモデルを選択する。私の勉強会の参加者が、実際にこの計算を最新のデータで行ったが(Matlab/Octaveコードがネットにある)。計算時間はPCで数時間である。
つぎに最適のモデルに基づき、各国の計算を行う。計算結果が出ると、各国のパラメターの比較とか、未来予測ができる。内容の詳細は論文を参照されたい。第一論文では英国を具体例にとって、3月初旬の段階での未来予測を行なっている。第二論文は6/30までのデータをもとに米国の場合の計算を行なっている。第二論文では州間移動を考えて、第二波の可能性も考慮している。また免疫が消える効果も考慮している。
免疫的ダークマターとファクターX
本論文で求められたパラメターのうち、感染性、潜伏期間、発症期間などはもっともらしい値が得られている。ただし各国の比較は興味がある。
一番、興味があるのは人口が求まることだ。その求まった人口は、コロナ感染ゲームに参加している有効人口であり実人口より少ない。たとえばロンドンでは、有効人口は実人口の5割とか2割程度である(与えるデータにより結果は異なる)。
残りの人たちは、そもそもゲームに参加していない、つまり感染しない人たちである。なぜ感染しないのかは分からない。しかし計算から言えることは、実際の観測データを説明するためには、大部分の人がなんらかの理由で感染しないことになる。これを免疫的ダークマターという(この呼び方はフリストンが命名したのではなく、ジャーナリストの命名である)。ダークマターとは宇宙に存在することはわかっているが、正体不明の物質である。
免疫的ダークマターの正体は自然免疫の強さかもしれないし、他の種類のコロナウイルスに感染したことによる交差免疫かもしれない。いわゆるファクターXである。本研究の最も興味ある点は、ファクターXが存在することを実証した点であろうと思う。
文献
第一論文:Dynamic causal modeling of COVID-19, by K.Friston et al.
第二論文:Second waves, social distancing, and the spread of COVID-19 across America, by K. Friston et al.
変分ベイズ理論:Pattern recognition and machine learning, by C. M. Bishopの10章
カール・フリストンのグループのコロナ関係の論文とソフトウエア:Dynamic Causal Modelling of COVID-19