沈静化したと考えられている新型コロナ感染症(COVID-19)において、日曜日に死者数が減少したことを時系列分析により証明を試みる動画

こんにちは。
時系列分析入門へようこそ。
実例を通じて時系列分析を理解することを目的としたシリーズの動画です。
沈静化したと考えられている新型コロナ感染症(COVID-19)の
全貌を時系列分析を通じて振り返ります。
今回は、2020年2月17日から2023年5月7日までの日別の死亡者数を対象とします。
データは累計ではなく、日別であることにご注意下さい。
分析の目的は、日曜日に死亡者数が減少する傾向を明らかにすることです。
なお、分析には時系列分析パッケージITSMを利用して、高速フーリエ変換による
平滑化や、スペクトル分析、調和回帰分析(正弦波へのあてはめ)などを行います。
日別の死亡者数における変動の一定化から始め、データの定常化を促進し、
その後にARモデルを求めます。
次に、モデルのスペクトル密度のピーク時の周波数から周期性を確認し、
更に周期を特定して調和回帰分析を行います。
最終的には 周期成分から曜日別の死亡者数の特徴を明らかにし結果をまとめます。
以上が、これから行う分析の概要です。
分析には、東洋経済オンライン「新型コロナウイルス 国内感染の状況」の厚生労働省オープンデータ「死亡者数」を使用します。
累計データなので、差分して日別のデータとします。
さらに、周期性を考慮して、データ数が7の整数倍となるように、
はじめのほうの日にちのデータを除きます。
結局、分析の対象とするデータは2020年2月17日から2023年5月7日までの
1176個のデータです。
時系列分析の前処理として、データの対数変換を行います。
これにより変動の一定化が促進されます。
ただし、対象データが正の数であることが変換の条件です。
したがって、データに0の数値があるので、
全データに0.5を加えた上で対数変換を行います。
対数変換した死亡者数のグラフを表示します。
ここで、ARモデルへのあてはめを試みます。
定常化を促進するための差分を行います。
更に、平均値を差し引いて平均0の時系列にします。
これらのデータ変換したグラフを表示します。
このデータ変換した死亡者数の相関関数のグラフを表示します。
左の標本自己相関関数のグラフから、周期7の季節性が見受けられます。
また、右の標本偏自己相関関数のグラフから、AR(22)モデルが示唆されます。
AR(22)モデルを求めます。
モデルのスペクトル密度のグラフを表示します。
スペクトル密度に2つのピークが発生しており、
日別の死亡者数に周期性があることが考えられます。
改めて、対数変換した日別の死亡者数の時系列データに戻り、
調和回帰分析(正弦波へのあてはめ)を行います。
 調和回帰分析では、
対数変換した死亡者数からトレンドを取り除いたデータを用います。
トレンドは、高周波成分の除去による平滑化(FFT平滑化)により求めます。
ここでは、フーリエ成分の高周波側から90%を除去した低周波領域て平滑化します。
トレンドが求められました。
対数変換した死亡者数からトレンドを差し引いた時系列データに着目します。
この系列について、スペクトル密度のピーク時の周波数から得られる
周期に着目した調和回帰分析に取り組むことにします。
スペクトル密度のグラフを見ると、明らかに2つのピークがあることが分かります。
ピーク時の周波数が、2π/7と4π/7であることをグラフから読み取れます。
このことは、対数変換してトレンドを取り除いた死亡者数の時系列データが、
7日と7日の1/2の周期性をもつことを示しています。
トレンドを取り除いた死亡者数に対して調和回帰分析により周期成分を求めてみます。
周期7日と3.5日(7日の1/2)の2つの調和関数の和をあてはめることにより
関数化した周期成分が得られます。
したがって、周期成分とノイズからなる死亡者数のモデルが求められました。
ここで、周期成分に着目します。
周期成分は、週終りから週始めまではマイナスの値を示し、
週半ばではプラスの値を示しています。
なお、「週終わりから週始め」は土曜日から月曜日までとし、
「週半ば」は火曜日から金曜日までとしています。
実際に、曜日別の死亡者数を調べてみます。
「週終わりから週始め」の要素である左上の日曜日と月曜日、
右下の土曜日の死亡者数はマイナスの値となり、
「週半ば」の要素である火曜日から金曜日の死亡者数は
プラスの値となる傾向があることが観察されます。
この死亡者数の傾向は、先程述べた周期成分の特性と一致します。
特に日曜日の死亡者数の傾向は顕著であり、
そのデータの92%がマイナスの値となっています。
全体の分析結果をまとめます。
対数変換してトレンドを取り除いた死亡者数は、周期が7日と3.5日(7日の1/2)の
2つの正弦波の和からなる成分をもつことが分かりました。
その周期成分は、週終りから週始めまではマイナスの値を示し、
週半ばではプラスの値を示します。
また、対数変換してトレンドを取り除いた死亡者数は、
同じように、週終わりから週始めまでは
マイナスの値を示し、
週半ばはプラスの値を示す傾向があることが明らかになりました。
特に、週終わりから週始めの中で、
日曜日の死亡者数がマイナスの値となる傾向が強く現れています。
さらに、死亡者数のトレンドと日曜日の死亡者数のグラフを見れば、
トレンドに対して日曜日の死亡者数が下回っている傾向がよく分かります。
結局、導かれた結論は、次のとおりです。
適切なデータ変換と分析手法により、
日曜日に死亡者数が減少する強い傾向があることが判明しました。
これらの分析結果は、新型コロナウィルスの患者に関するものであり、
他の疾病にも適用可能性があるかどうかは今後の調査が必要です。
以上、時系列分析の実例を紹介しました。
内容をご理解いただければ幸いです。
ご視聴、ありがとうございました。

こんにちは。
時系列分析(時系列解析)の入門動画です。
新型コロナ感染症を題材としました。
今回は、日曜日に死者数(死亡者数)が減少したことを時系列分析により証明を試みるものです。
分析には、ネット上で公開されている時系列分析パッケージITSM2000を利用させていただきました。
ご視聴をよろしくおねがいします。

・データの出典
東洋経済オンライン「新型コロナウイルス 国内感染の状況」
https://toyokeizai.net/sp/visual/tko/covid19/
・時系列分析パッケージ
ITSM2000
https://extras.springer.com/?query=978-3-319-29852-8
・ナレーター
VOICEVOX:剣崎雌雄
・BGM
フリーBGM DOVA-SYNDROME
BGMer
・背景動画
Pixabay
Pexels
・参考
Introduction to Time Series and Forecasting | SpringerLink | Peter J. Brockwell , Richard A. Davis
https://link.springer.com/book/10.1007/978-3-319-29854-2
Transformation using (x + 0.5) to stabilize the variance of populations | Kohji Yamamura
https://link.springer.com/article/10.1007/s101440050026
など