新・クマックマのダラダラダイアリー

エスタディオクマックマ

おー!って思ったことをブログに書いてきます。

Tableau Public を使ってCOVID-19のデータ分析を「軽く」してみる

世界中で猛威を振るっているCOVID-19。

 

予防措置をとることはもちろん、

「現状がどうなっているのか」というのも把握しておかないと

いけないと思っています。

そこで、僭越ながらCOVID-19のデータ分析を「軽く」始めることにしました。 

 

 

1.COVID-19のデータ分析をはじめた理由

 10数年前であれば、マスコミが流した情報を鵜呑みにしていれば

とりあえずそれでよかったのですが(情報源が今ほどなかった)、

マスコミの情報は多々恣意的なところもあるので、

それらの情報に踊らされないための一種の防衛手段が必要となりました。

その防衛手段のひとつとして、「実際に自分でデータを分析してみること」を

思いついたのです。

 

2.COVID-19のデータを探してみる

幸いなことに、2020年4月時点では、自分自身で必要な情報を取得することが

できるようになっています(探すのに苦労しましたが)。

 

まず、厚生労働省のサイトでデータを探してみました。

しかし、探し方が悪いのか、初心者のわたくしには見つけることができません。。。

 

結構本気で困っているところで、以下のサイトを見つけました。

サイトを作られているのは、ジャッグジャパン様という企業でした。 

 (普段は選挙データの分析とかもされているそうです)

ダッシュボード(飛行機のコックピットみたいに、ひと目で色々な

情報がちりばめられているイメージ)には、すごくさまざまな情報が網羅されており、

「すごい!」の一言に尽きます。

gis.jag-japan.com

 

このダッシュボードだけでもすごいというのに、

自社の集計で使用されているデータを無料で提供してくださっていたのです。

これを使わない手はないので、早速お借りすることにしました。

 

データ分析は、以前少し使っていた Tableau Public で行うことにしました。

 (まともに使うのは数年ぶりですが)

 

3.作ってみたダッシュボードたち

とりあえず作ったダッシュボード(Tableau では "VIZ"ともいう)は2本。

 

久しぶりに作ったので、シンプルなものにしてみました。

 

いずれのVIZも、

「画面右側のチェックボックスにチェックを入れると、

 チェックの内容に連動して以下の2つのレポートの表示内容が変わる」

動的なものです。

※いずれのVIZも、毎日0時~1時の間に更新予定です。

 更新されてなかったら、「眠かったんだな」と生暖かい目で

 みてやってください(笑)。

 

(1) COVID-19 ステータス別・日付別年代別患者数

 (URL;https://tabsoft.co/3cMIOYt

 

これは、以下の2つの機能を持たせています。

 

1.ステータス別患者数

これは、年代別のステータス(死亡、退院)を表してみました。

 

2.日付別年代別患者数

これは、読んで字のごとく。日付別の確定患者数を年代別に表したものです。

 

f:id:sandplover_petro:20200408005402p:plain

 

 

(2) COVID-19 都道府県別患者数一覧 

 (URL;https://tabsoft.co/3eYcYKz

 

上のVIZでは、日別の患者発生数(県別、年齢別)はわかったのですが、

一覧になっていないので多少見づらいとこがあります。

 

そこで、次は表形式のVIZを作ってみました。

 

3.居住都道府県別年代別患者数一覧

これは、都道府県別年代別の患者数一覧を表してみました。

 

4.患者別データ一覧

これは、患者一覧となります。

f:id:sandplover_petro:20200408004606p:plain

 見たい日付(都道府県)の年代別患者数、および患者のデータ一覧を

確認することができるようになっています。

 

4.何が見えてくるのか

ただ作っただけでは、意味も半減すると思います。

 

2.日付別年代別患者数を見ていると、

月曜日(3/30、4/6)の新規患者数が減っているのがわかります。

以前、「これは日曜日の検査との絡み」ということを記者会見で言われていた

ことがありましたが、これを見れば納得です。

 

マスコミは「新規患者数が減少した」とか「新規患者数は横ばい」とか

人数の増減を優先するあまり、周辺事情を無視して(恣意的に)報道することが

多いように思えます。冷静な分析、というのに使えるかもしれません。

 

<2020/4/27 追記>

自粛の効果があったためか、緩やかではあるものの新規患者数は減ってきています。

「検査してない層がいるから、そりゃ増えないだろう」という意見もありそうですが、

検査は少なくとも3月末よりは多くできているのでは、と。

その状態でこの数値なので、油断はもちろんならないものの

多少なりとも減少していることは確かかと思います。

ちゃんと証明するには、別の指標が必要になることは間違いないですが。

あとは、前週、前々週の平日(または休日)という分析軸で比較しても

わかりやすいかもしれません。

 

5.本音を言うと・・・

本音を言うと、本当はもっと楽しいことでデータ分析の勉強を

していきたいのです。。。

とはいえ、正確な情報を分析する(自分なりですが)し、

大勢を掴むというのも必要になります。

(大勢を掴むというのは、仕事とかでも活かせるかもしれません)

 

しばらく、体を弱らせない程度にデータ分析とかをしていければな、と思います。

よかったら「こんな分析できないの?」とかいうコメントもいただければ

ウレシイです。

 

<2020/4/27 追記> 

最後に、最前線で体を張ってらっしゃる医療関係者の方には

本当に感謝のひとことしかありません。ありがとうございます。

 

自分らにできる数少ないことは、COVID-19に感染しないことかと

(そうすれば、病院の方に迷惑かけることないですしね)。

 

なので、「自粛疲れ」だなんていうことのないよう、

自分も知恵をひねって乗り切っていこうと思います。