STAY HOME が効いてきたためか、
COVID-19の新規発症者数もだいぶ減ってきたものと思います。
東京都のCOVID-19発症者数(市区町村別)データが
110件程度漏れていたということが話題になっていました。
小池都知事が謝罪したとか責任はどうなんだとかは、正直どうでもよいのですが、
今回は市区町村別の発症者数について改めて気になりました。
東京都では、世田谷区の発症者数がダントツ多くなっています。
ショッキングなデータが大好きなマスコミ各社は、この事実を
「もともと23区内で人口が一番多いから、増えて当たり前」と煽ってみたり、
「海外出張者が多く帰ってきて(たまたま)そうなった」という口調の話を
おもしろおかしく伝えたり、とかいろいろな話が出ています。
しかし、わたくしめは「人口が多いだけ」とは思えませんでした。
「夜のお店が~」とか言っていたのに(そりゃ、世田谷区に夜のお店は
ありますけどね)、「人口が多いから感染者数も多くて当たり前だ」という
意見で半ば強引にまとめていいのか。
「そもそも、世田谷区よりもアラートを上げるべき区があったのでは」という
思いもあったので、遅きに失していますがまとめてみました。
- 1.データを結合してみる
- 2.市区町村別感染者数 https://tabsoft.co/3eYcYKz
- 3.市区町村別感染者発生率 https://tabsoft.co/2Z0kK0T
- 4.軽くまとめ
- 5.今後にむけて
1.データを結合してみる
今までのTableau Public のVIZに、23区の人口を結合させてみました。
こんな感じです(SQLやってるヒトであればなんてことのないJOIN文です)。
※移行済データというのは、感染者数がのっているExcelシートになります。
2.市区町村別感染者数 https://tabsoft.co/3eYcYKz
単純に、市区町村の人口数と感染者数でプロットしてみました。
案の定、世田谷区が「やばい!」という感じのグラフが出てきました。
十字線は、平均点を示しています。
※そりゃ、マスコミが世田谷区に喰いつくわけですね…。
グラフの右側が「人口が多い」、グラフの上側が「発症者数が多い」
ということになります。
このグラフだけでみると、世田谷区、新宿区、港区や大田区、練馬区が
危ない感じになっています。
また、江東区や杉並区も「そろそろヤバいか?!」というレンジに
位置していることがわかります。
3.市区町村別感染者発生率 https://tabsoft.co/2Z0kK0T
市区町村はそれぞれ人口の多い少ないがあるので、
「COVID-19の感染者数を割合で出してみたらよいのでは?」と思い
作ってみました。算出式は、以下になります。
・感染者発生率 = 感染者数 / 人口 x 100
画面の左上は、御蔵島村のデータが入ってしまったため
異様に目立つ場所にプロットされています。
先ほどの図で「ヤバいよ~」だった世田谷区は、
割合的にはそんなに高くないことがわかります。
割合だけでいくと、港区と新宿区のほうが世田谷区よりも
よっぽど大きいことがより明確になるかと思います。
また、先ほどはそこまで目立たなかった渋谷区と台東区も
目立つようになっています。
台東区は大きな院内感染があったので数が増加しているのはわかります。
ただ、渋谷区なんですよね。。。こんなに人数が少なくない気が
しています。。。
江東区や杉並区も楽観はできない状態なのですが、
それ以上に品川区が、、、ということも浮き彫りになりそうです。
(2.のグラフでは、品川区のほうが江東区や杉並区よりも安全そうに見えた)
4.軽くまとめ
「人口が多い = 発症者が多い」というのは短絡的なヨミであることが
なんとなくおわかりかと思います。
「何人に1人発症しているのか」というのを見ていかないと
見えるものも見えなくなってくると思います。
5.今後にむけて
東京以外の他の都道府県の人口データを集めれば、同様のことが
できると思います。
ただ、多少の難関がいます。
・区別のデータを出してくれないさいたま市
・市区町村の発症者数まとめすら出してくれない千葉県
どうやっつけるかはこれから考えます。。。
でもあれですよね、集計データを出してくれないのも地方自治体として
どうなのかとも思いますが、
それ以上に県単位で出さない(新聞社に丸投げ)ということをやっている
地方自治体は話にならないと思います。。必要だと思うのですがねぇ、
こういうデータって。
※このテーマは、別の機会に書こうと思います。